有多少东西,它们不同在哪。
这几个概念自身的结构和其服务的功能是不同的:
- 编码阶段
- 目的
- 目的决定了要表达的意思
- 目的决定了要表达的意思,意思进一步决定了表达的文字的复杂结构
- 目的决定了要表达的意思,意思进一步决定了表达的文字的复杂结构,复杂结构再平铺到一维文字流的结构。
- 以上的编码阶段是按时序列出的,如果按逆序(也可称依赖关系)则是文字的一维结构,文字的树形结构,树形结构的义,义的目的。
- 本文由最早的一维日记散发流,重新整理成半结构化(树形结构+一维流)的文字,已经不是简单的文章的一维文字流了。
- 重新整理是为了去掉原先的打草的各种尝试,而留下核心的内容。
- 解码阶段:也是编码的逆序,与依赖关系不同的是,目的并非是编码阶段的有无必要的判断,而是解码阶段的逆序,即逆序的序是另一个方向的序。
- 要明确解码是消耗资源的,既然有成本,那么目的的回报是什么呢?
- 所以要先评估回报,再进行下一步。
- 当过去的自身所识别的回报不足以进步时,要时刻分析新信息来挖掘新价值和新目标,此时是遍历,跟上一步顺序相反。
- 不管上一步的方向如何,关于分析文本有些共通的流程
- 要明确解码是消耗资源的,既然有成本,那么目的的回报是什么呢?
通用的手段: 结构化阅读
- 从一维的文字流(可能些许含有二维平面的结构如标题的置中、段落的缩进等),还原出其本来的结构。结构一般为树形,若复杂交叉引用的,再另作处理。若为树形,而人处理文字时又只能是线形处理(如有多核并行的处理办法请大神教教我),所以这条线落在树形文字的哪些结点上就有很大的不同。
e.g. 朗文语法中的一句: Mary Smith, who is in the corner, wants to meet you.
- 线性阅读:因为文字本身就是一维的,跟默认的人的解码正好是一个线性模型,所以最简单的就是从前读到后:线性阅读。优点是不漏内容; 缺点是成本高、无法略过不需要的内容。
- 标点视觉结构阅读:一维的文字流还原成二维的树形(但又落到人自身的一维处理时)
- Mary Smith, who is 跳,wants to
- 阅读顺序如上,通过简单的标点的视觉分隔作为跳跃忽略的阅读点。这样从最抽象的树形结构的高层开始进行内容的分类和选择。
- 类似的如本文的标题、本文的作者、内容的123分条,都是不同规模内容的是否可以跳跃不读的判定点。
- 类似论文的标题、作者、期刊平台、影响因子、时间等,都可以作为跳读点。
- 语法结构
- 其实标点是语法的一部分,只不过标点更加直观,所以单独上面成了一个点。
- 深入语法之后,可以从最可能、最小成本的结构标记点,来寻找自身所需的内容。
- 如问题是 What does Mary Trump want to do? 那么看到Mary Smith 这句后,其中又没有Trump 作宾语,前后也没有代词指代Trump,那这整句都不用阅读了(更应该的是先找到Trump才进一步分析,而不是上来就思考排除这么多,考虑更多情况的排除会更准确,但是顺序应该往后放,这个顺序的先后涉及不同的概率和收益,所以要考虑好什么时候做)。
- 如问题是 What does Mary Smith want to do? 那么看到 who is 跳 corner,知道这个 is(具有…什么信息跟想做什么无关而是空间信息,这个也应该跳过),然后是直接定位到 wants to.
- 又因为一义对应多文,一文也对应多义。所以可能要转换成统一的一个意思进行理解,即结构的解码
- 以上的方法仅为片面总结(这句如果有时间重新整理本文,理应放在文章最前),所以大量练习可能线性也会超过投投机取巧的有意识的跳读,因为两者是不同的改进机制:
- 无意识的能力不可有意识的估量,大量的训练的增进是意识不到的
- 有意识的进行,是生疏和费力的。
- 以上两者如何结合,度在哪里,和其他休息、目标选择、水平保持度保持时间的评估等是一个系统工程,是直接用,还是验证多少为真才用别人的方法,都很模糊。