人们是如何读懂一个正常语句的?

-

听很多老师说,阅读不要一个个字看过去。
于是我想到一个问题:既然不需要一个个字看过去,那么我们如何读懂这个句子的?
是否我们在阅读一个句子的时候,其实我们只理解句子中的关键词,而关键词直接的逻辑关系是我们在头脑中根据经验构建起来的?
比如对于一个句子『我吃了苹果』,看到这个句子的时候,大脑是否只是理解了『我』、『苹果』这两个名词,以及『吃』这个动词,然后在根据经验,构建起了『我吃了苹果』文字背后的意义?
这是『表层结构』到『深层结构』的转换吗?我对语言学不是很了解……
另外,根据人类大脑对句子的认知方式,是否存在一种最佳的阅读方法?

认知科学 认知 认知心理学 认知心理

心理学家认为眼球运动是视觉过程的直接反应,并且反映了多种人类认知活动,受到多种认知因素的影响,如眼球的运动与注意、预期、记忆、推理、阅读等认知活动都有密切的关系人们试图通过研究眼动中注视点的顺序和眼跳动来了解阅读背后的知觉过程。

通过对自然阅读的状态下记录个体的眼球运动发现,在阅读中眼睛不是平滑、连续地运动,而表现出几种运动方式,即眼球振颤、眼跳、回扫、和注视。

读一篇文章,眼睛通常先在某个地方注视一段时间,然后做一个很快的眼跳,这样眼睛便移到了下一个注视位置;每当读完一行,眼睛便进行一次大幅度的换行;有时眼睛还会重新回到原来读过的地方——回扫。眼睛注视时间一般在200-400 毫秒之间,眼跳时间一般很短只有10―40 毫秒。研究发现,在眼跳的时候,眼睛几乎不能获取信息,主要的认知加工就在注视时进行的。Rayner 等发现,当文章的难度加大时,认知加工过程变得复杂和困难,眼跳的距离一般变短,被略过的词数减少,而回扫的次数明显增加,平均注视时间变长。

下面这张图是一个从眼动数据记录样例, 用来说明阅读过程中眼动的情况。


( 1) ~ ( 12) 的序号代表了注视的先后顺序,其上面和下面所标的数字( 单位: ms) 分别代表了不同的注视时间, 如第一个注视点落在“他们”上, 注视时间300ms。中间的连线代表眼跳的过程及方向。从图1 中还可以看出, 眼球除了向右的运动, 还有向左的运动, 这种眼睛在同一行内从右向左的运动称为回视( regression) , 图1 中从( 6) 到( 7) 的运动就是回视。阅读的眼动分析通常可分为对字的分析, 即以单个的字作为分析单位( 如对“留”的注视情况的分析) , 以及对区域的分析, 即以单个区域作为分析单位( 如对“催贷款”的注视情况的分析)。

通过对字的分析我们可以发现阅读中有的字得到了单一注视( 图1 中的( 1) 和( 2) ) , 有的字受到多次注视( 图1 中的“房”得到了两次注视) , 而有的字却被跳过( 如图1 中的“了”) 。这个注视时间和注视次数受到词的加工难度的影响,比如,如果是一个熟悉的词就会比不熟悉的词的注视时间短,并且注视次数也会少。

从图1中我们也可以发现有的字会被跳读,如“的”字被跳读,关于被跳读的字的加工时间备受争议,有研究认为当某个字被跳读时, 可能读者在这个字的前一次注视中已经对这个字进行了加工。

关于为什么会出现回视,如图1中的注视点( 7)就属于对“催贷款”的回视。一般认为一般认为回视发生的原因有几种, 一是对所读内容的理解产生困难、出现错误、阅读时漏掉了重要内容; 二是句子中有“前后照应”这种语法现象时也容易出现回视; 此外在阅读歧义句时也出现回视。

所以我们在阅读过程并不是一个字一个字的读过去,尤其是对于熟悉的材料,知觉广度就是用来表示阅读者在阅读过程中每次注视能获得有用信息的范围,即阅读者一眼能看多少。比如研究发现,英文阅读时读者从当前注视点得到信息的范围是从注视点左边3―4 个字母到注视点右边大约15 个字母的位置之间识别单词的信息局限在注视点右边5―7 个字母的范围中,所以这个范围被称作识别范围。汉语阅读者可能约为注视点左侧一个或两个汉字到右侧三个或四个汉字的空间。这个知觉广度可以经过训练来提高的。

文本材料和个体的知识经验、认知方式等都会影响阅读策略的,在阅读熟悉的材料时,我们注视次数和回视次数会变少、眼跳次数增加,这时我们的注视点会更多的在关键词上。从而也阅读速度也会快。这个大家可以参照自己在做四六级快速阅读时的过程。


知识和精力有限,就写到这了,仅供大家参考啦。


参考文献

当前阅读研究中眼动指标述评

眼动技术在阅读研究中的应用

这个问题让我回想起一个认知心理学里面的实验,具体的操作不太记得了,观察到的结果是这样的:
在某一类特别的情况下,当受试者被同时展示一些彩色的图案(如:红色的圈、黄色的三角形和蓝色的方形)的时候,他们有可能会将颜色和形状打乱重组之后汇报。即,他们可能会汇报:我看到了红色的三角形、蓝色的圈和黄色的方形。

当然,这个实验是有很多条件的,貌似是要求受试者同时有一个别的负担任务,还是啥的,并且放图片的时间也必须要小于某个阈值(100ms?150ms?200ms?),记不太清楚了,书也不在手边。但是这个实验的结果说明了如下结论:人们在认知的时候,会将经验对象的不同属性层面拆开来认知,然后再整合起来。我们在认知一个 red circle 的时候,将它的 redness 和 roundness 分别感知,然后再进一步拼接在一起,虽然在一般情况下我们几乎不会出错,但是当认知负担增加的时候,我们就有可能在拼接的环节出错,将错误的属性拼接在一起。(当然,根据实验本身,这里实际上并不能排除这样的可能性:我们虽然认知对了,但是记错了。不过考虑到短时记忆的持续时间,或许是这种可能性并不大因此被排除了?)

语言自然不是图案,并且,语言之间的拼接和图案之间的拼接也是不同的。但是要说难度的话,我们会觉得语言比图案更容易拼接。毕竟「红色的圆+蓝色的方」和「蓝色的圆+红色的方」都是有意义并且有可能的,但是在「我吃饭」、「吃我饭」、「饭吃我」这些组合中,直觉上只有一种是可能的,其他都是不可能的。

也就是说,人类理解一段话的过程,至少,理解简单词句和简单语句的过程可以认为是拼接式的:我们将零散的词同时放入脑中,然后直接根据语义的限定组成一句话。但是这里的语义限定并不是一种规范性的限定,而是一种经验上的习惯,或者说,是一种启发式的(heuristic)过程。人们受到不同的东西洗脑之后,很容易将某些奇怪的东西识别为一个词,比如说:

今天天津风很大。
对于正常人来说,是「今天」、「天津」、「风」、「很大」,哦,是说天津这座城市今天的风儿特别喧嚣的意思。
对于我来说,是「今天」、「天津风」、「很大」,天津风明明是平乳啊?!哪里很大了?(参:舰队Collection:天津风)啊,原来不是这样断句的啊,好吧。

另一个例子是在读某些伊斯兰教相关的书记时,会看到某些译者将「《古兰经》」写作「可兰经」,这就使得我经常在断词的时候首先将句首的「可兰经」中的「可」作为 but 理解,发现「兰经」作为主语不对之后再纠正。

断词这种工作很显然就是一种和启发式过程非常密切的东西。我们首先有一套启发式的断词的系统,然后通过这个系统,我们能够识别出一个个的词语。正是因为我们能够断词,这才使得一句话既不是作为一个整体一团地出现在我们面前,也不是以一个一个偏旁或者一个一个字母的形式呈现在我们面前。或许英文和中文都不是特别明显(其实中文也是很坑的了,毕竟没有空格),德语中写成超级长单词的句子就特别需要断词能力了。

实际中的断词并不仅仅是在词的层面,也包括了确定语法中的成分,比如说,我们会把 the number of these apples 视作一个整体,而或许这个成分还会出现在某个 that 从句中,进而我们再把整个 that 从句看成一个整体……不过这个过程太复杂,还是从简单句说起。


又是某个认知心理学中的结论:人们有能力从大量陌生语言的简单句中提取出词汇的能力。也就是说,除了父母在教小孩的时候用手指一个物体,同时说出这个物体的名字这种最基本的教词汇的方法之外,小孩或许还能通过大量的日常对话分辨出哪些语音是一个词。当然,分辨出词之后,再根据场景,就有可能识别出具体词是和哪些场景相关的。至于具体的使用和词语的意义,大概也就是这样习得的吧。不过对于代词(比如「你」),或许学习的过程要更为艰难一些吧。毕竟简单的名词和形容词的使用场景都是直观且确定的,但是比较抽象的代词由于能在几乎所有情况下使用,这就使得其意义难以确定吧。

回到对于语句的理解上。可以认为,简单句的理解就是通过简单的方式理解的。主谓宾组合在一起,基本上只要谓词稍微特殊一点,就可以确定主语和宾语到底谁是谁了。另一方面,如果组合的时候和色彩一样,有多种可能性,那么有可能在快速阅读的时候,如果受试者同时有别的认知负担,就会有出错的风险。比如说,如果用词语闪现的方式放出 John loves Jack(即屏幕是首先依次闪过分别写着这三个单词的 slide)。当词速达到 300 或者 400 每分的时候,受试者中或许可能会有一部分人汇报出「Jack loves John」这样的结果。并且我猜测,如果之前给受试者阅读一系列故事,其中某个的内容中包括了「Jack loves John」的话,那么受试者有更大的可能性汇报「Jack loves John」。

认知不仅仅有从下而上的过程,也有从上而下的过程。所谓的从下而上,就是受到一些光学刺激,然后通过将同类型的刺激组织在一起,得到色块,而后再通过组织色块,从中分辨出什么是什么,最终确定图像所描绘的关系。从上而下则是说,我们在看东西的时候,有一定的预设在其中,我们会有一些基本的判断模式,比如说对于实体,我们有一些基本的实体形状的模式,每次去看的时候,我们都试图将各种视觉输入辨认为某类实体(正方体?球?圆锥?圆柱?梯台?环?棱锥?)。

按理说认知的过程是两个方向都有的,比如说我们看到一张黑白的照片,其中有两个灰度相同的区域,但是我们能够很明确地区分出一个区域是真的灰色,而另一个区域是白墙上的影子,看到照片本身必须是底层刺激,而分辨影子和真的深色就是从上往下的控制了。这种区分的依据在于我们能够判断光源以及物体的形状。话说回来,前面的关于颜色和形状的打乱汇报也有这样的情况,貌似汇报蓝色的圆和黑色的圈的可能性会比较大,因为在上层的记忆中,人们有关于水滴和轮胎的记忆,或许还有黄色三角形作为警告牌的记忆。

放到语句理解上就是说,我们一方面的确是接受到了书籍上的字的光学刺激或者是别人说话的声音刺激才有可能开始理解。但是理解的过程并不完全是从下往上的。比如说:
汉字顺序不影响阅读,事证实明了当你看这完句话之后才发字现都乱是的。
以及:
I cdn'uolt blveiee taht I cluod aulaclty uesdnatnrd waht I was rdanieg: the phaonmneel pweor of the hmuan mnid. Aoccdrnig to a rseearch taem at Cmabrigde Uinervtisy, it deosn't mttaer in waht oredr the ltteers in a wrod are, the olny iprmoatnt tihng is taht the frist and lsat ltteer be in the rghit pclae. The rset can be a taotl mses and you can sitll raed it wouthit a porbelm. Tihs is bcuseae the huamn mnid deos not raed ervey lteter by istlef, but the wrod as a wlohe. Scuh a cdonition is arppoiatrely cllaed Typoglycemia . "Amzanig huh? Yaeh and you awlyas thguoht slpeling was ipmorantt.

当然这两个东西是不同的,前面英文的打乱方式和汉字的打乱方式有显著差异。因为汉字如果真的要这样打乱的话,起码也得是以部首为单位吧。不过无所谓了。这个例子说明,我们的大脑会引导我们看到我们想要看到的东西。或者说,这是因为我们的语言是冗余的。位置信息在某些情况下是重要的,比如说「Jack loves John」,而在另一些情况下则是不重要的,比如说 「I'm having lunch」。同理,很多时候我们在重复别人的话的时候,很容易将副词的位置弄错,但是却不容易将主谓宾的顺序弄错。这说明副词的位置信息实际上是冗余的。但是在「Jack loves John」中,主谓宾的位置顺序所传递的信息就显然不是冗余的。


语义和语言习惯应该就是从上到下这个过程的主要因素吧。



当然,问题还没有完,毕竟大多数情况下,需要讨论如何阅读的时候,我们面对的都不是一个简单句,而是复杂的长篇大论和复合句。抛开心理学不说,一般来说,读复合句的方式自然是首先确定句子的主干,用括号把从句括起来,看完一层之后再进去分析从句的结构。等到确定了整句结构之后再回过头来把内容填进去理解。例子就不举了。不过要注意这样一个事实:精确和快速实际上是相矛盾的。而真的要讨论学习效率的话,我还是很喜欢唐浩当时对我们的教导:Wittgenstein 这样的人,读得越慢也就懂得越快。这里也是,最佳的阅读方法自然是确保自己准确理解了作者的意思,不用再花时间读第二第三遍。但是这本来也是没有必要的事情,毕竟大家读哲学书也就是为了装装逼,又不是为了搞学术,唬住一般人就行了。何苦按照写论文的方法读呢?阅读的目的决定了阅读的方法。

突然对这个问题特别感兴趣。还没做过深入研究的人来说一点点自己的看法哈。
句法是有框架的:x-bar framework. 如果只是在句子层面上,我个人相信,由于各个语言的x-bar深层结构都是一样的,所以我猜想,这个深层结构可能和人脑对于语言的解构是一样的。所以在人看到或者听到一句话,这个句子就是自动从表层结构转化到深层结构,然后直接理解。
如果是段落层面的话,很多语言学家对于人如何看懂/听懂一段话有不同解释。。例如韩礼德,Giora之类。。可以去查查文献。。

题主您看看 脑的阅读 这本书,斯坦尼斯拉斯迪昂所著,你就会发现哈哈哈,我们写的答案都在里面。不过,书里面没有句子理解的研究,但是非研究者读已经么么哒了

稍微专业一点的认知神经科学——关于心智的科学,里面有这个章节



句子的加工包括了字词句三步走加工。
先说字,除非是藏汉语系,其他那些印欧语系的以及一些莫名其妙的语言字母基本就绕过,他们从字母加工开始,字母我就不提了,大致一样。汉字在大脑中的语义激活需要三步走,形音意顺次来, 但是速度还是非常快滴,几时毫秒就能完成语音激活, 偷了张猥琐图不要嫌弃。。如果是高频字,就是那些经常看到用到的字,那就好办了,由形直接到意,么么哒,连音都可以基本过,巴特,我说的是阅读句子,不是听见或者说出来。


至于人类如何掌握了阅读这门绝技,这就归根于祖先们滴进化啦,左脑枕颞区是识别物体基本形状滴重要区域,祖先们经历了辣么长时间的洗礼以后,伴随智商的提高,视觉加工的优化,就具备了越来越高级的什么恒常性啊,脑补功能啊什么的,研究发现就是小猴子也能够识别一些高度简化了的图形,比如杯子什么的,这就是基因的演化造就了神经基础,而人类的生存需要就形成了了这个这个外界的推动力,总而言之,我们赢在进化,赢在需求。
词语词语,词语这个建立在字的基础上,相对就复杂一些,印欧语系研究曾经提出过一个双字母神经元之说,research这个单词,在快速阅读反应任务下写成reaserch,实验参与者大多没有发现词语有错哟,所以改假说就认为字母是相互组合的,词语的识别依赖于不同字母的组合,因为他们认为大脑如果一个一个加工字母来完成词语识别太费事而且速度慢,这个研究就进一步支持了脑神经以多字母组合来识别词语。
心理学家提出的心理辞典是存储字词的语音,语义以及相关的一系列相关的信息的系统,词语在识别了形以后,其他就在心理辞典中完成咯。

最后就是句子理解了。
句子理解是语言心理学,心理语言学,阅读心理学,语言学各种学的重要研究课题,全世界的研究大大,阿姨们都在努力,但是目前几乎全体瓶颈。句子的理解是快速将句子中各类信息整合从而建构句子的心理表征的过程,各类信息包括,词汇语义,句法信息,语用信息以及音韵信息等等,除此之外,你脑子里还有普世知识,帮助你判断句子内容的正确性,此外,它还能帮你预测句子即将出现的成分。
对于句子加工中,先加工句法还是先加工词义的争论都几十年啦,句法几乎等同于语法哈,怕我太装。。早期研究认为读者先加工句法后加工语义,而且语义加工依赖于句法,比如,我吃苹果,你先依据此类信息加工出了个名词动词名词,才会依此把词义丢进去。中期研究就认为两个加工是一起进行地,就是说我吃苹果里面,语义加工不是等着句法完成,它是主动地,你不行了,我就要上,但是最根本的还是语义加工依赖于句法加工,不会脱离句法加工的。
伴随脑电研究,ERP FMRI MEG PET 技术的投入,这个句子加工研究就变得科学了些。研究者们近几年就发现,哎呀,好像语义和句法信息是可以相互独立并且快速运作呀,我语义加工才不看你句法加工的颜色,我跟音韵美眉,语用弟弟只为句子阅读服务,不论先后,牛逼与否,但求完成命题建构。
必须提一提,人脑中的语义记忆。句子加工如此快速,很大程度上依赖于其矜矜业业,分析,预测,整合,判断句子等等都依赖于它。

说说句子的完整命题,句子的命题的建构分为表层表征与深层表征,如,我不喜欢题主才怪呢,表层就是,我不喜欢题主才怪呢,深层表征就是,我喜欢题主。命题最终是存储于长时记忆中滴,所以要经济而有效,不能罗里吧嗦。这个语义记忆是长时记忆中滴。再说说句子中的命题,一个句子越复杂包涵的命题就越多,这个是小命题,我吃苹果,两个命题,我吃,吃苹果。复杂的句子中大脑就要建构多个命题,建构一个命题网络然后有条不紊有组织滴建构整体表征。


说到最后,省略了好多专业的东西,手机码字党,将就看看吧。。说错了请批评,进步更重要。

这个问题我倒可以提供点个人经验。

我念书,甚至只是一句短语,一个招牌也经常会念错。我太太经常为此嘲笑我。

比如你的问题第一句:阅读不要一个个字看过去。

我试着读一下,读出来的效果就是:“阅读不要一个一个字去读。”(就是刚刚实测)。这不仅仅是读错那么简单,在比较特殊的情况下,我视觉直接呈现的就是被我改造过的结果。要揉揉眼睛才会看出真实的客观内容。说严重点,这就是思觉失调。

首先,我对本题目非常感兴趣,自己也是这方面的爱好者,但是不具任何专业知识。尝试从我自己的角度进行一些理解吧。和大家答的,和题主问题的可能都不是一个方向,因为我觉得首先必须搞清楚这个方向,才能很好的回答问题。

有一些疑惑,既阅读不是一个个字读,指的是读句子还是读段落。

因此,我下面将文本分为三个尺度,分别是段落、句子和单词/字。段落是有其下一级尺度的句子构成的,而句子则是由其下一级尺度的单词构成的。

首先是段落。
个人的理解是,段落具有比较明显的结构特征(这可能对于记叙文并不适用,但是对于说明文或议论文而言是相当明显的)。它们总是在开头(或者是结尾)表明本段的概念/观点、主旨和感情基调。然后在中间部分则对这一概念/观点、主旨和感情基调进行说明或者论述。
所以,其实段落本身的信息实际是比较小的,既观点和主旨一类的东西。而论据可能包含的信息量比较大,但是不是段落这个整体本身的核心。因此,在阅读段落的时候,有很多句子其实是共享了同一个(或同一类)观点和主旨,信息重复度相对较高,能够在上下文间进行猜测而得到相应的信息。
我将这类比做一个插值或者拟合问题。既给定一些点的值(读了的信息),并已知插值函数的连续性(段落的观点或者主旨),我们就可以插值或者拟合(猜测)出其他点的值(未读的信息)。这个类比本身没有任何意义吧,但是是否能够更好地理解这个解释呢?

其次是句子。
句子中一般不会出现冗余的成分,既句子中每个单词(或者词组)都有其存在的意义。“I love you”和“I love you more than I can say”应该表达了不太一样的内容。如果你读了I love you当然也能够理解后者的大致意思,但是这并不是完全的理解了——信息有很多丢失。所以个人理解是,对于单独的句子(没有上下文关系)而言,通过读其中几个字一般不能很好地理解句子本身所需要表达的意思。因为它与段落的差别在于,构成段落的句子在意思上重复度较高,目的指向段落主旨或观点;而构成单句的词或词组,它们的信息重复度较低,各词或词组都有自己的独立的作用。
再做一个类比,就是n个未知数的方程,用n个独立方程可得精确解。(好吧,类比本身是无意义的,希望做辅助作用吧。ELON MUSK说,不要analogy, 要physics。)

最后是单词。
单词是由字母组成的,这些字母本身并无意义。这是单词与句子和段落最大的不同。单词的意义体现在字母的组合上,某些特定的组合概率大而某些组合小。前面有人答道即使单词中某些字母的顺序调转也能够阅读,如“I love you”改为“I lvoe you”,我猜是因为满足这样顺序的组合的单词基本也就只有这么一两个,因此就对阅读影响不大。单词中字母排列的顺序,一定程度上决定了它的形状,比如把love写成olve,是不是比写成lvoe对阅读更有阻碍呢?我也不知道,至少我自己觉得难度是增加了,但是还需要实验证明吧。

那么段落的理解是如何进行的呢?
对于段落的理解,我只能说说个人经验。基本都是先定位本段的主旨,然后看每句话是如何作用于这个主旨的。这个就是读论文时候的思路。我不读太多小说,所以没什么发言权。(没文化啊~摊手)

句子的理解是如何进行的呢?
这边我比较认同的是 @qi zhang的答案,并不是说我知道x-bar是什么,但是我自认为有这样一种规律,将作用独立的词/词组联系起来,通过这样的联系,去判断它们应该去什么样的意思。

单词的理解呢?
对于单词,可能有两个关键问题,一是获得这个单词,二是获得这个单词的意思。
这在 @罗心澄的回答中有涉及了。我不专业就不展开了。(也许以后有空读读资料看看能否挖出些信息吧。)

好吧。其实没怎么回答到这个问题,希望能够从阅读尺度这个角度有些帮助吧。以上也都是一个对应语言有兴趣的工科男对于阅读的认识。。。如果你连这句都读了,我怎么能好意思不谢谢你咯。

一般认为,阅读中的language processing (语言处理?)是在top-down(从上到下)和bottom-up(从下到上)两个纬度同时进行的。你可以把从下到上大致理解为音素-字-词组-句子结构-语意-概念。偏“上”的部分主要跟语意和概念相关,偏下的部分就是具体的词词组等。
bottom-up按理很好理解,英语水平一般的人读英语大都从下到上,这主要是因为我们学英语是作为外语学习,开始学习的时间过了critical period(关键时期)就很难对英语形成自动化的反应机制。一些fMRI研究发现,一种语言的早期学习者在阅读时大脑中跟语法处理相关的部位活跃,而晚期学习者则是大脑中跟语意处理的部位活跃。所以如果你英语不够好,你更多的是在用从下到上的处理方式。从理解词开始到句子到语意再形成概念。
当然,中文是你的母语,你的处理方式更多是从上到下。在阅读时很多内容是根据语境和你先有的知识来预测的。
你给的例句“我吃了苹果”,刚好心理语言学有个著名的eye-tracking实验用的就是类似的句子。实验大概是这样,被试者分为两组,都会看到画面里有一个男孩,一个苹果,还有一些其它干扰作用的物品,但是苹果是唯一能吃的,然后两组分别听到句子“男孩会吃苹果”和“男孩会移动苹果”。实验结果是,前一组眼动更早移动到苹果上面。在这两个句子里,动词提供了句子理解的线索,听到“吃”的人会从语意和搭配上更快选择“苹果”。
所以你的例句中,至少在处理到动词“吃”的时候,后面会出现的内容已经筛选成可以和“吃”搭配且较常出现的NP了。
当然,以上某些内容学界还存在争议。但语言处理的基本模型是这样。

你的问题描述我就看了几个词就知道大概的意思了……所以阅读很多时候是联想就可以实现,不需要完全看完。这种思维是做英语阅读题做出来的……

© COPYRIGHT BY i How And Why.com 2015