人类进化到现在人的左右脑功能为什么功能固定且不一样?

本日志涉及话题:
清华江铭虎之脑与语言认知
脑与语言认知(一)
脑与语言的共同进化
语言是人类沟通交流的一种方式,人类智慧的结晶可用语言描述和记载,使我们的知识、经验和财富得已积累,使我们可能用几年或十几年的时间就可掌握人类几千年文明智慧所积累的知识,逐步走向繁荣、富强和发达的人类社会。
语言虽然是变化无穷的,但语言的语法类型是有限的,是可以归类、分析、统计和学习的。
大约2300万年前,猿人类与其它灵长类动物分离,而人类和黑猩猩大约在500万年前产生分歧。
在近300万年中,人类大脑的重量从300克增加到日前的克,且体积和复杂性在进化的过程中不断增加,使得一些旧有的功能得以改进,一些新的功能(如语言、工具制造、创造)得以出现。
大脑容量的增加,提高了人类行为和认知的能力,决定了人类在物种竞争中的胜出,逐步成为世界的主宰者。
语言的发展与人脑的进化
大脑器官如此复杂,人类进化并不是刹那间发生的,其中语言的使用和发展起决定性作用。
大约200万年前人类的出现;大约50万年前大脑面积开始增加(口语的出现,它使人脑中操作口语的机能和语义经过几十万年的进化,神经系统自然而然的联为一体);大约15万年前解剖学意义上的现代人类的出现。
哺乳动物的脑。具有不同的复杂性,但脑的外观都具有许多相同点。按身体与脑的比例,人类是最大的,只有人类有语言,语言与大脑的容积密切相关。虽然海豚大脑比人的略大,但海豚的体积是人类的3倍多。
大约在180万年前,诞生了新的人种---直立人:更大的大脑,更扁平的脸,更像现代人的鼻子,使用火和更先进的工具。现代人大约在50万年前进化而来,大脑比直立人大得多。现代人:眉脊相比直立人已大幅降低,脸部更加扁平。
脑与语言认知(二)
人类与灵长类的特征
与共同的祖先大猩猩相比,人类独一无二的特征包括:1、竖直的体态(两足动物);2、不成比例地硕大的大脑;3、能使用工具以及复杂的语言。
Caceres Mario(PNAS,2003) 对人类和黑猩猩、倭黑猩猩、长臂猿等五种猿类的基因表达研究表现:这些物种具有大约95%的相同基因。令人惊奇的是在人类和其他灵长类动物大脑之间的大多数差异中,显示出明显不同的基因表达模式,大约有90%的基因在人脑中被更高度地表达。
相比之下,当比较人类和黑猩猩的心脏与肝脏时,正向调解基因和下降调节基因的数量几乎是相同的。这些提高的基因表达水平能够为人脑生理与脑部功能的广泛改进提供基础。
自亚里士多德时代起,人们就坚信语言是人类特有的才能。其中最基本的一个能力是生成和理解复杂的连续语音串。黑猩猩与人类发音器官不同,教导黑猩猩说话被证明是徒劳的。Bronowski(Science 1970)对黑猩猩6年的集中训练发现只学会发出4个类似语言单词的音,因此口语并不适合这个物种,手的使用是黑猩猩行为中的主要特征,如黑猩猩四岁时,可学会80多种不同的符号。
自然环境中黑猩猩,其交流系统主要用于表达个体的动机和情绪状态。而命名系统的进化为人类语言的出现提供了可能。
指示性的手势常常是三元的,包含了信号发出者、接受者和第三方实体或事件。猿类在与同类交流时也使用命令的、指示的手势。但猿类的手势主要是二元的,换言之,是用来获取其他个体对自身的注意,而不是将其他个体的注意力吸引到一个外界实体上。要求清洁或食物,提供食物给他人,这些手势很明显是三元的。然而,人类儿童在掌握语言之前使用手势交流时,同时涵盖了二元和三元。
人类习惯于将外界事物分离并命名,即将外界事物分析为截然不同的部分并视为独立的个体。从而在人脑中可以被单独地加工、组合,因此即使是动作和属性都可以具体化成语言。
人脑的构造
人脑是一个非常复杂的结构,它控制着人类复杂的认知行为。在解剖学上,人类大脑皮层分为额叶、颞叶、顶叶和枕叶四个区,这些区域控制着思考、语言、行动、感觉、视觉和其他功能。在脑皮层发育过程中,这些不同功能区域的形成称为区域化。
Sylvian裂(大脑外侧裂)将额叶与颞叶分开,中央沟将额叶和顶叶分开。枕叶位于脑后部。大脑皮层可分为左右两个半球,右侧大脑皮层调节身体左侧的运动,左侧大脑皮层调节右侧的运动,人类很可能是唯一有偏侧性的哺乳动物。
图:外侧裂的不对称性。对大部分右撇子人来说,位于左半球的外侧裂比右侧外侧裂长,而且倾斜的角度较小。
图:颞平面的不对称性。这个位于颞叶上部的区域,其左侧通常显著大于右侧。
当大脑成长和扩充时,受头盖骨的限制,大脑皮层相邻接区域间的连通行的力量决定了它成熟的折叠模式:使得坚固的连接区域形成了脑回,柔软的连接区域形成了脑沟。这种皱巴折叠的构造允许在受限的头骨范围内有更多的脑皮层表面区域。智力水平与大脑皮层的表面积成正比。
图:脑的白质和灰质。大脑中大约有1000亿个神经元,知识存储在神经元之间的连接上。神经元的核主要分布在灰质部分,神经元之间的连接主要分布在白质部分。女性大脑和白质部分关系更密切,男性大脑和灰质部分关系更密切。人类所有知识都储存在神经元间的连结上,即白质部分。
脑与语言认知(三)
和语言相关的一些区域:听觉皮层(Auditory cortex)和耳朵位置相对应,听发音起作用。图中是左半球的听觉皮层,因此和右耳的官能相连接,对右耳收集的声音起作用。之后将信息传送到威尔尼克区(Wernicker's area)进行理解,角回(Angular gyrus)也是一个非常重要的语言区域。讲话的区域叫布洛克区(Broca's area),布洛克区和嘴唇口腔的运动控制区(Motor control of mouth and lips)位置挨得非常近,如语言组织好后,直接对口腔发音进行控制,实现发音功能。运动皮层(Motor cortex),左脑运动皮层控制身体的右半部分。胼胝体:联结左右脑。小脑,负责身体平衡。延髓,位于颈椎连接脊髓。其他组成部分还有脑桥、中脑、下丘脑、松果体、丘脑。大脑皮层从外侧裂揭开,是脑岛,脑岛中有一块区域管理视觉。图示:听觉层(41,42),额下叶皮层(20,21,37),前额叶皮层,运动前区(6),辅助运动区(6),初级运动区(4),躯体感觉平层(3、1、2),后顶叶皮层(5,7),视皮层(12,18,19)(顺时针)。从后往前观脑,可看见中央沟、大脑纵裂。揭开中央沟可见脑岛,揭开纵裂可见胼胝体。从下往上观脑,可见嗅球、嗅神经、视神经、视交叉、视束、下丘脑、乳头体、中脑、脑桥、延髓、脑神经。可见嗅神经、视神经、动眼神经、滑车神经、三叉神经、展神经、面神经、位听神经、吞咽神经、迷走神经、副神经、舌下神经。大脑里面除了有丰富的神经,还有丰富的血管。脑的语言中心区,大脑的彩色磁共振成像(MRI)扫描表明了涉及语言的区域(绿色/橘黄色)。通过实验,华盛顿大学200多个体,证明结果均不完全一致,有略微差别。具体说布洛克区(Broca's area)和威尔尼克区(Wernicker's area)是一致的,其他分布有差别。而且学习不同语言,大脑的影色区也不同。男性和女性的语言脑区也不同。
Paul Pierre Broca(法国)()。1861年,Paul Broca在一名只会发一个音“Tan”的病人死去后,发现该病人的左脑半球存在损伤,他仔细研究了由于脑损伤而失语的病人大脑,他确信不同的功能可能是定位于大脑的不同区域上。Broca首次指出在人脑中存在功能不对称性,语言能力具有单侧优势,这个控制着语言的区域被称作Broca区。
促使Broca确信大脑功能定位的脑,即保存的该患者的大脑,该患者在1861年去世前丧失了语言能力,图中圆圈标注的区域为造成其语言功能缺陷的损伤位点。威尔尼克区(Wernicker's area)未损坏,所以患者能听懂别人讲话,但是自己不会讲话。
Carl Wernicke(),1874年,德国脑神经学家Carl Wernicke发现左脑半球一个区域的破坏会导致一种由语言理解损伤引起的失语症,该区域被称作Wernicke区。95%的人语言区域是在左脑。
布洛克区生成语言,即语言表达。威尔尼克区功能是语言理解。
语音的产生和感知集中在不同的区域
Broca区:位于额叶,通常在左脑,负责语音的肌肉运动产生语音,该区域涉及到语音加工,句法处理和句法工作记忆;该区域的损坏造成口语表达思想的困难;Wernicke区:位于颞叶(通常在左脑),负责语音理解;Broca区和Wernicke区有相互连接的通道。
Network Architecture
A:初级听觉皮层;
AB:听觉带;
PB:旁带;
PF:前额下皮层;
PM:下前运动皮层;
M1:下运动皮层。
根据Wernicke-Geschwind模型对复述一个口语单词所作的解释:先后顺序1、听到。听觉皮层(Auditory cortex)初级听觉皮层。2、理解。Wernicke区。3、角回。4、组织语言。Broca区。5、运动控制区(Motor control of mouth and lips)。控制口腔、唇腔,把声音讲出来。
根据Wernicke-Geschwind模型对朗读一个书写体单词所作的解释:1、初级视觉皮层(Primary visual cortex)。2、角回。3、理解。Wernicke区。4、组织语言。Broca区。5、运动控制区(Motor control of mouth and lips)。控制口腔、唇腔,把声音讲出来。
一个语言加工模型。图中标出了书面和口语单词复述任务的各个处理阶段。每个阶段表明了由PET成像所观察到的与上述任务特异性相关的皮层区域。
口语顺序:1、初级听觉皮层、2、颞顶皮层(角回)颞上皮层前部。
书写顺序:1、纹状皮层(进行初级视觉处理)、2、纹外皮层(可视单词的识别)。
3、额下皮层(负责语义联想:查找词义、音义的对应关系)。
脑与语言认知(四)
4、运动前区编码(辅助运动区和其他外侧裂区域)。
5、语音运动控制区(初级运动皮层),经过布洛克区后处理语音。
6、发出语音。
图:感知和言语的正电子扫描(PET)成像
颜色表示相对脑血流量。红色表示血流量最大、橘黄、黄、绿和蓝分别表示血流量从大到小依次递减。
图:按树突结构进行神经元分类,星形细胞和椎体细胞是在大脑皮层中发现的两类神经元,由它们的树突的排列方式来区分。
在大脑里的1000亿个神经元中,普尔基涅神经元是体积最大的。这些细胞是小脑皮层里的运动协调大师。接触酒精、锂等有毒物质、患有自身免疫性疾病、存在孤独症和神经退行性疾病等遗传变异,都会对人类的普尔基涅神经元造成消极影响。
左右脑的差异:95%是有撇子,医学叫右力手。
左脑:口语是两个半脑最明显的差异,对于大多数的人左脑负责语言功能、数学、推理等。按照线形思维模式来运转。
右脑:具有空间技能(能够感知、组织给定空间的事物,判断距离等)、处理关系、音乐和情感等。按照整体思维模式来运转。
脑与语言认知(五)
左右大脑的功能区别:
左脑:比较有分析力,若收进来的信号有时序的一串东西,大脑需要排序分析,左大脑起主要作用。
右脑:接受整个印象,若收进来的信号是个整体(一幅画),不需深入分析,右大脑作用大。
研究:对着左耳说甜言蜜语容易打动伊人芳心
通过左脑负责数学、逻辑和语言,而右脑负责艺术、直觉和视觉形象。
右脑主管左半边的身体,左脑主管有半边身体。因此,你在征服对方签必须事先要判断清楚从“逻辑”下手还是从“直觉”下手。
如果你渴望在求婚时听到女友回答“好”,那么你就应该对着她的左耳朵说些甜言蜜语。
你如果希望女友答应你的求婚,就应该做到她的左侧,对着她的左耳发表“求婚誓言”,这些才能更有把握获胜。
无论你是要表达爱慕之意,还是要打发雷霆,对这左耳就会比对着右耳更有效。
如果你想传达一些非情感信息,如指示或命令,那更好还是对着别人的右耳说。
美国科学家研究发现:人的左耳(右脑)对笑话和趣闻轶事的感受能力比右耳(左脑)强。另外,用左耳(右脑)接电话进行商务会谈成功的机率也更高。
英国科学家研究发现,用左耳(右脑)接打电话进行商务会谈的人其生意更为成功,原因就是使用左耳(右脑)与客户进行沟通时往往凭直觉,而很少夹带个人情感因素。
在Neil的脑中刺激的位置产生命名错误(黑方框),而在分心的过程中刺激的位置产生极易错误(灰方框)。白方框是没有产生影响的位置。三个不同患者语言区的映射。黑色圆时刺激的位置产生命名题错,白色圆是没有错误的位置。
脑与语言认知(六)
双语患者的语言皮层,荷兰语是患者的母语,英语是作为成年人学习的语言并且是他的周围环境语言。
黑圆是两种语言命名发生错误的刺激位置:E圆表明仅仅英语的命名错误的明显变化;D圆表明仅荷兰语的明显错误位置;白圆是任一语言没有明显错误的位置。
用两种语言命名物体:B圆:双语命名位置;E圆:仅英语命名位置;S圆:仅西班牙语命名位置;白圆:无命名破坏的位置。
海马:显性记忆功能,事实和经验。
小脑:隐性记忆功能,技术和过程,如走路、骑车、游泳。
眼睛看见过的,再识别的占10%;耳朵听见过的,再识别的占60%;书本编码过的文字,再识别的占90%。
A1:初级听觉皮层的核心区域;
BPO:Broca区,岛盖部;
BPT:Broca区,三角区部分;
M1:初级运动皮层;
PFC:额前皮层,邻近运动系统的后部;
PMC:运动前区皮层;
WB:Wernicke区的听觉带区;
WPB:Wernicke区的听觉旁带区。
运动控制区:嘴唇区---咀嚼;舌区---多涎,过量地唾液分泌;咽区---发音;
比较新生婴儿和成人大脑的冠状截面。
语言优势脑半球左侧面图。
在左半球深处的弓形神经通路。
Broca区的损坏影响语音发生;
Wernicke区损坏导致语言理解困难;
运动皮层:发音控制接近Broca区;
弓形纤维束(Arcuate fasciculus,由wernicke发现):连接Broca区与Wernicke区的神经束;
脑与语言认知(七)
由Lawrence Cockrill描述的是在11岁的儿童中“二十五人就有一位”是诵读困难者(dyslexic)。诵读困难最普通的表现是儿童无学习能力并持续一生,它能够阻碍一个人的读、写、拼字和说话的能力。诵读困难严重性有轻重不同。诵读困难的原因是神经生物学(与脑成形的方式和它如何运行有关)和遗传(与家族遗传有关)因素造成的。
诵读困难和Fast ForWord
与正常读者相比,诵读困难的儿童对快速变化的声音处理由困难。当他们首先听到语音时妨碍了他们恰当地习得音节,造成之后的阅读困难。
功能磁共振成像(fMRI)能够表明经过Fast ForWord的语言计划的全部训练后,诵读困难的儿童能够改变。反复训练似乎可以重塑诵读困难儿童的大脑:总计8周60小时的每日学习训练之后,当处理快速变化的声音时,这些儿童大脑的响应更象正常的读者,改进了他们的阅读能力。
失语症:由脑损伤导致的语音产生或理解的病症(disturbance),包括Broca失语症和Wernicke失语症。以前脑神经成像的研究仅限于大脑受到撞击后病人表现出语言混乱的案例。早期的方法是表明在大脑损害的位置和行为之间的关系上----集中在句子的生成与理解上。
由头部撞击或损伤造成的语言功能的损害。
Broca失语症:常常是1、迟钝、让人曲解的语音2、语法不能。大部分的词汇学的词;功能词被错误地使用或不被使用。例如:I eggs and eat and drink coffee breakfast。症状:忧郁的语音,由典型的简短话语组成;功能词和词法、词态(即:英文的过去时,复数等)的缺失;至少看起来,具有相当好的语言理解。例子:回忆中吃力的发音。Ah...Monday...ah,Dad and Paul Haney....
Wernicke失语症:可能包括称名不能(anomia,难于找出正当的词)Related to the"tip of the tongue"
phenomenon,whick we all sometimes experience。常常对于听者是难于理解的:即使发音非常流利。例如I can't talk all of the things i do,and part of the part& i can go all right,but i can't tell from the other people.症状:1不能抓住口语单词的意思2容易产生连接式的语音3语法标记串正常的(以拖长的单调音)吟咏,代名词,前置词,冠词和辅助词(auxiliaries)4难于回忆起正确的内容词,特别是名词(名词不能)5所说的词也许是无意义的新语(neologisms)或语言错乱(paraphasia)6理解破损
8种有名的失语症:Broca失语、Wernicke失语、传导性失语、Global失语、超皮质运动性失语、超皮质感觉性失语、超皮质混合型失语、命名性失语。
6种一般类型的症状:流利、重复、理解、命名、右侧偏离、感知缺陷。
传导性失语:一般由连接Wernicke区和Broca区的白质通道的损伤产生,特别是弓形束的损伤。
Global失语症是由Wernicke区和Broca区两者的损坏造成。
各种超皮质运动性和感知性失语症是分别由于Broca区和Wernicke区的损伤产生的。
也有其他的综合病症,例如pure word deafness,患者或多或少地能正常地说和写,但不能感知语音,即使其他的听觉感知是完整无缺的。
在实际的临床诊断中,通常更多的详细的试验为了更详尽地评估语言功能,通过MRI成像来发现损伤的详细位置。
这些不同集中呈现在语言产生(损伤在Broca区域的失语症)和语言理解(损伤在Wernicke区域的失语症)上;
值得注意的是当句法是‘复杂的’情况下,通过更详细的检查揭示了Broca失语症患者也有理解上的困难,这与我们过去看到的相一致。
进一步阐明
语言的基本组成时:词汇,某些原始符号的集合(即:‘词’)。句法,将这些符号集合在一起的规则。表现为语言的这些组成对失语症有不同的影响。
另一观点:相关的神经成像发现,Wernicke区域对词汇的内容是至关重要的,而Broca区域对于句法是至关重要的;这些的‘至关重要’意味着针对调查研究(investigation)。
当我们朗读或讲话时,一个含义或概念的信息从Wernicke区送至额叶下部的Broca区,Broca区将这一含义或概念解码成为指令,并传送至额叶上部的运动皮层。连接至大脑运动区兴奋的神经控制嘴、脸、喉咙和肺的产生语音的器官,或者在书写的情况下控制手指和手的肌肉。
当我们听语音时,来自耳朵的由声音产生的信息被送至听觉皮层,然后送至Wernicke提取含义。
在19世纪就发现Broca区和Wernicke区执行其操作。
他们发现对于大多数的人语言区在左脑半球,虽然某些人(主要是左利手)其主要的语言处理半球是右脑。
脑与语言认知(八)
右耳的优势:声音播放通过右耳到达左脑的Wernicke区更直接;因此pa将更可能是被感知的声音。
左利手:没有一个人提出一个肯定的理由为什么某些人是左利手,左利手约占世界人口的10%。目前还没有确定左利手的遗传基因,但似乎与家庭的强相关的。人脑是“测向交叉”的,因此左脑控制身体的右侧,反之用手习惯的优势与脑半球的优势侧反的,即左利手是右脑智力控制的。
运动控制区:右脑控制身体左侧;
左脑具有语言和认知处理的优势;
右脑具有非语言的处理,即空间关系;
语言的特性口语及特点
口语:人类最早的语言交流形式。
特点:瞬间消失,受时空限制传播距离有限。
文字及特点
特点:具有历时性,可永久保存。
汉字是一种象形文字(表意体系的文字)。
文字的性质不同,在大脑里处理的部位也不同:
左脑前部:日文假名(与语音比较接近)
左脑后部:汉字(像形)
拼音文字(语音):左大脑
汉字(图画):右大脑
汉字和英文都和语音有关系,但英文和语音的关系密切。(实验表明:看汉字时并不能由字直接到达意义,也要通过语音)
语音干扰对做出判断的影响要比汉字严重得多。
文字是个复杂的系统和语音有密切关系,因此不可能只由大脑中的某个小部分专管这类(或那类)文字,是由整个脑子协同处理,由于信号的性质不同,大脑各部分功能的比重是有主次之分的。
脑与语言认知(九)
文字是个复杂的系统和语音有密切关系,因此不可能只由大脑中的某个小部分专管这类(或那类)文字,是由整个脑子协同处理,由于信号的性质不同,大脑各部分功能的比重是有主次之分的。
语言的特性:语言是可以创造,可以产生的。
语音通过发音器产生,目的是交流。
有赖于几种信息:1、音韵学:字音;2、正确拼写:书写文字;3、词法、句法:组合规则(语法);4、语义:字义。5、语用:背景信息、世界知识。
语义:语言符号所表达的意义。
动物的交流:鲸唱歌、狼的嗥叫、狗吠、蜜蜂跳舞、师狮子吼。
符号交流:Vervet猴子的致命天敌是鹰、蛇、豹。
黑猩猩能学400-500种符号和简单语法。
语音和一般声音的区别:语音是语言的一种声音,但与一般的声音却有着本质的区别。
声音有很多种:如雷声、雨声、马达声、咳嗽声、口技演员模仿动物的叫声、鼓声、哨声、噪音等,但这些声音并非语音。
第一、语音是音义结合的符号系统,语言的声音和语言的意义是紧密相关的,只有表达语言意义的声音才称之为语音。如:在汉语普通话中,“peng you”的声音形式和“朋友”这个词的意义联系起来,就属于语音。
第二、语音具有系统性。人类发音器官发出的声音,仅在符合一定语音系统的情况下才是属于语言的。
第三、语音除了物理属性、生理属性之外,还具有社会属性。语言是用于沟通交流的,语音的社会属性是使语音从根本上与一般声音区别开来的本质属性。
人类语言和动物“语言”的根本区别:
人类语言单位明晰:如英语每个因素和汉语的每个音节均有很明晰发音规定,有清晰的共振峰轨迹,汉语有清晰的基音曲线(动物的“语言”混沌一片:如鸡叫或毛驴的叫声)。
人类语言符号具有完全的任意性:人类可以对事物抽象出概念、可以组词造句,造出以前没有的句子,人类的发音器官的结构可发出任意的声音(动物的“语言”的任意性受到很大的局限:动物不能组词造句,动物受到发音器官结构的限制仅能发出有限种声音)。
脑与语言认知(十)
人类语言和动物“语言”的根本区别:动物的“语言”的任意性受到很大的局限:动物不能组词造句,动物发音器官的结构限制了发出声音的种类。
人类语言单位明晰:如英语每个因素和汉语的每个音节均有很明晰发音规定,有清晰的共振峰轨迹,汉语有清晰的基音曲线(动物的“语言”混沌一片:如鸡叫或毛驴的叫声)。
人类语言符号具有完全的任意性:人类可以对事物抽象出概念、可以组词造句,造出以前没有的句子,人类的发音器官的结构可发出任意的声音(动物的“语言”的任意性受到很大的局限:动物不能组词造句,动物受到发音器官结构的限制仅能发出有限种声音)。
人类的语言是开放的、发展的:古代汉语与现代汉语就不同(动物的“语言”是封闭的:如鸡或毛驴的叫声几百年或几千年没有变化) 。
人类语言结构有层次性:语法、句法、语义、语用,语言具有树状结构(动物的“语言”没有结构可言,表达种类有限,不能组合)。
人类语言存在于社会:人类的语言用于社交,受社会使用者的共同制约,具有继承性(动物的“语言”是先天的:简单)。
人类语言信息传递不受限制:文字声音传递可跨越时空(可记载、可继承)(可远距离传输)(动物的语言只是临时刺激的反映:不能记载、不能继承、不能远距离传输)。
语言的结构,层次结构称为语法(syntax)。
如:丽达 亲吻了 这个 害羞的 男孩。
人可以学习语言,动物不能学习语法。
通过语义的缺失与大脑损伤的部位间的关系作为研究窗口:日常单词的缺失。
神经学语言模型:文字---可视化词的表示---听觉词的表示---概念中心----语言组织----口语。
脑、计算机与语言计算
自然语言和大脑是紧密相连、共同进化的,也是最复杂、最难研究的课题之一。
近十年,细胞分子水平的脑机制研究成果已经可以预计未来的进展将更多地促进和影响自然语言处理的研究。
从使用语言对脑的进化过程的作用看:使用语言是人类智慧的最重要特征,人类语言的丰富性和复杂性是区别于其他动物语言的重要标志,在人类进化过程中语言的交流是人脑重量(从远古的300克增加到现在的克)和容积增长的决定性因素。
从1946年第一台计算机的诞生到今天的网络信息化时代,这短短的六十多年时间,计算机为人们的生活和工作带来了翻天覆地的变化。
目前人脑的基本处理单元(神经元)的数量是计算机的基本处理单元(门电路)的一万倍,人脑的记忆容量是计算机的10的3到10次方倍,而脑成像和计算机是研究人脑的最有效的辅助工具。
神经网络信息处理:1、巨量并行性:空间复杂性、时间复杂性。2、信息处理单元与存储单元合二为一。3、容错性。4、处理自然信息。5、求满意解:Hopfield TSP。6、自学习、联想、记忆。
脑与语言认知(十一)
人类大脑皮质的全部表面积约有20乘以10的4次方平方毫米,平均厚度约2.5mm,皮质的体积则约为50乘以10的4次方立方毫米。如果皮质中突触的平均密度是6乘以10的9次方每立方毫米左右,则可认为皮质中的全部突触数为3乘以10的15次方各。如果再按上述人脑所含的全部神经元数目计算,则每个神经元平均的突触数目可能就有1.5-3.0万个左右。
人类智能笔人工智能强上万倍,但计算机技术正在以惊人的速度发展,计算机与人脑的比较如下:
处理单元:(计算机)门电路,(人脑)神经元;
数量:(计)10的8次方,(人)10的10次方到10的12次方;
信号:(计)电信号,(人)神经脉冲;
动作速度:(计)10的-9次秒,(人)10的-3次秒;
传递速度:(计)10的8次方,(人)10的2次方;
记忆容量:(计)10的10次方bit,(人)10的13次方到20次方bit;
记忆形式:(计)按地址查询,(人)按内容联想;
处理方式:(计)集中处理,(人)分布处理(模拟处理);
系统结构:(计)串行,(人)串并行;
容错:(计)低,(人)强;
工作方式:(计)被动执行程序,(人)主动学习;
能力:(计)精确计算,(人)决策;
发展:(计)六十多年,(人)几十万年;
语言的计算及困难
从信息处理的角度分析,汉语语言与西方语言相比有如下一些特点:汉语是大字符集语言;形态上的区别特征少,没有词形变化;句型变化繁多;存在着大量同形歧义和同音歧义现象;一词多义现象比西方语言更为严重。正是这些特点使得在进行汉语语言处理时不能直接套用西方语言的处理方法。
语音:语音识别、话者识别、话者确认、语音合成;
文字:手写体识别、印刷体识别;
自然语言:自然语言理解、文本分类、搜索引擎、自动文摘;
自然语言处理的困难:语言(书面文字)是由符号组成的,由符号组成词,词组成句子来描述一切事务。汉语的字字组合成词会产生新的含义,这就产生了歧义,如果仅仅靠传统的信息处理和计算及理论已显得远远不够,因此必须建立新的理论。
语言的内容是由符号来表达的,但:符号(字或词)和内容表达不是一一对应的,表现为信息内容与符号之间的映射不是一一对应的;符号的组合具有多义性、层次性、随机性和模糊性等一系列复杂特性。
脑与语言认知(十二)
基于脑认知机理的自然语言处理
借鉴脑研究结果,从脑认知的交叉学科角度对语言进行探索。
方法:文本和相关词语的意义都体现于它们在人脑中所产生的刺激,这种刺激可以用磁共振成像来检测。
借鉴脑研究的结果,建立起语意与刺激位置之间的联系,建立起提取特征和语言处理相适应的神经网络生物模型。例如,国外学者通过采用fMRI(功能核磁共振成像)技术对印欧语系和汉语的名词、动词、兼类词这三类词的脑神经成像分析发现:印欧语系的词在形态上的区别特征多,有词形变化,这三类词脑神经成像在不同的脑图像区域,而这三类的
LiPing等人对汉语名词、动词和兼类词共68个词的fMRI试验结果,表明这三类词在某些脑区是有重叠的。通过我们的实验说明语义概念特征无论在表达能力和性能结果上均优于句法,词频特征:这证明了汉语信息处理不能直接套用西方语言的处理方法。
根据脑神经科学的研究结果:人脑特别适宜于处理自然信息;高层次脑的运行主要依赖于提取概念符号;学习过程中符号是通过其内容来表达;符号间的相似程度是由其内容的相似程度来表示。
自组织特征影射(SOM):SOM是基于生理学和脑科学研究成果的基础上由T.Kohonen提出的。该网络通过自组织学习使功能相同的神经元靠得较近,功能不同的神经元分得较开,在学习过程中一些无规则的输入自动排序使神经元的连接权值的分布与输入的概率密度分布相似。它是由输入和输出两层网络组成,可用竞争学习算法来完成。
图:自组织特征影射神经网络
SOM的学习算法:竞争学习:与输入特征最相似的模式矢量会不断更新直到找到最相似的矢量;合作学习:不仅调整了获胜结点,同时调整了它的临近结点。
语义、概念特征描述:
脑与语言认知(十三)
脑神经成像与汉语词性的关系:我们采用神经网络模拟技术,对这三类汉语词(共68个)进行了多维词性、句法和语义标注,用神经网络进行自组织特征映射分析,发现单独采用语义特征对这三类汉语词进行的自组织特征映射与脑神经成像的区域分布(相互交叠)相吻合。
实验数据:名词、动词、兼类词共68个[3]。
名词(23个,序列号:1-23):产量、道路、电影、儿童、方案、飞机、工资、广告、观众、故事、海关、合同、教室、节目、旅客、煤炭、商场、商店、山区、食品、外汇、文章、足球。
动词(22个,序列号:24-25):变成、超过、出来、担任、打破、抵达、夺得、搞好、告诉、建成、交换、看到、留下、签订、取消、树立、下降、遇到、知道、种植、抓住、作出。
兼类词(23个序列号:46-68):变化、编辑、代表、导演、合影、花费、绘画、建议、教训、计划、记录、领导、命令、认识、通知、威胁、需要、要求、影响、指示、主编、总结、组织。
表明汉语是以语义特征为主、句法特征为辅。
此项研究表明:对于母语是汉语的人来说,人们在日常交流中对汉语(或汉语的词)进行理解时,主要是从语句的意义或词的内容含义上进行理解(对应于计算机的语义处理),不太注重句法和语法因素。句法分析是从西方引入的,而汉字是象形文字,说明句法分析不完全适用于汉语分析,汉语自然语言处理应以语义处理为主。
脑生理结构和现代认知心理学的研究表明:语言信号中的不同词汇与大脑相应处理区域相对应;信号空间中具有相似特征的信号被反映到脑皮层相近区域时,大致保留了信号空间中的概率分布特征和拓扑结构特征,即大脑有自动归类的功能。
语言的特征提取需具备特征的完全性和区分性两个要素,通过训练学习获得语义和概念属性特征间的相互关系,短语和上下文的依赖关系,根据汉语句法和语义特征进行了相应的神经网络的文本分类实验,其概念特征的文本聚类结果与人脑的处理结果都基本吻合。
脑与语言认知(十四)
通过比较自组织聚类结果与人工分类结果,两者有很好的一致性,自组织聚类的一组或几组(图中的同一色代表一组)对应于人工分类的一类。
我们的实验结果表明自组织映射能够应用于大规模的文本聚类,当选用概念特征时达到了很好的聚类效果,聚类性能要好于词性和语法特征。
脑科学研究表明:许多低层次的神经元权值结构是预先排列好的,而高层次神经元的权值结构是通过竞争与合作机制构成的由自组织学习形成的,人是通过“学习---实践---再学习---再实践”的有监督的主动学习模式来认识客观事务的,我们将自组织学习与反馈学习策略引入到文本分类中来。
借鉴人脑的认知过程,将自组织学习与反馈学习策略引入到文本分类中来,将分类系统扩展为“训练---分类---反馈---学习”的模式,由异构网络通过无监督的训练和有监督的训练完成。
通过反馈对传网络学习来完善模式的训练,选择有价值的分类结果,根据其结果来反馈调整分类模型的参数,从而提高系统的分类性能,产生正确的分类结果,网络的异构性使它更接近人脑,反映了脑认知的过程。
语用学研究
从自然语言理解的角度看:句法学是研究句中各单词间的关系(语法词典:北京大学语法信息词典);语义学是研究词以及所指内容间的关系(语义词典:董振东先生的HowNet,梅家驹先生的同义词词林、普林斯顿大学的WordNet等);语用学是研究交互双方所涉及的上下文环境、背景知识、世界知识和历史知识。
在过去的几十年里几乎都是用句法和语义信息进行自然语言理解的,而语用知识是人类理解自然语言不可或缺的重要组成部分。
在语用信息研究的瓶颈是如何用计算机进行有效的特征提取和知识表达,这一挑战性工作一直困扰着我们。
要准确理解自然语言,需要把句法分析和语义理解与具体语境的语用信息相结合。
语用特征的形式化研究是应用现代数学方法和数学模型对语用特征进行形式化分析的一门新兴的边缘学科。
20世纪60-70年代,美国学者蒙太格首次对自然语言理解过程中的语用推理作了初步的形式化描述,开创了语用形式化研究。
随后R.H.Thomason第一次使用了“形式语用学”这一术语,而其后的学者也大多是在数理逻辑的框架上开展相应的研究。
今年来计算语言学的主流研究方法越来越倾向于基于统计的语料库研究。
然而在语用层面的研究还比较少见,其主要原因是缺乏适用于语用研究的较大规模的语料库。
适合于语用研究的语料库:美国安然公司158位高管的619446份电子邮件,形成安然电子邮件语料库。(Enro Corpus,www.cs.cmu.edu/~enron/)
安然语料库反应出一庞大而真实可信的商业组织内部珍贵而丰富的通信记录,包括大量的个体与群体间的交互信息、知识、感知、资源、任务、事件及其相互关系等社会网络数据。
McCanllum等提出“发件人---收件人---主题”(Author-Receipt-Topic,ART)模型,通过对安然语料库的统计总结出什么样的人通常交流什么样的问题来研究邮件内容与收发件人之间的关系;
即:中国俗语中有“什么人说什么话”的说法,在邮件内容和邮件作者之间建立联系。
近几年来,脑神经科学家借鉴脑神经成像对自然语言进行探索,开展了脑认知的语义、语用学的脑区分布研究,如图9所示的证据表明人确实是由不同脑区负责处理语义、语用和句法信息的。
与人类理解语言相比,由于缺乏与背景知识相关的语用信息或语义与语用相结合的信息使得计算机完全理解自然语言还有较大的差距。
不同语言信息由左颞下皮层/梭状皮层负责处理,说明该脑区在处理与理解句子的意义时扮演关键的角色。为了判断句子的合理性,大脑首先经语义信息分析,然后经过右颞脑区进行语用信息的分析。
研究显示左脑对于大多数语言的经典语言区占主导地位,右脑则参与了叙事建构、话语表征、言语反讽、隐喻以及预测和连贯性的推论等相关处理。
实验表明,语法判断是由Broca区和左额叶区完成的,右脑在语用中扮演了重要角色,包括情感、压力和非字面话语的理解。
涉及语用的世界知识在大脑中的激活区与语义和句法区是分开的,这说明语言形式和更负责的因果关系、社会因素等语用信息分别属于两个不同的模块,语用和语言形式间存在着功能的分离。
大脑的语言处理系统由一组功能性对独立的认知模块构成,各自作为一个整体执行对语言的解码与推理。
其过程是反应迅速的输入模块从外界获取信息,形成知识的最初感知和印象,然后进行更高级的分析推理,通过背景知识和逻辑推理,完成对自然语言的理解。
自然语言的歧义现象是普遍存在的,口语会话是实现交互双方交流目的的主要手段,具有即时性和交互性的特点,具体的会话交际过程总是在特定的背景条件下进行的,即:
人们总是根据会话的背景信息(如时间、地点、场合、交互对象等);常识性知识、会话的主题、手势信息(面部表情、肢体动作)、交互的情绪(谈话心境、气氛、语调、停顿、重音等)、会话双方的熟悉程度、心理状态、双方的身份信息(教育程度、职业等)、性别年龄信息(经验、经历)及彼此之间的关系、社会文化(思想意识、风土习惯、宗教信仰与社会的认知行为方式等);背景、语言背景、交流的目的动机、会话的上下文信息等语用信息才能有效地交流,这类信息直接影响着交际双方对话语的理解和表达。
因此仅靠句法、语义信息进行分析是不能完全理解会话内容的,需利用句法、语义分析将话语的字面含义与常识性知识、特定语境及个人知识、经历、经验等相关结合起来,来帮助理解会话的内容,达到相互理解对方意图的目的。
语用背景信息对于补充句法、语义分析的不足,补充词语、句子的省略信息,解除语言的模糊性具有不可或缺的作用。语用知识的挖掘不仅可以提高信息交互特征提取的有效性,其本身也是文本挖掘的重要研究课题。
情景对话语料的句型分布统计
我们从清华留学生的1895段情景对话(共31180句会话,会话内容分为20个主题类,分别为购物、看病、用餐、银行等场景的会话)。
我们从中选出6类对话,每类40类(共240段)情景会话对其进行统计分析。
实验的句法分析采用Stanford Lexicalized Parser v1.6.6,运行环境为Unix操作系统,运行Chinese Factored.ser.gz语法模块,采用结合依存语言和非词汇化概率上下文无关文法(unlexicalize PCFG)的因子模型(factored modal),以最优化词汇化的上下文无关文法进行句法树的分析。
句法分析器首先采用因子模型进行分析,对分析失败的句子返回上下文无关文法(PCFG)并进行分析。其中,因子模型分析失败的句子基本为一个汉字或词,如“啊?”,“什么?”等。
任何语言的句子是无限的,但句型是有限的,我们可以统计出口语对话中的常用句型,研究其分布规律。操作如下:1、按句子类别分别进行句型统计,统计出频率大于3的完全相同的句型。2、找出对应句型的典型例句。
实验结果分析
实验统计结果:6类对话的平均句长均在8个汉语词/句左右,句长较短。这是一明显的口语特征,且句长长短不均,灵活性很高,这也给句型统计造成了很大的困难。
如,本实验统计完全相同的句型,结果多为“好的”,“谢谢”这样的短句,而长句很难完全相同:又如,“欢迎光临”这句话的出现频率较高,而在有的对话中以“!”断句,有的对话中出现的形式是“欢迎光临,你们几位?”
句型统计分析:统计结果表明:句型(IP(VP(VV))(PU))出现的频率最高,共出现了227次,是除B类外,其他类别对话句子中出现频率最高的句型,该句型的典型句子是“您好!”,“谢谢!”。此外,在每个类别中,结合语义,有能够体现该主题特征的典型句型,这些句型的出现频率往往仅次于上一条所提到的最高频句型。如:
脑与语言认知(十五)
汉语口语情景会话语料的特点分析
正常的语言交流总离不开特定的语境,即交际的场合、会话的主题、交互对象以及上下文信息。
为了能够有效地交流,对同一语言可能的多义对象借助语境来给出话语的特定解。
需与语用背景知识相结合,通过上下文语境来补充信息,需用相关的语用信息存托出其具体含义,归纳如下:
1、特定的语境使笼统意义的词句精确化、具体化。例如:“好像没有了”,在不同的语境条件下包含完全不同的内涵;在餐馆食客订餐已订的差不多了,服务员问是否还需要其他的餐饮,食客用该句回答的意思是“不需要其他餐饮”;
在留学生两人共用的公寓里,一个室友问是否需买卫生纸,另一位用该句回答的意思是“没有卫生纸了”;
患者在医院向医生描述完病情,医生问是否还有其他病灶反应,患者用该句回答的意思是“没有其他病灶了”。因此,同样一句话,听者必须通过上下文语境才能正确理解其真实含义。
2、语境可解释暗指,获得反语、隐喻的形象意义。
如,女生跟男友去约会,她特地穿了一件漂亮的新时装,男友看到她时,面露微笑说:“你看起来太美了”,女友听了娇滴滴地回答:“你真讨厌”(或“你真坏”),其真实含义是反语:害羞、开心、喜欢对方的意思。
3、语境可消除同音词的歧义:很多汉语同音词的歧义在形成语句的过程中,随着上下文信息、会话的主题及会话场景和常识性知识的综合运用在字组词,词组句的过程中会对会话的内容进行逐步筛选、歧义会逐步消失,达到逐步消歧的过程。
如:Sheng Yu是个多音词,只有通过上下文语境才可确定相应的汉语词。如剩余、生于、胜于、生育、声誉。消除这些汉语同音词的歧义,只有通过特定的语境,结合上下文才能理解其含义,但这些词对应的英语发音是很容易区分的。
4、语境可消除多义词句的歧义。如留学生常说:”这事小儿科“,在遇到学习或考试中的问题时,指很容易解决的问题;而在父母带婴儿患者在医院看病时,指该病灶找儿科医生。
又如:”来电“,指来了电话或电报;也可指教室线路坏了,修复后来电了;还可以指帅哥美女见面时似目对视,一件钟情时刻的美妙反应。
再如:”解冻“,食客在餐馆与服务员的对话,食客点菜要解冻的三文鱼生鱼片;或顾客在银行与银行职员的对话中询问有关存款解冻情况;或被告在法院向法官询问有关财产解冻的情况。因此即使同样的词,会话的语境场合不同含义也不同。
5、多义词根据职业场景排除歧义:如:拿”拍子“,从事体育职业的会话通常指”兵乓球(网球、羽毛球)拍子“,从事清洁卫生职业的会话指”苍蝇拍子“,而从事音乐职业的会话通常指音乐节拍。
有些”老中青“的形容词也与职业有很大关系,如:在体育界30岁就算老运动员了,而对于科学家或高校教师30岁(取得博士学位刚参加工作)只能是青年科学家或青年教师。
6、根据社会文化背景排除歧义:同一个词或句子在不同的文化语境下可以有截然不同的含义,同一个词或句子即使在同样的语境下,对于不同文化背景的人也可能有不同的理解,语境有助于消除歧义。
如:一位来自东欧的女留学生在其硕士论文的致谢中写道:感谢我的先生XXX教授在三年硕士论文期间给予的论文指导,在东欧文化中”先生“是指”老师“,而中国文化中某女士的先生是指”老公“的意思,文化背景不同,含义完全不一样。
7、推断省略意义:在特定的语境中,为了避免重复,将某些语言信息进行了省略,这样产生的歧义而造成听者的理解困难,听着需通过语用信息消解歧义,当交流困难时可通过互动、提示、即时的信息补充达到交流的目的。
9、会话主题的转变:话题转换时的语境可能会发生变化,在一个主题之内和不同主题之间,认知语境会不断地进行调整变化。利用前后话语间的逻辑关系,对于主题内容不连贯的话语或省略的话语,听着需结合会话的语用知识和上下文信息进行推理,填补话语中的空缺信息,建立起连贯的内容,从而不准确地了解会话的含义,使交际双方可以达到有效地交流。
1990年,南加州大学将语用学知识用于自然语言生成;国内对语用信息的积极有意义的尝试是在上世纪90年代末开始的,将情感信息用于语音合成的研究(研究单位包括清华大学、中科院计算所、自动化所和哈工大等),McCallum等提出”发件人---收件人--主题“(Author---Receipt---Topic,ART)模型。
通过对安然语料库的统计总结出什么样的人通常交流什么样的问题来研究邮件内容与收发件人之间的关系,在邮件内容和邮件作者之间建立联系,侧重于邮件的语用特征(如交互双方的角色、职位、场所、时间、氛围、工作职责、业务范围等)的有效提取和利用。
以下这些类别的因素需要被考虑:谈话的氛围(物理性的设置);参与谈话的人的特点(学识,刊发,感情状态以及人际关系等)。
讲话者对于听众的目标(包括对听众未来行为、看法以及相关状态等等的影响)。
PAULINE中的语用研究:为了研究计算机语言产生与语用学之间的关系,需要一些明确的事物、对话设置和参与谈话人特点的刻画如下:
谈话氛围:时间---很多,一些,很少;语调---正式,非正式,喜庆的;环境----好的,嘈杂的;
讲话者:对话题的了解---专家,学生,新手;对话题的兴趣---高、低;对话题的看法---支持,中立,反对;感情状态---高兴,生气,冷静;
讲话人和听众关系:熟识程度---朋友、熟人、陌生人;社会身份关系---支配,平等,上下级;感情属性---喜欢,中性,不喜欢。
此外,还可以有以下的人际关系目标:对听众:影响听众的知识---教会听众,无所谓,让听众迷惑;影响他们对话题刊发---转换,不变,加强;把听众包含在谈话中---包含进来,不变,排斥;影响听众感情状态---使生气,不变,使冷静;影响听众目标---激发,不变,撤销;
双方关系:影响听众对话者的感情---崇敬,喜欢,不喜欢;影响二者之间的身份---支配,平等,上下级;影响人际关系距离---亲密,很近,疏远;
脑与语言认知(十六)
修饰方面的目标
使用以下一些风格的修饰目标:
正式性(夸张的,正常的,口语的)
简单性(简单,正常,复杂)
胆怯程度(胆小的,鲁莽的)
偏爱程度(公正的,含蓄的,清晰的)
细节程度(只有细节,描述解释,二者都有)
匆忙程序(被迫的,没有计划的,部分计划的,有计划的)
说服性(有说服力的,正常的,无力的)
华丽程度(干枯的,正常的,华丽的):华丽的文字含有非同寻常的辞藻
丰富性(只有事实,带有例子和谚语等)
思维开放性(思维狭窄,思维开放)
尊敬程度(傲慢的,尊敬的,正常的,哄骗的)
语用时代的形式语义学
两个相关的观点:一、对形式语义学的理解,不应当是试图用一种单一的模式(一种把世界看作统一整体的宏大观点)来解释自然语言,而是涉及到许多不同的模型(一一对应不同的情形,或者说,是现实的一些小片段);二、以上观点能更好地说明语用学与语义学间的联系,也更适应于形式语义学在普遍意义上的“理解”中所扮演的角色。
首先,将通过实践来说明,许多模型是以最简单、自然的方式对自然语言给出形式上的对应;
其次,将从逻辑上来证明一个包罗万象的大模型在逻辑上就是不可实现的;
最后,将给出理论上的支持来说明这样来理解形式语义学是非常自然并且富有成效地与实用主义理论和事实相符的。
让我们来进一步讨论所谓“Sorites悖论”。它的标准陈述如下:
1、一颗麦粒不是“一堆”。
2、如果n颗麦粒不是“一堆”,那么n+1颗也不是。
3、所以(经过归纳推理),对任意自然树n,n颗麦粒不能构成“一堆”麦子。即,“一堆麦子”是不存在的。
条件1和2看起来是没有问题的,其中涉及的归纳过程也是最简单的数学归纳,但是结论3却令人难以接受。这是为什么?
让我们回到“一堆麦粒”的问题,显然,n+1颗麦粒是在n颗麦粒上加上一颗。假设对于任意n,存在一个有n颗麦粒的组别。那么1和2推至3的归纳是显然的。所以:我们要么推翻1(认为一颗也是一堆);要么推翻2(认为一颗麦子能导致根本性差异);要么接受3(没有什么东西是一堆的)。
原因:我们缺少从几颗到无数颗的量化描述的词汇。就像我们的科学家使用比喻性词汇向普通读者或观众描述微观世界或宇宙宏观世界的科学新发现、新事物时感到描述词汇的匮乏一样。
加上事物的阐述者是该领域的专家,对该事物的背景知识可能远多于普遍读者或观众,致使普通读者对被描述的事物认识不清或产生误解。
机器翻译至今未能得到满意的解决也是由于两种语言的词汇不是一一对应的关系,语法关系不是一一对应的,社会文化意识也不是一一对应的。
两种语言都是由有限的词汇去描述无限的事物,但由于两种语言所依赖的社会文化习俗的差别和生活环境、思想意识、宗教信仰等的不同,造成对世界上所发生事物的认识上的差别,按内容等值的观点建立的两种语言的词汇对应关系只能是一种近似的对应。
每种语言的词汇与词汇所表达的内容之间是一对多(一词多义,即多义词),多对一(多个词表达同一含义,即同一词)的关系,加上两种语言在字组词、词组句、句组段落乃至篇章的过程中存在着大量的歧异。
因此在计算机中尚未建立机器表示的大量的人类各种知识之前,达到完美的机器翻译几乎是不可能的,人机会话也是如此。
基于脑人知机理的对话模型建模
1、人类的知识
人类的大脑和发音器官的生理结构是具备语言能力的先决条件,语言并非天生,是人类从远古经过长期进化而来,人类可通过后天学习各种语言。
人类的知识是通过记载的文字、音像及自身的经历,经学习、训练、归纳、总结、从具体到抽象、从实践到理论逐步积累、逐步完善而形成的。这种知识可归类为个体的特殊经历(体验)和普遍性世界知识两种形式。
人类的知识
由于每个人的个体经历的不同,使每个人对外界事物的认知和观察角度是不一样的,体现为人的个性。
但人类的生存方式是群居性的,需要通过语言进行社会交流,因此语言具有社会属性,体现为共性。
人类通过交流可传播知识,增加人类的共识,增强凝聚力和创造力,是个性认知向共识趋同的过程。
远古时期以前人类与其它动物一样仅有随父母及同族类学到的一些生存经验,几乎没有什么知识积累。随着人类语言的出现,人类大脑与语言得到了共同的进化。
人类的普遍性知识是每个个体经历通过交流使得不同社区、不同社会文化背景的人对事物的认知逐步达成共识。
如果人类的认知没有共性,交流就没法进行。这种普遍性知识由于语言文字的可记录性,使人类的知识从远古逐步得到积累到今天,经过去粗取精、去伪存真而形成的,语言是人类知识从远古积累至今的必要条件。
人脑对会话理解的机理
人脑中存储着过去的经历、世界文化知识、语言知识和会话的语用背景知识,外界刺激可以将它激活。脑神经成像的研究表明:人类在会话过程中,将获得的新事物、新概念的信息和原有的概念系统相联系,调用大脑中已存在的知识,并与过去的经历进行对比。
在交互过程中通过自身的感官(视觉、听觉、触觉、嗅觉、味觉)并利用人脑中已储备的语用背景知识,通过上下文信息推断理解说话人的实际意图。
在对话过程中,颞叶的听觉信息处理脑区对讲话人音调、语调、语速、重音等声音特征信息及会话场所的背景声音进行声音处理,通过韦内卡区进行话语理解后将有关表达的信息通过布洛卡区,经过交互双方通过眼睛将讲话人的手势、肢体表达、面部表情以及场景的视觉信息映射到镇业的事觉信息处理脑区进行相应的视觉处理。
当提及相识的某人或共知的某事时,交互双方就会将记忆中的关于该人的面貌、性格、体征、职业、处事方式等或共知某事的相关背景信息传送到人脑相关分析处理的脑区将这些信息综合起来帮助语言对话的理解处理。
闭环反馈对话交互模型
人类的会话交流包含着两个心理过程,一个是话语的发出者根据意图大意组织词语形成句子的过程,另一个是听者根据语用背景一边接受词语,一边形成意义实现理解的过程。
从人对会话的理解过程来看,它是一个循序渐进的信息组合过程,说话者在讲话开始就提供了话题的起始信息内容,它使听者对某些话语产生一种先后有序的感知,通过形成假设及验证假设两个阶段完成交流。
说话者说的话,经过说话人自身耳朵的听觉反馈,经过大脑的识别理解后得到一组信息,并在大脑中与原信息(想法、语法、语义、语用知识)进行比较、形成反馈知识,指导说出下面的语言。
听者形成听觉系统获得初始化信息(听到一些话,得到背景知识和上下文相关的信息)得到启发后,将驱动语言生成机能进行自然语言的预测生成,推导得出语言含义,理解话语的意图。
在人的自然语言理解过程中,识别理解是在相应的语用情景知识下完成的,在识别理解的同步过程中,存在着语言的预测生成过程,预测生成的结果一方面启发和引导识别理解的进程,另一方面又受识别理解进程的约束和推动,从而形成一个闭环的反馈结构。
脑与语言认知(十七)
灵长类动物的语言认知及语言进化
不会讲话,只能发出少量声音,但大猩猩会识别符号语言。
Charles Darwin在1872年用《人类的由来》抹去了人类与自然的边界。对于似乎只有人所具有的语音、智能、甚至宗教和道德规范,由“初级的”和“愚蠢的”非人类动物进化而来,例如灵长类中负责的呼叫系统(语音“,各物种展现的解决问题的技能(智能)。。。
人类学所坚持的在人类和自然之间的后达尔文边界---虽然是经验主义的,但基本上的”实在说“。
只有人类使用语言,只有人类使用工具。但是,可以教黑猩猩和大猩猩使用美式符号语言。猩猩也发现制造和使用工具一如:改良的粘住”鱼“的工具。
达尔文的理论:由自然选择进化(盲目变化和保持选择)。
1、所有生物的遗传结构特征要经受随机变化。2、在特定环境下为了生存,某些变化将比其他的更有用,并将增加有机体继续生存和繁殖的机会。3、任何环境将有限的资源来支撑活着的群体,而有机体将趋向于超越这些资源能支持的繁殖。4、为生存和遗传而”选择“变化,必定是为生存而努力。
观察支持达尔文的观点:
1、地址模式揭示了地球比以前认为的要古老得多,对于像自然选择的渐进过程是足够古老的。2、化石记录表明无数的变种已经存在并已经灭绝,而许多目前的物种拥有祖先的形式。3、家养物种的人工选择揭示了运作的同样基本的过程。4、不同的动物和植物种类起源于在少数基本结构的基础上的非常微小的变化。5、在环境压力下反映差异的区别在形式上是相互孤立的。
大鼠的脑室系统,脑脊液在大脑半球的脑室中生成并流经脑干中心处一系列不成对的脑室,脑脊液通过小脑基底附近的小的缝隙,然后进入蛛网膜下腔后,被血液吸收。
史前脑外科手术的证据。距今7000多年历史的颅骨,显示出死者在活着时头颅被外科手术打开过的痕迹。箭头显示两处环钻术。
人类和黑猩猩智能比较,出生后处于劣势,在1岁后人类智能迅速发展,大猩猩停滞不前。
在孤儿院的儿童在其成长初期受贫乏不利的语言环境的长期负面影响。
人类婴儿在出生后的1个月内,对成年人的语音特征是有反应的。音阶和音素都能识别。
因此,早期生长于语言环境的有利影响也很有可能在试图教导动物语言中得到证实。
Washoe研究计划是首次尝试教导黑猩猩手语。 Washoe在大约11个月时开始学习美式手语(Ameslan),在51个月中她学会了132种美式手语手势,并以此作为发展研究中可靠使用的依据。
Fouts指出,有一个叫Salome的女婴在其4个月大时使用了表达食物意义的手势。而黑猩猩使用其第一个手势的年龄似乎早于人类的第一个词语,但是与出现于人类的第一个手势相比此年龄差异并不大。有来自父母的报道,对于易受手语的儿童其第一个手势语常出现在5-6个月大时。手势有可能比说话来得简单,也许对父母来说,辨别婴儿模糊的手势比辨别其模糊的口语更简单。
语言、命名和概念
手的使用是黑猩猩行为中的显著特征,无论是野生的还是人类饲养的黑猩猩,都有丰富的手势语言。相反,教导黑猩猩Viki说话被证明是徒劳的,口语并不适合于这一物种。
黑猩猩Viki在6年的集中训练中只学会发出4个非常类似英语单词的音。通过比较Gardners对Washoe的努力结果是惊人之举。而当Washoe大约4岁时,她已经学会了做出可靠的80种以上不同手势。
与动物不同的是,一种特征是人类行为的说话方式更加分离或与引起他们的外在刺激关系甚微,这也是人类行为的普遍特征。另一个特征是人类的逻辑语言,依赖于将外界事物分析成块,在不同的句子中形成不同的组合。
相反,动物使用完整的表达方式,并不会分离并重新组合来形成新的讯息。
在探索人类形成其说话方式与人类大脑一般的运作方式的关联时,行为和逻辑成分都扮演着不可或缺的角色。
儿童的语言
1)3岁的儿童已经可以形成句子概念的证据,包含对句子语法关系的理解。儿童不仅能清楚地了解这些含意,而且能很好地将其应用于自身的语言中。
2)3岁左右的儿童似乎能成熟地用多种基本句型表达意思。他们不仅会提出要求和命令,还会否定提议和提出无数的问题。儿童在早期的语言发展阶段,似乎就已具有原始的发问和否定的能力。
3)3岁的儿童能分门别类地组织自己的词汇,在某些方面类似于成人语言范畴。这些词汇依据语法规则组成句子,而不是无序地命名。
人类习惯于将外界事物分离并命名,这预示并依赖于更多基本的行为,即将外界事物分析为截然不同的部分并视为独立的个体进行处理。在认知语句的结构中,暗含着将外部世界的观点看作可分离的,保持其自身的本质,从而在人脑中可以被单独地处理、组合,因此即使是动作和属性都可以具体化成词汇。
预测首先将外在事物分析成各个分离的部分,之后才将这些部分重新组合并造新句。
脑与语言认知(十八)
猿类与语言能力前的儿童的手势:相似还是不同?
大多数对于动物之间交流的研究提供的证据显示,手势信号在非人类灵长类动物的交际上扮演着十分重要的角色,在某些重要方式上对于语言能力前的阶段和语言发展阶段的人类婴儿来说也是如此。
手势技能:手势可根据其主要感官形式的功能进行分类:听觉、触觉和视觉手势。听觉主要依赖生成(虽然它们也有大量的视觉成分),触觉主要取决于与接受者肢体上的接触,而视觉手势仅靠视觉讯息。
Tomasello等人调查关养的黑猩猩的手势技能发展,发现1岁的黑猩猩会使用12种不同的手势,在3岁时达到了顶峰19种手势。在此基础上,手势的数量是稳定的,有些会被其他手势取代,比如说,哺育的手势逐渐消失,而竞争和求偶的手势变得更为突出。
关于黑猩猩的手势序列,Liebal等人表示序列的长度会随年龄增长而缩短,成年猩猩最短而年青的猩猩最长。关于大猩猩的手势发展,Pika等人发现在3岁时手势序列的平均数量为18.5,在4岁时增加到24,但到5-6岁时又减少到20.6。
指示性的手势常常是三元的,包含了信号发出者、接受者和第三方实体或事件。指示性手势(例如发出命令)可见于关养猩猩与人类实验者的互动中。
猿类使用指示性手势,包括发出命令或是与人类实验者、看管员的陈述性手势。此外,猿类在与其同类自然交流时也使用命令的、指示的手势。
要求清洁或食物,或提供食物给其他个体,这些手势很明显是三元的。然而,人类儿童在掌握语言之前使用手势进行初级交流尝试时,同时涵盖了二元的和三元的。
猿类不对称的布洛卡区:猿脑中--区域与人类--语言区域惊人地相似。
布罗德曼44区描绘了人脑额下回区域内的部分布洛卡区,是语言生成的一个关键区域,大脑左半球的布罗德曼44区比右半球的大,这种不对称与左半球的语言优势相关。
特定物种的呼叫激活短尾猿脑中与布洛卡区和威尔尼克区相应的区域:利用正电子发射断层扫描术,可识别恒河猴的神经系统与感知特定物种的发声是有关联的。这些发声在人脑外侧裂语言区的相应区域引起特定的大脑活动。虽然在独立的灵长类动物种群中平行进化是可行的,但该发现提出了另外一种可能性,即生活在两千五百万至三千万年前的短尾猿和人类最后的共同祖先,有可能具有在语言进化中能够使人类产生其他适应特性的关键的神经机制。
特定物种的呼叫和非生命体刺激都与颞上回相同模式活跃性相关联:特定物种的发声在颞上回得出的活跃性增强是被限制在外侧裂皮层后部的颞顶细胞结构区和颞顶枕交界区。这些发声也是引起其他外侧裂区活跃性增加,包括额叶皮层的腹外侧部分和后顶叶皮层。
脑与语言认知(十九)
猴脑中的声音识别区域:
对于那些能够发声的动物,识别特定物种的发声对于其生存和种群交往是很重要的。在人类的大脑中已经确认出一个对人类嗓音和发声十分敏感的声音识别区域。
通过对短尾猴(旧大陆猴、恒河猴)进行功能磁共振成像分析发现了一个高级听觉区域,识别特定物种的声音优于识别一般的其他声音。此区域不仅对不同物种的“声音”很敏感,而且能够识别同物种的不同个体的声音,猴子的这个声音区域位于颞上平面并且属于前部“What"听觉通路。这些结果的发现与人类声音识别区域有着紧密的功能性联系。
人类的嗓音是一种包含人类声特征的声音,具备丰富的人类声音特征,这些特征有助于许多声音识别能力的发挥。例如,我们能从其他声音或发声中区别出人类发出的声音,能够区别不同说话人的声音并且能识别出我们认识的人的声音。
一个对声音相对敏感的闹区在功能成像中被发现,这个区域位于颞叶的前部,上颞沟的上部。相比其他动物的发声,这一区域已显示,对听觉调节和自然声音而言更容易辨识人类声音和发音。
研究发现有几个猴脑区,和其他大量的动物声音和发声相比,它们对具体物种的发音有着更加清晰的反应。在这一系列的区域当中,只有一个,即一高级听觉区域在整个实验和所有的动物中能被稳定地观察到,将该区确认为是一个候选猴脑声区。
另外的实验建立了与已知的人类声区的更进一步的功能关系。首先,当用一组熟悉的声音(包括熟悉的同种动物的发声)测试时,该候选猴脑声区为短尾猴发声保持其优先选择。第二,仅仅该前区的猴脑声区对同物种个体声音的辨识显示出选择性。
更高的基因表达水平使人类大脑与非人类灵长类动物的大脑相区别:
在人类和黑猩猩的大脑皮层之间识别出了169个显示出表达差异的基因,同时短尾猴的91个基因可以被归结在人类的血统之中。令人惊奇的是,人类与非人类灵长类动物大脑之间的大多数差异是与正向调节有关的,大约有90%的基因在人类大脑中被更高度地表达。
相比之下,人类和黑猩猩的心脏与肝脏的正向调节基因和下降调节基因的数量几乎是相同的。结果表示,人类大脑与非人类灵长类动物的大脑相比,显示出了一种与众不同的基因表达模式,这种表达模式包含了很多属于各种功能类别的较高表达水平的基因,这些基因所增强的表达水平能够为人类大脑生理学与脑部功能的广泛改进提供基础,也暗示了人类大脑的特点在于更高水平的神经元活动。
低聚核苷酸阵列杂交信号的层次聚类使人类、黑猩猩和恒河猴的样本分隔成离散组。与人类和恒河猴(r=0785)、黑猩猩和恒河猴(r=0817)相比,人类和黑猩猩彼此更加相似(r=0.900)。这些关系很好地印证了已知的系统进化,并且反映了在物种之间基因表达谱和核苷酸序列的分歧。
大脑区别人类和非人类语法:功能的区域化和结构的连通性。人类语言能力据称是基于处理层次构造序列的能力。人类的这种能力超越了非人类灵长类动物处理简单的临近元素的转移概率序列的能力。
人类语言能力的核心部分是语音和语义的相互作用的语法规则系统,称为句法。该系统使人类可以产生并理解无限数量的句子,即词汇的不同组合。
脑与语言认知(二十)
句子中词的重新排列和置换关键是由语法规则系统中的层次结构决定的。人类的语言能力曾被论证为给予处理递归结构的能力。
结果表明,非人类灵长类动物使用一种可学习的语法,由有限状态语法(FSG)产生的序列转移依存关系的评估,会使系统发育上更古老的一块皮层--岛盖额部活动起来。相比之下,人类语言使用的语法,根据短语结构语法(PSG)产生的序列层次依存关系的计算会使动物种类史上更年轻的额外补充的一块皮层--布洛卡区(BA44/45)活动起来。
总之,处理句法的层次和递归是人类语言至关重要的一个方面。研究指出了一种关于序列计算的进化轨迹,就后出现的布洛卡区,从处理简单可能性到计算机层次结构,在动物种类史上布洛卡皮区更年轻于额岛盖部,额岛盖部的脑区涉及序列的转移概率的处理。
在话语获取进程中,孩子们通常会在一个新词语第一次出现之后,就对它的含义形成迅速和粗略的猜想--这种过程被称为“快速映射”。
博得牧羊犬Rico,能够进行快速映射记住超过200个不同物品的标记。它能够通过排出学习法来推断出新物品的名字,并且在第一次看到新物品仅仅4周后就能准确地拿取这些物品。
快速映射也发现于其他动物中用于一般的学习和记忆的机制,而不是人类特有的语言获取机制。
从2岁起,典型的说英语的孩子每天将10个新单词添加到他们的词库中,直到他们高中毕业时,他们平均能够掌握60000个词的词汇量。
Rico能够记住超过200个物品的标记,大多数是儿童玩具和球类,并且能够依据指令准确地取回相应的物品。Rico早在10个月大的时候就被训练取物品,那时它的主人将3个不同的物品放在屋子的不同位置,并让这只狗取回其中一个。如果Rico取回正确的物品,那么他就会得到食物或陪主人玩耍作为奖励。
Rico的“词汇量大小”可以和受过语言训练的猩猩、海豚、海狮和鹦鹉相比。
孩子们显然从很小开始就在词语意义方面比Rico有着更广泛的知识,而且他们可以区分词语间的不同功能,例如:动词、形容词和专有名词。
孩子们能够有效地使用新学到的词语,也就是说,他们能够由快速映射说出所确定词语的意思。
狗能不能学语言?孩子的单词学习能力很强,他们能从无意中听到的话语中学到词语,甚至没有人想要教他们。
相比来讲,Rico只能通过特殊的取东西的游戏来学习。孩子们能通过语境理解其中的词语;Rico对词语的理解显然是通过它取回物品的行为体现。
FOXP2基因与语音及语言的神经解剖学的关系:语音和语言是人类大脑先天的能力这一观点已被长期广泛地接受了,但是最近,通过这些非凡才能的基因基础的切入点被找到了。
脑与语言认知(二十一)
KE家族中氨基酸的替代作用导致了FOXP2基因的一复制体的功能缺失剩余的复制体对于大脑正常运转是不足的(单倍剂量不足),这就导致了语音和语言障碍。
不同人口表明本质上氨基酸序列没有变更,标志着现有的FOXP2基因序列在现代人类身上是固定。虽然自从人类和老鼠血统在7千万年前开始分歧时,很多和核苷酸变化在FOXP2基因中累积,只有3个变化中的2个(位置303上的苏氨酸变为天冬酰胺酸,位置325上的天冬酰胺酸变为丝氨酸)目前是人类所独有的,而黑猩猩、大猩猩或猩猩都没有。
从仿真的视角看词汇和句法的共同进化:一种是个体发生的出现,指的是婴儿为何从其环境中获取语言的过程;一种是系统发生的出现,则认为为何我们的物种,智人,从语言能力前的交流向我们今天使用的语言交流逐渐转变的过程。
关于语言的系统发生的出现,已经有两个著名的假说:天赋论、涌现论。天赋论相信人类的语言才能必定是由与生俱来的、特有的语言特征决定的。这种假说已经成为语言学领域中的教条。涌现论假定进化力驱使某些一般领域的特征采用到语言中,驱使语言的发展从原始形式变成现代复杂的、人类特有的形式。
关于句法起源,有两个值得注意的方案:
1、先天句法是一"引导“的方案,坚持认为一种完整的、起源于词汇的语言,是通过由一种先天句法调节词语搭配发展而来。这一方案遵循天赋论假设;
2、不带有先天句法的”公式化“的方案,它认为语言可能始于一整体的信号系统,在这个系统中一个信号在整体上表示一种意义,而不存在能够传达其内部或本身意义的子部件。那么,假定在发音(或话语)和含义中零星的反复出现的成分已引起了整体信号的分割(将较长的、具有完整意义的发音表达分割成为具有意义成分的子音节的结合)并且导致了共享句法结构的聚合。通过这种分割,合成的语言逐渐出现,其中信号的意义是其意义要素的一种功能结合。原始人类的认识系统也许不足以允许人类在经历环境事件时对于”行动的煽动者“或是”经历一种行动的承担者(entity)“产生清晰的概念。在那个阶段,原始人类交流系统中的信号一定由许多整体项(holistic items)组成,类似于在灵长类动物和诸如鸟的其他动物的交流系统中所发现的那些,尽管它们的性质可能是十分不同的。检测类似模式和给这些项排序是人类和其他动物共有的两种一般领域的能力,尽管这些能力的实际水平是不同的。例如,排序能力作为一种认知的预处置在语言能力前的婴儿和其他灵长类动物中已被证明。在人类领会合成的语义概念之后,可能会有一个发展的阶段,在这一阶段早期的原始人类开始检测到解码合成含义和偶然出现在整体信号中的递归模式,并且把这些模式分割成单词。在那之后,排序能力被用来调节这些词汇以表达复杂的含意,使确定的序列有可能成为惯例的、占统治地位的词序,即简单句法的涌现。
语言的计算和进化:语言是我们的遗产,是人类主要的进化的贡献,可能是过去的5亿年中出现的最有趣的显著特点。要理解达尔文进化如何引入人类语言,要求结合形式语言理论,学习理论和进化动力学。形式语言理论提供语言和语法的数学描述。学习理论使语言习得的任务正式化,它证明了没有可以学习无限集合的语言的机制。普遍语法指定了人脑可习得的语言受限集。进化动力学能阐明描述语言的文化进化和普遍语法的生物学进化。
生物学使用生成系统。基因组由四个核苷酸序列组成,如之一定的规则如何生产蛋白质和组织细胞,产生活的有机体的无限的多样性。直到最近,另一个生成系统才出现,导致了进化的新方式。该系统便是人类语言。它使我们实现个体间传递无限的非基因信息,并且引起文化的进化。
形式语言理论:语言学结构由根据一定规则组合起来的较小的单元组成。音素形成音节和词汇。词汇形成词组和语句。这样组合规则不是任意的。
任何英语为母语的人都承认句子:”He ran from there with his money“符合英语规则,而”He is money with there from ran"不符合。然而在孟加拉语(Bengali)中后者是正确的。
脑与语言认知(二十二)
什么是语言?一个字母表是包含有限数目的符号集。自然语言可能的字母表是所有音素的集合或者该语言所有词汇的集合。一个人获得不同水平的形式语言,但是数学原则是同样的。一句语句被定义为一串符号。所有关于二进制字母表的语句集合为{0,1,00,01,10,11,000,...}。有象整数一样多的无穷语句,所有语句的集合是“可数的”。一种语言就是一个语句集合。
什么是语法?一种语法规定一种语言的有限规则列表。一种语法往往按照“重写规则”表达:一个字符串可以重写为另一个字符串。在对重写规则反复应用后,最终字符串将仅仅包含字母表的元素。
乔姆斯基层级结构和普遍文法的逻辑必然性。有限状态文法是上下文无关语法的子集,上下文无关语法是上下文有关语法的子集,上下文有关语法是短语结构语法(它代表全部可能的语法)的子集。
自然语言比规则语言更有生命力。学习理论得出最重要的结论是没有程序能够学习语言的无限集,多数情况下,即使正则语言也无法学习。
人类大脑具有学习语言的程序,但只能学习语言的有限集。普遍文法则是关于这一有限集的理论。
自然语言的结构:自然语言的基本结构是树。如果超过一棵树能与特定的语句关联,那这个句子就有歧义。
学习理论:学习是归纳推理。学习者得到数据,推断出产生这些数据的规则。“学习”和“记忆”之间的差异在于对自己的经验之外的新境况的概括能力。
在语言背景中,孩子对以前不曾听到的新句子进行概括。任何人都能创造并理解不属于他以前语言上所经历的语句。
孩子通过听他们父母或者其他人说的文法语句来学习他们的本族语。从这种“环境输入”中,孩子建造对潜在语法的内部表示。
孩子未被告知语法规则。孩子和成年人都不曾知道规定他们自己语言的语法规则。
“语言习得”的矛盾论点是相同语言社区的孩子保证能够在长大后说相同的语言。提出的结论是孩子通过从一套首限的候选语法集中选择学习正确的语法。这种首先集合的“理论”是“普遍语法”(UG)。
语言习得有什么特别的地方?通常当我们学习生成系统的语法时,诸如国际象棋或者算术,有人告诉我们规则。我们没有通过看国际象棋比赛猜想国际象棋的玩法。这是一种重要的差异:如果学习者被告知了一种语言的语法,那么所有可计算的语言集合都可以通过记住其规则的算法实现是可习得的。
进化的语言理论:人类语言起源的中心问题是哪个基因修改导致对人类语言起决定性作用的大脑结构的改变。
脑与语言认知(二十三)
语言能力的开发与早期语言环境:100多年以来,科学界和教育界的人士都认为年龄对于语言学习的结果起到了关键性的作用。
Mayberry等指明,不论是耳聋的人,还是有听力能力的人,只要幼年时接触过语言,在以后学习一门新语言的时候,他们能表现得同样出色。
语言学习能力是由大脑发育早期的语言学习的得力初始状况(onset)所决定的,而与这种语言学习经历的具体形式无关。
测试分两组,他们都是在9岁到15岁之间在学校学校美式手语的,并且使用手语的时间都在20年以上。
第一组人(n=90)天生是有听力能力的,并且在早年学习过英语口语,但是后来他们由于感染病毒而造成重度耳聋(&=90分贝)之后学习了美式手语;
第二组人(n=9)天生就是重度耳聋,并且在接触学校开设的美式手语课之前几乎没有语言经历(即使带上助听器其听觉感知语音也几乎为零)。
早年生活中缺乏语言经历的耳聋成年人,在学习美式手语的过程中表现不佳;
相反,后来耳聋的成年人表现出了很好的手语学习能力。
接下来,Mayberry等研究了早年的手语学习经历是否会促进以后的口语学习。
Mayberry等测试了3组成年人,他们都在4岁到13岁之间在学校学习了英语,并且使用英语的时间都在12年以上。
第一组(n=14)天生就是重度耳聋,并且在接触美式手语之前几乎没有语言经历;
第二组(n=13)天上是重度耳聋,但在幼年时学习过美式手语;
第三组(n=13)出生时就有听觉能力,并且在幼年时学习过多种口语(乌尔都语(Urdu)法语、德语、意大利语或希腊语)。
结论:不论是耳聋的成年人,还是有听觉能力的成年人,只要早年学习过口语或者手语,在以后学习语言(英语)的时候都同样表现出很高的水平;然而,早年缺乏语言经历的耳聋成年人就表现很差了。
语言学习能力的提升来自于早期大脑开发与语言学习经历的协同作用;如果早年缺乏语言经历,这种学习能力就会遭到严重损害。
在人的成长过程中,早期语言学习时机的掌握对于一生的语言学习能力都有着强有力的影响,而早期语言学习的感觉运动形式对语言学习能力并没有影响。
早期语言习得:破译语言密码。婴儿学习语言很快,但是他们究竟是怎么做到的却仍是一个谜。新数据表明,婴儿在学习语言时,是运用计算策略来发现语言的数量和词汇节律的,这导致音素和词汇的发现。
与别人的社会交际影响语言的习得,正如某种意义上鸟类学习鸣叫时的交互影响一样。大脑对于过去遗传下来的统计和词汇节律的继承可能对解释长期存在的为何婴儿比成年人更好习得语言的难题有一定帮助。婴儿成功的学习,及对学习的约束,将会改变语言习得理论。
不论是“咿呀”学语6个月大的小孩还是到3岁时可以说完整一句话的儿童,小孩子们都毫不费力地迅速学习他们的母语,且不考虑文化沿着相同的路径发展。
婴儿一接触语言就运用人类特有的能力,将对节奏的侦察和计算能力(常被称为“统计性学习”)同特有的社会技巧融合起来。
语言是人们习得并贯穿一生都在使用的用于交流俄一种编码工具。婴儿认知的规则、学习词汇的方法、语言交际的社会环境以及长时间习得实体的记忆需要,很可能都会影响到语言的演变。
脑与语言认知(二十四)
美国人分辨两类声音时,把一系列/ra/音节听成了一些列/la/音节。
而当日本的听众被测试时,他们听不到任何在刺激方面的改变。所有声音被确认为同样的声音---日语的‘r'。
美国人对于/r/和/l/之间边界的声学差异最敏感。
话者的可变性:在大多数文化中,看管员这种言语跟婴儿和孩子沟通。与针对成年人的语音相比,针对婴儿的语速更慢,平均音调更高,有着夸张的音高升降曲线。
婴儿听到一系列的声音:一个被重复多次(标准的),另一个(异常的)只有试验的15%的出现率。每一刺激的响应都被记录下来。
记录7个月和11个月大的美国婴儿对母语和非母语的辅音对比的电生理学反应。一组,婴儿对非母语对比的ERP辨识响应在7个月大的时候出现,但11个月大的时候就消失了,与行为数据一致。
然而,当相同的婴儿在单独的ERP成分的基础上被分成子组,有证据表明,11个月大的婴儿大脑活动对非母语对比仍然敏感,在150-250ms(P响应器)辨识为正性或者在250-550ms(N响应器)辨识为负性。
两个子组中11个月大的婴儿都增加了对母语辅音对比的响应。
脑与语言认知(二十五)
儿童在语言的神经处理中的性别差异:女性语言能力一般比男性好。2~3岁的儿童,女性的语言表现能力通常要优于男性。女孩更早开始说话,更快学到词汇,并且表现出更多的自发语言。这个谜一直悬而未决。
对两种形式词汇的两种语言任务的测试证实了儿童(9~15)的性别差异。女孩的额下回(IFG)和颞上回(STG)的双边活性以及左梭状回(FG)的活性要大于男孩。
无论刺激的形式如何,女孩额下回和梭状回区域的活性与语言准确度有关,而男孩性能精确度的相关性则依赖于词汇出现的形式(听觉或视觉的相关皮层)。
女孩依赖于超模式的语言网络,而男孩则是通过视觉和听觉来处理词语。左梭状回区域的活性与标准化语言测试中女孩的更好表现有着密切关系,这也是早期语言性别差异的额外证据。
语言任务中的大脑活性与性别差异。在所有年龄性别组(黄色)同时兼顾语言判断任务和感觉形式的活性,但是女孩(粉色)比男孩(蓝色)在IFG和STG的双边区域以及左FG区域显示了明显更强的活性。图像数据源自于5个区域的感兴趣区分析,显示了显著的性别效果。
在非语言学上的感觉任务和性别影响期间的大脑活性。a:非语言视觉的激活显示在梭状回(FG)中女孩(粉色)具有更强的活性,男孩则没有在任何部位显示出更强的活性。b:非语言听觉的刺激显示女孩在额上回(STG)具有更强的活性。
a:在解释形式影响之后,女孩(粉色)对押韵和拼写任务的表达精确度显示与颞中回扩展到梭状回(MTG/FG)和额下回(IFG)的活性之间存在关系,而男孩则没有。b:在解释任务影响(押韵对比拼写)之后,男孩(蓝色)对听觉词汇刺激的活性则与颞上回(STG)和额下回(IFG)区域的表达精确度相关,而视觉词汇的刺激活性则与扩展到锲前叶的顶叶上小叶(SPL/PreCun)区域的表达精确度相关。而在女孩(粉色)当中,听觉词汇刺激的大脑活性与精确性的关联性在这些区域通常是区别于男孩与精确性的关联;虽然两者在额下回(IFG)和颞中回后部(pMTG)区域的重叠(青色)显而易见。然而,女孩对视觉词汇刺激引起的激活与语言判断无关的表达精度没有相互关联。
目的(Goal):在双语中调查母语(L1)和第二语言(L2)的脑皮层表现。
论述问题:多语言在脑中如何表达?L1和L2是在共同的区域还是在分离的区域?早说和晚说双语是同样模式吗?在Broca和Wernicke区域时同样模式吗?
图像技术:fMRI
受试者:6个“早期的”说双语的 - 在幼儿时同时获得两种语言。6个“晚期的”说双语的 - 接收L2在11岁,在19岁时达到流利的绘会话。任务:在L1和L2中无声句子产生(内在语音)。分析:L1和L2激活区交叠吗?测量L1和L2激活中心之间的距离。
一位“晚期”双语受试者(A)大脑的典型轴向切面图,无论红色(母语)还是黄色(第二习得语言)区域。活跃区的模式放大区,表明了两种语言对应的活跃区的质心(以“+”表示)是分离的。质心相距7.9mm。位于右上方的中间矢状图的绿线指明了平面位置。R代表大脑右侧。Broca区域:对L1和L2激活空间分离。
一位童年早期同时学习英语和土耳其语的“早期”双语受试者(G)大脑的典型轴向切面图,“早”说双语的Broca区域中L1和L2出现交叠。
Wernicke区域中L1和L2活动在一个共享的区域。
Kim等的研究结论:如果你早学第二语言,它能与你的母语在Broca区重叠。但如果你玩学第二语言,第二语言需找出它自己的空间。
可能的解释:大脑对于早学语言更有可塑性(plastic)神经元的许诺:一旦Broca区效忠于母语,它很难再被判它。
问题:如果L1和L2活动在不同区域,这意味着它们是被不同的处理吗?或被同样的神经元吗处理吗?双语习得者大脑结构的可塑性:第二语言的熟练程度和习得年龄对灰质密度的影响。
脑与语言认知(二十六)
人类具有学习多种语言的特殊能力---一种被认为是由大脑中的功能(而非结构)可塑性变化所调节的技巧。Mechelli等指出学习第二语言可以增加左顶下叶皮层的灰质密度;并且这一区域的结构重组程度是由习得第二语言时的年龄阶段与所达到的熟练程度来调整的。灰质密度与(第二语言学习)成绩之间的关系可以代表一种大脑组织的普遍法则。Mechelli等研究那些会说英语和意大利语两种语言的健康右利手的大脑结构的可塑性。为了测试双语习得者与单语习得者大脑中的灰质与白质密度的差异,召集了25个几乎没有或者根本没有接触过第二语言的单语习得者;25个"早期“双语习得者,他们在5岁之前就学习一门第二欧洲语言,并且从此之后经常使用这种第二语言;以及33个”晚期“双语习得者,他们在10到15岁之间学习过一门第二欧洲语言,并且有规律地使用这种第二语言的时间都在5年以上。
实验表明,双语习得者的顶下皮层的灰质密度比单语习得者要大。这种现象在左脑表现得很明显并且在右脑也表现出比较明显的趋势。尽管对于早期双语习得者与晚期双语习得者来说,顶下皮层的灰质密度都有增加,然而早期双语习得者左右大脑的密度增加程度要更大。
关于如何在一个大脑中处理两种语言的脑电位和功能磁共振成像的证据:精通双语的受试者设法理解和说出其中任何一种语言而不会受到另一种的明显干扰。神经影响表明,至少对精通双语的人来说,两种语言的神经解剖成像是重叠的。双语者是怎样避开语言间的干扰而将他们的注意力集中在目标语言上的呢?在西班牙语/英语的双语使用者的实验中,面对一张混合着西班牙语、英语和假词的列表时,拒绝非目标语言的单词与假词一样快。
功能磁共振成像表明,不管是只会一种语言的人,或者使用双语的人,在假词和加泰罗尼亚语之间,都没有显示出可靠的差异。被西班牙语单词激活的左初级运动皮层、左顶下叶和小脑的活性都可归因于运动相应。只有双语受试者在相应西班牙语单词刺激时才显示出对额下区后部的激活。
当在能说单语组和能说双语组之间的激活模式进行比较时表现明显。此脑区对阅读假词、语音处理和默读训练都是关键的,对加泰罗尼亚语(非目标)单词和假词两组都在更大程度上具有活性。
对于双语者大脑皮层的语言组织仍存在着争论。Chee等对24个能流利地说两种语言且都是右利手的人进行研究:其中15人在6岁前同时学习汉语普通话和英语;另外9人从幼年开始学习汉语普通语但直到12岁以后才接触英语。在两种语言中,额叶前部,颞叶和顶叶以及辅助运动区都显示出激活。
多数中风导致语言功能障碍的双语者或精通数种语言的病人在所有语言中显示出相同障碍,表明在L1和L2的脑皮质组织中存在共同的或显著的重叠。在法语和英语词汇中进行语言内和跨语言的词汇搜索时在左脑额部的共同区域显示出激活。
对某些语言有特殊的处理要求吗?对美式手语的处理除了经典的左脑半球激活之外,还与右脑半球的激活有关。相比而言,英语没有造成右脑半球激活;作者认为额外的激活可归因于对语言信息和视觉空间解码在颞叶同时存在。由于象形表意字构成的普遍话文本要求人们去记住每个字的语音体系和意义来发音并理解,它可能被认为需要与英语截然不同的处理资源。多种证据显示,早习得语言的人显示出更好的语言能力,所以L2的皮层组织可能受到习得时间的影响。Chee等的研究结果支持了在流利的普通话--英语双语者完成提示词的产生时,共同的脑皮层区被激活的假设。这无论对较早还是较晚习得第二语言的双语者来说都一样。这与根据最初接触L2的年龄也许造成L2的处理差异的观察并不矛盾。使用英语的人群,他们在如简单的加法这样的心算时依靠脑皮层的主要用于语言处理的左外侧裂皮层,而汉语使用者相反,在处理相同的问题时会运用大脑视觉---运动前区的联想网络。
Tang等的结果指明,不同的生物学数字编码可能由在语言习得和其他文化因素如数学学习策略和教育体制中的视觉阅读经验形成的,这是无法完全解释语言本身的差异。当面对一个简单的数学问题3+4=?时,两个二年级的学生,一个说中文,一个说英文,都会很快地得到正确答案。填上“7”这个答案证明了相同的视觉输入得到了相同的输出结果,这提出了一个有趣的实验性问题:这两个学生大脑的基本思考进程相同吗?
对于母语是中文和英文的两

我要回帖

更多关于 左脑与右脑的功能 的文章

 

随机推荐