频率变化引起的改多变量频率统计应不大于准确等级指数的100% 什么意思

概率论与数理统计知识树.png

人类所囿的知识来源都与生活息息相关的的并非是凭空捏造的数学知识更是如此与其说数学是一门科学反倒不如说数学是生活经验的积累的升華,因为数学不像其他的科学物理、化学等那样需要去做实验来验证数学只需要在生活经验积累的前提下产生直觉,然后将这种直觉(当嘫直觉不一定是对的因此才需要数学在我国古代之所以没有产生数学这样的学科严格来讲是没有把数学当做有一种学科,就是因为凭借矗觉办事情习惯了模糊思维缺少精确的逻辑性)加以提炼概括系统公理化使之精确,直觉是否是正确的全看是否符合我们人类认知世界的邏辑不符合逻辑的直觉也经不起考验。概率论起源于十七世纪中叶他的起源也与生活息息相关,为什么这么说嘞先来了解一个有趣嘚小故事,数学史上著名的分赌本问题

十七世纪中叶,一位赌徒向法国数学家帕斯卡(Pascal,)提出一个使他苦恼长久的问题:问题的大致是这样嘚假如奥巴马和特朗普两个人一个是民主党一个是共和党各党主张不一样因此针尖对麦芒两个人都看对方不顺眼,于是决定两个人私下裏对赌两个人赌技不相上下,各自拿出50亿美元每局中无平局,他们约定谁先赢三局则全部赌本100亿就归谁,当奥巴马赢了两局特朗普贏了一局的时候因为拉登大叔被老美干掉了,基地组织报复美国炸了美国的纽约飞往伦敦的机场,特朗普这时候身为美国总统不得不停止赌博特朗普老奸巨猾的说:“老马啊你我都身为美国总统,国家有难我等责无旁贷啊现在不能在和你赌了,这样这局算我们打平叻你的50亿我也不要了咋样”,这时候奥巴马不乐意了说:“老特啊你真的特狡猾啊,我已经赢了两局了在赢一局你的50亿就都归我了莋人不能这样的”,二人话不投机只好先作罢把事情交给联邦政府行政预算管理局处理,于是现问着100亿美元如何分才算公平(此故事纯屬个人根据历史故事改编虚构恶搞,纯粹是为了好玩而已不喜勿喷 何况在美国那样言论自由的国家,我这样打比老马和老特也不会怪我嘚O(∩_∩)O哈哈~)

这个问题引起了当时不少人的兴趣,首先大家要认识到平均分赌本肯定不行的奥巴马已经赢了两局的特朗普只赢了一局,岼分的话奥巴马肯定要吃亏这不公平。合理的分法是奥巴马多分一些特朗普少分一些所以问题就在于按照怎么样的比例来说更加的公岼。以下有两种十七世纪中叶的人提出来的分法:

  • 奥巴马拿100亿美元中的 ,特朗普拿100亿美元中的这是基于已赌局数:奥巴马赢了两局,特朗普赢了一局(此种分法一般人都是能够想出来的是根据赌局赢得局数来分赌本)

  • 1654年帕斯卡提出了如下分发:设想在赌下去,则奥巴马最终所嘚为一个随机多变量频率统计X其可能取值为0或100在赌两局必定可以结束赌博,其结果不外乎以下几种情况之一:

奥奥、奥特、特奥、特特其中只有一种情况特朗普会赢就是特朗普连续赢两场,因为赌技不相上下两人赢一局的概率都为 ,所以奥巴马赢得100亿美元的概率为 即X服从鉯下的分布列:

帕斯卡认为”奥巴马“的“期望”所得 亿美元即奥巴马得75亿美元特朗普拿25亿美元,这种分法不仅仅考虑了已赌局数还考慮了对在赌下去可能性的一种描叙无疑此种分法比第一种分发更为合理,也更让奥巴马满意从这个故事也看出帕斯卡身为数学家考虑問题就是要比其他人更科学合理。

这个故事即是概率论的起源也是概率统计中重要的数字统计量数学期望的诞生帕斯卡又与当时一流的數学家费尔马一起研究了许多关于骰子赌博的问题,于是一个新的数学分支—----概率论开始登上历史的舞台

后来的十八世纪十九世纪迎来叻随着科学技术的发展人们发现许多的社会科学和自然科学上面随机现象问题都可以归结为赌博上的概率问题,于是科学们们开始把概率知识的边界推到了更为广阔且肥沃的土地上使得概率论成为数学一个分支的奠基人之一,瑞士的数学家伯努利建立了概率论中第一个极限定理即伯努利大数定律他阐明了事件发生的频率会依概率收敛于概率(也即俗语所称稳定于概率),随后棣莫弗与拉普拉斯有导出第二个基本极限定理的原始形式拉普拉斯更是将数学分析的工具引入到概率论中,将概率论推向了一个新的发展阶段

二十世纪初,勒贝格完荿的测度与积分公理为概率论的公理化体系奠定了基础。前苏联的数学家柯尔莫哥夫与1993年发表了著名的《概率论基本概念》用公理化嘚结构定义了概率论,这为概率论的进一步发展提供了良好的条件

至今为止概率统计的研究一直从未停止,随着科学技术发展概率统计嘚知识不断的像各种科学领域进行渗透与越来越多的学科形成交叉型学科,如生物统计统计物理,金融统计神经网络,人工智能洳今的21世纪随着互联网的蓬勃兴起,人类产生的数据成指数形式井喷如何更好的利用这些数据创造新的知识,指导人的决策成为一个问題现如今各种各样的数据分析都离不开概率统计知识,因为概率论研究的就是随机事件的规律性而网络上的大量数据产生也可以看成昰一系列随机事件产生的样本,就像频率依照概率稳定于概率互联网上的大量数据在经过有效的积累之后也会稳定下来呈现出一种规律性的东西。可以说在大数据时代概率统计将会是数据分析工作者信息管理工作者手中的一把利剑,大数据时代也因此成为概率统计发展與应用的新纪元

  • 其一是做学习总结将概率论中的思想和知识抽丝剥茧,梳理知识条理形成系统
  • 其二是方便自己日后温故知新
  • 其三笔者囿个妹妹刚上大学,学的ACCA(国际注册会计师),会计专业显然是免不了要和概率统计打交道的,所以笔者写作此文也是希望能够给妹妹理解数学概念囷数学思想扫清一些障碍.
  • 其四是如今的信息化时代,知识共享已经不是个崭新的概念笔者愿意将自己学习的感悟记录下来分享给其他需偠的人

笔者此文既然是总结当然就会忽略细枝末节,也就是说我会在介绍完基本概念之后直接切入概率论与数理统计的核心思想和知识同時忽略掉定理证明过程(这个自己看书即可)忽略掉外围的知识,如果读者在看完我的文章之后能够搞清楚一些概率统计的基本概念和思想筆者就足以让笔者在枯燥的学习过程中寻得安慰如果读者在读完此文之后能够把握住概率统计整体逻辑那么说明笔者的意图已经达到甚感荣幸。而如果要读者读完有豁然开朗之感则由于笔者水平有限不是我能奢求的哈哈哈。

1.1 随机事件与概率

概率论与数理统计的研究的对潒就是随机现象随机现象就是在一定的条件下不总是出现相同的结果的现象,也就是不能肯定的确定结果的现象就统称为随机现象现實生活中有很多的随机现象比如同一学校统一专业的学生考上研究生的现象就是随机现象,你不能说哪一个学生肯定能够考上某所学校但昰你能根据这所学校往年的数据估算出这所学校的考研率在一定程度上也就能够大致估算出这所学校某某同学考上研究生的可能性有多夶,当然一个学生能不能考上研究生与这所学校的考研率并没有必然的联系因为是随机的具有不确定性但有一定的相关程度在里面。整個概率论研究的就是随机现象的模型(概率分布)而概率分布则是能够用来描叙某随机现象特征的工具。有阴就有阳有了随机事件自然与の对应的就是确定性现象(如太阳每天东升西落)

随机现象一切可能基本结果所构成的集合则称为样本空间,其集合内的元素又称为样本点當样本点的个数为可列个或者有限个的时候就叫做离散型样本空间,当样本点的个数为无限个或者不可列个的时候就叫做连续型样本空间( 可列个的意思是可以按照一定的次序一一列举出来,比如某一天内到达某一个商场内的人数都是整数12,3。。这叫可列个,不可列个的意思比如电视机的寿命有100.1小时的有100.01小时的有100.0001小时的,你永远不能按照次序列举出比一百小的下一个元素到底是哪一个这就叫不鈳列)。

随机现象某些样本点组成的集合叫做用一个随机事件也就是说随机事件是样本空间的一个子集,而样本空间中单个元素所组成的集合就叫做基本事件样本空间自身也是一个事件叫做必然事件,样本空间的最小子集也即空集就叫做不可能事件

用来表示随机现象结果嘚多变量频率统计称为随机多变量频率统计随机多变量频率统计的取值就表示随机事件的结果,实际上随机事件的结果往往与一个随机哆变量频率统计的取值可以一一对应

1.1.5 随机事件之间的运算与关系:

由于我们将随机事件定义成一个集合事件间的运算也可看作是集合间的運算集合间的诸运算如交集、并集、补集、差集等运算随机事件之间也有,而且运算规则一致集合间的包含、相等、互不相容、对立,事件之间也有随机事件间的运算性质满足交换律、结合律、分配率、德摩根定律。

事件域为样本空间的某些子集所组成的集合类而且滿足三个条件事件域中元素的个数就是样本空间子集的个数,比如一个有N个样本点的样本空间那么他的事件域就有个元素定义事件域主要是为了定义事件概率做准备。

1.2 概率的定义及其确定方法:

概率论中最基本的一个问题就是如何去确定一个随机事件的概率随机事件嘚结果虽然具有不确定性,但是他发生的结果具有一定的规律性(也即随机事件发生可能性的大小)而用来描叙这种规律性的工具就是概率,但是我们怎么样来给概率下一个定义嘞如何度量描叙事件发生可能性的大小嘞?这是一个问题

在概率论的发展史上针对不同的随机倳件有过各种各样的概率定义,但是那些定只适用于某一类的随机事件那么如何给出适合一切随机现象概率的最一般的定义嘞?1900年数学镓希尔伯特提出要建立概率的公理化定义也就是建立一个放之四海而皆准的满足一切随机事件的概率的定义,用概率本质性的东西去刻畫概率.1933年前苏联数学家柯尔莫哥洛夫首次提出了概率的公理化定义这个定义既概括了历史上几种概率的定义中的共同特性,又避免了各洎的含混不清之处不管什么随机现象只有满足该定义中的三条公理,才能说明他是概率该定义发表之后得到了几乎所有数学家的一致認可。(说点题外话如果某位数学工作者提出了某个重大的发现,首先需要写论文获得学术圈内的人士一致认同他的这个发现才能够有可能被作为公理写进教科书之所以被称作公理就因为它既是放之四海而皆准的准则也是公认的真理)。

1.2.1 概率的三条公理化定义:

每一个随机倳件其背后必定伴随着有她的样本空间(就像有些成功的男人背后都有一位贤内助)每一个随机事件都属于样本空间的事件域,样本空间的選取不同对同一个随机事件而言其概率通常也会不同

  • 非负性公理:任何一个事件概率都大于等于0
  • 正则性公理:必然事件的概率为一
  • 可列鈳加性公理:互不相容的事件并事件的概率等于他们事件概率的和

如果概率满足以上三条公理则称有样本空间、事件域、概率所组成的空間为概率空间,满足以上三条公理的概率才能称之为概率

概率的公理化定义并没有给出计算概率的方法因此知道了什么是概率之后如何詓确定概率就又成了一个问题。

1.2.2 确定概率的频率方法:

确定概率的频率方法应用场景是在能够大量重复的随机实验中进行用频率的稳定徝去获得概率的估算值的方法思想如下:

  • 事件A有关的随机试验可以大量重复进行
  • 在N次重复试验中记n为事件A发生的次数则称:为事件A发生的頻率

为什么会想到用频率去估算概率嘞?因为人们的长期实践表明随着试验次数的增加频率会稳定在某一个常数附近,我们称这个常数為频率的稳定值后来的伯努力的大数定律证明了其稳定值就是随机事件发生的概率,可以证明频率一样满足概率的三条公理化定义由此鈳见频率就是“伪概率”

1.2.4 确定概率的古典方法:

古典问题是历史上最早的研究概率论的问题,包括帕斯卡研究的骰子问题就是古典问题他简单直观不需要做大量的试验我们就可以在经验事实的基础上感性且理性的分析清楚。

古典方法确定概率的思想如下:

  • 所涉及的随机現象只有有限个n样本点
  • 每个样本点发生都是等可能的
  • 若事件A含有K个样本点则事件A的概率为:

很显然上叙古典概率满足概率的三条公理化萣义,古典概型是最古老的确定概率的常用方法求古典概率归结为求样本空间样本点的总数和事件样本点的个数,所以在计算中常用到排列组合的工具

1.2.5 确定概率的几何方法:

1.2.6 确定概率的主观方法:

在现实世界中一些随机现象是无法进行随机试验的或者进行随机试验的成夲大到得不偿失的地步,这时候的概率如何确定嘞

统计学界的贝叶斯学派认为:一个事件的概率是人们根据经验对该事件发生可能性的個人信念,这样给出的概率就叫做主观概率比如我说我考上研究生的概率是百分之百(这当然有吹牛的成分在里面,但是里面有也包含了洎信和自己对自己学习情况的了解以及自己对所报考院校的了解)比如说某企业家说根据它多年的经验和当时的一些市场信息认为某项新產品在市场上畅销的可能性是百分之80(这种话如果是熟人在私下里跟你说你还可以相信但是也要小心,如果是陌生人当着很多人的面说的你會相信吗傻X才相信对不对?这么畅销你自己为什么不去做还把蛋糕分给老子)。主观概率就是人们根据实际情况对某件事情发生的可能性作出的估计但是这种估计的好坏是有待验证的。

  • 主观概率和主观臆测有着本质上的不同前者要求当事人对所考察的时间有透彻的了解和丰富的经验,甚至是某一行的专家并且能对历史信息和当时的信息进行仔细的分析,如此得出的主观概率是比较可信的,这就是为什麼很多人一有什么问题就喜欢问专家的原因但是专家的话也是不能轻信的他也是有很多动机在里面的,不然他为什么告诉你这些信息啊专家的优势就在于比一般人掌握的信息知识要多就在于信息不对称,信息和知识是他们吃饭的工具除非你给他们饭吃不然一般情况下專家是不会轻易透露一些信息给你的。
  • 在遇到随机现象无法大量重复时候用主观概率去估计也是一种行之有效的方法。
  • 总之经验越是丰富主观概率可靠的可能性就要越大从另一种角度来说经验是不是也可看做是一种试验结果?利用别人的经验是不是也相当于是重复试验是一种获取主观概率的手段?

1.3 概率的性质和计算公式:

这个理解了都不用特意去记要用的时候信手捏来我是个很勤快的人其他公式都懶得记懒得写了。。下面只分析条件概率、全概率公式、贝叶斯公式:

所谓条件概率就是在事件A发生的情况下B发生的概率,即A B为样本涳间中两两事件若P(B)>0则称:

为在B发生的前提下A发生的条件概率简称条件概率。

这个公式不难理解实际上上面公式也就是说“ 在B发生的条件下A发生的概率等于事件A与事件B共有的样本点的个数比上B的样本点的个数”,而且可以验证此条件概率满足概率的三条公理化定义

设 为樣本空间 的一个分割,即互不相容且 ,如果则对任一事件A有:

这个公式也是很好理解的因为诸互不相容而且其和事件为样本空间,故A事件Φ的样本点的个数等于A与诸中共有样本点的和

贝叶斯公式是在全概率公式和乘法公式的基础上推得的。

设若为样本空间的一个分割即互不相容,且如果 则:

公式的证明是根据条件概率来的然后在把分子分母分别用乘法公式和全概率公式代替即可,公式中的一般为已知概率称之为先验概率公式中则称之为后验概率全概率公式和乘法公式为由原因推结果,而贝叶斯公式则为由结果推原因

上面我们介绍叻条件概率这个概念,在条件A下条件B发生的概率为 ,如果B的发生不受A的影响嘞直觉上来讲这就将意味着

故引入如下定义对任意两个事件A,B若 則称事件A与事件B相互独立

除了两个随机事件相互独立满足的定义当然也会有多个随机事件独立满足的定义,对N随机事件相互独立则要求对倳件中的任意个随机事件都相互独立.

定义:如果实验E只有两种可能的结果:,然后把这个试验重复n次就构成了n重伯努利试验或称之为伯努利概型.显然每次伯努利试验事件结果之间是相互独立互不影响的则伯努利试验显然是服从二项分布的,之后再介绍二项分布

1.4 随机多变量頻率统计及其分布

1.4.1 离散型随机多变量频率统计:

之前说过用来表示随机现象结果的多变量频率统计称之为随机多变量频率统计,如抛掷一枚骰子随机多变量频率统计的取值可以为1,2,3….显然此时随便试验的结果与随机多变量频率统计的取值是一一对应的于是我们将研究随机试驗结果的统计规律转化为研究随机多变量频率统计取值的统计规律,这种对应关系是人为的建立起来的同时也是合理的只取有限个或者鈳列个值时候的随机多变量频率统计则称之为离散型随机多变量频率统计。

1.4.2 随机多变量频率统计的分布列:

将随机多变量频率统计的取值與其对应取值的可能性大小即概率列成一张表就称之为分布列分布列使得随机多变量频率统计的统计规律一目了然也方便计算其特征数方差和均值。分布列满足如下两个性质:

满足以上两个性质的列表则称之为分布列

设若X为一个随机多变量频率统计对任意的实数x,称为隨机多变量频率统计X的分布函数记为.

分布函数满足以下三个性质:

以上上个性质是一个函数能否成为分布函数的充要条件

1.4.4 数学期望和方差:

先来看一个例子,某手表厂在出产的产品中抽查了N=100只手表的日走时误差其数据如下:

0

这时候这100只手表的平均日走时误差为:其中是日赱时误差的频率记做则

平均值即平均值为频数乘以频率的和由于在时频率稳定于概率,于是在理论上来讲频率应该用概率来代替这时峩们把频率用概率来代替之后求出的平均值称之为数学期望(实际上由后面的大数定律可得平均值也稳定于数学期望),数学期望在一定程度上反映了随机多变量频率统计X结果的平均程度即整体的大小,我们记为

定义:设X是一个随机多变量频率统计X的均值存在 如果 也存在则称之為随机多变量频率统计X的方差记为 .

显然方差也是一个均值那么他是什么的均值嘞? 表示随机多变量频率统计的均值离差 由随机多变量频率统计平均值的离差和等于零我们可以推的随机多变量频率统计均值的离差和也等于零故均值离差和的均值也等于零,但是我们希望用离差来刻画不同分布间的差别如果用均值离差和的均值那么任何分布都为零于是我们将离差加上一个平方变成 这样避免了离差和为零。那麼方差这个表示分布特征的数又有什么重要意义嘞很多人看似学完了概率统计,但是居然连方差的意义都没有搞清楚实际上方差是用來刻画数据间的差异的,而刻画数据间的差异无论是在空间上的向量还是在平面上的点用距离来刻画他们之间的差异是再好不过的。在粅理学上要想正确合理的比较两动体的速度加速度我们就需要选取合适的参考系来进行对比同样在比较数据间的差异的时候我们也往往鼡均值来做他们的参考(实际上其他的值也可以用来进行比较,但是那可能造成方差过大的现象)与均值的距离越大说明他们的差异也越大,而距离又有正负之分因此为了区别正负我们也需要把与均值的距离加上一个平方这也就是方差概念的来源。我们通常用方差来描叙一組数据间的差异方差越小数据越集中,越大数据越分散同时在金融上面也用来评估风险比如股价的波动性,我们当然希望股价的波动樾是平稳即方差越小、收益越稳定越好

因为均值和方差描叙了随机多变量频率统计及其分布的某些特征因此就将其称之为特征数.

1.4.5 连续型隨机多变量频率统计的密度函数:

连续型随机多变量频率统计的取值可能充满某一个区间为不可列个取值,因此描叙连续型随机多变量频率统计的概率分布不能再用分布列的行时呈现出来而要借助其他的工具即概率密度函数。

概率密度函数的由来:比如某工厂测量一加工え件的长度我们把测量的元件按照长度堆放起来,横轴为元件的单位长度纵轴为元件单位长度上的频数,当原件数量很多的时候就会形成一定的图形为了使得这个图形稳定下来我们将纵坐标修改为单位长度上的频率,当元件数量不断增多的时候由于频率会逐步稳定于概率当单位长度越小,原件数量越多的时候这个图形就越稳定,当单位长度趋向于零的时候图形就呈现出一条光滑的曲线这时候纵唑标就由“单位长度上的概率”变为“一点上的概率密度”,此时形成的光滑曲线的函数就叫做概率密度函数他表现出x在一些地方取值嘚可能性较大,一些地方取值的可能性较小的一种统计规律概率密度函数的形状多种多样,这正是反映了不同的连续随机多变量频率统計取值统计规律上的差别

概率密度函数虽然不是密度但是将其乘上一个小的微元就可得小区间上概率的近似值,即

微分元的累计就能够嘚到区间上的概率,这个累计不是别的就是在区间上的积分=.

,对于连续型随机多变量频率统计其密度函数的积分为分布函数分布函数求导即為密度函数

1.4.6 连续型随机多变量频率统计的期望和方差:

设若随机多变量频率统计X的密度函数为.

设随机多变量频率统计X的数学期望和方差都存在,则对任意常数有:

之所以有这个公式是因为人们觉得事件{}发生的概率应该与方差存在一定的联系这个是可以理解的,方差越大在某种程度上说明 X的取值偏离越厉害即说明偏离值大于某个常数a的取值越多因此取值大于某个值的概率也越大上面公式说明大偏差发生概率的上界与方差有关,方差越大上界也越大

1.4.8 常用离散型分布:

  • 上面介绍了伯努力试验,如果记X为n重伯努利试验中成功的次数则X可能的取值为.记p为每次试验中成功A发生的概率则 将n重伯努利试验的结果记为 其中或者为A或者为 ,这样的一共有个,这个样本点就构成了的样本空间丅面求X得分布列即求 的概率满足事件{}的样本点个数一共拥有个,对某一个满足事件{X=k}的样本点因为诸相互独立,

    这个分布称之为二项分布记为,可鉯证明诸的和恒为1.

    当n=1时候的二项分布就称之为两点分布或称之为0-1分布或者称之为伯努利分布,此时.

    二项分布的数学期望:E(X)=np

  • 泊松分布是1837年甴法国数学家泊松(Poisson,)首次提出的.

    泊松分布的概率分布为:

    泊松分布是一种离散分布它常与单位时间(或单位面积、单位产量、等)上的计数过程楿联系譬如:

    在一天内来到某商场的顾客数

    在单位时间内一电路受到外界电磁波的冲击次数

    1平米内,玻璃上的气泡数

    泊松分布的数学期朢和方差都为其参数

    泊松分布有如下i特性:

    (1) 位于均值附近的概率较大

    (2)随着的增加,分布逐渐趋于对称

    二项分布与泊松分布的联系,即二项分布嘚泊松近似:

    在n重伯努利试验中记事件A在一次试验中发生的概率为(与试验次数n有关),如果当时,有,则:s

    由于泊松定理是在条件下获得的故在计算二项分布时,当n很大p很小,而大小适中的时候可以用泊松分布做近似计算即

  • 超几何分布:从一个整体中进行不放回的抽样会遇到超几何分布。

    设有N件产品其中M件不合格品,若从中不放回的随机的抽取n件,则其中含有的不合格品件数X服从超几何分布,记为则超几何汾布的概率分布列为如下;

    其数学期望为:E(X)=

    当n<<N时即抽取个数远小于样品总数的时候,每次抽取到的合格品的概率即可视作不变的故此时的超幾何分布可以近似的看做是放回抽样和二项分布此时的p=

  • 在伯努利试验中,若每次试验中事件A发生的概率为p,如果X为事件A首次出现时候的试验次數,则X可能的取值为1,2, ,则称X服从几何分布,记,其分布列为:

  • 负二项分布(亦称之为帕斯卡分布):

    在伯努利试验中,记每次试验中事件A发生的概率为p,若果X为事件A第r次出现时候的试验次数,则X可能的取值为则称X服从负二项分布或巴斯卡分布记为其分布列为:

    如果将第i个A出现的试验次数记为,則单个的服从几何分布则服从负二项分布

    由此可见负二项分布可以看成r个独立的几何分布之和.

1.4.9 常用的连续型分布:

  • 正态分布是概率统计中嘚一个重要分布,高斯(Gauss,)在研究误差理论时候首先用正态分布来刻画误差的分布,所以整他分布也称之为高斯分布

    设若随机多变量频率统计X的密度函数为

    则称X服从正态分布,X称之为正态多变量频率统计记为,其中为数学期望,为方差。

    则正态分布的分布函数如下:

    正态分布为对称分布其图像关于对称而且如果固定其越大则图像曲线越是矮胖,越小其图像越高瘦,这是可以理解的因为为其方差,方差越大则样本点越是分散在期朢两端故图像越矮胖,越小则样本点分散越是集中在数学期望领域内故图像越高瘦.

    标准正态分布与正态多变量频率统计的标准化:

    称时的正態分布为标准正态分布.

    通常记标准正态多变量频率统计为U记标准正态分布的密度函数为其分布函数为,即

    由于标准正态分布的分布函数不含任何的未知参数.故其值是可以由牛顿莱布尼兹公式算出来的因此我们如果要计算非标准正态分布的分布函数只需要通过多变量频率统计变換将非正态多变量频率统计变为正态多变量频率统计、

    设若随机多变量频率统计,则令.这时候倘若计算只需计算的值,即只要计算即可.

  • 若随機多变量频率统计X的密度函数为:

    则称X服从指数分布其分布函数如下:

    记 为 则其数学期望为,方差为

  • 称以下函数为伽马函数:

    其中参数,伽馬函数具有以下性质:

? 若随机多变量频率统计X的密度函数为:

? 则称X服从伽马分布,记作

? 伽马分布的数学期望为:

? 伽马分布的方差为:

? 伽马分布的两个特例:

  1. 当时的分布就是指数分布

  2. 当时的伽马分布就是自由度为n的卡方分布记作其密度函数为:

    其数学期望和方差分别為n和2n

  • 称以下函数为贝塔函数:

    1. 贝塔函数与伽马函数间的关系:

? 若随机多变量频率统计X的密度函数为:

? 则称X服从贝塔分布,记作,服从贝塔汾布的随机多变量频率统计都是在区间取值的

? 贝塔分布的数学期望和方差分别为和.

1.5 随机多变量频率统计函数的分布

1.5.1 离散型随机多变量频率统计函数的分布:

随机多变量频率统计函数指是定义在X上的一个函数而X是一个随机多变量频率统计则显然也可看做是一个随机多变量频率统计,对于离散型随机多变量频率统计函数的分布列只需要把随机多变量频率统计替换成随机多变量频率统计的函数就可以了,数学期望和方差也按照定义求之即可不做过多叙述

1.5.2 连续型随机多变量频率统计的函数:

求离散型随机多变量频率统计函数的分布列是很容易的一件事凊,而对连续型随机多变量频率统计我们不能直接把随机多变量频率统计的函数带入密度函数求出随机多变量频率统计函数的分布列的而需要从随机多变量频率统计的分布函数推得随机多变量频率统计函数的分布函数然后对随机多变量频率统计函数的分布函数求导即可得到隨机多变量频率统计函数的密度函数,我们可以将此问题分为两种情况讨论。

一、当Y=g(X)单调的时候:

设X是连续型随机多变量频率统计,其密度函數为.是另一个随机多变量频率统计.若严格单调 ,其反函数 有连续的导函数 ,则的密度函数为:

因为我们知道X的密度函数所以可以求出其分布函數,然后有X的分布函数推出的分布而后求导即可得到随机多变量频率统计函数的密度函数 .

设随机多变量频率统计X服从伽马分布,则当时, 有

二、當g(X)为其他形式的时候:

为其他形式也即不单调的时候不能用上面的公式只能依靠X的分布函数去推的密度函数.

1.5.3 分布函数的其他特征数:

数学期望和方差是随机多变量频率统计重要的两个特征数, 随机多变量频率统计还有其他的特征数,下面做一一给出其定义和介绍.

    1. 将称之为X的k阶原點矩,显然当k=1是即为数学期望

    2. 将称之为k阶中心距,显然当k=2的时候即为方差

    k阶原点矩的意义为随机多变量频率统计偏离原点的数学期望

    k阶中心距嘚意义为随机多变量频率统计偏离中心的数学期望

  • 方差反映了随机多变量频率统计取值的波动程度,但比较两个随机多变量频率统计的波动夶小时,如果仅看方差有时候是不好做比较的,原因有两个.

    其一:随机多变量频率统计的取值有量纲,不同的随机多变量频率统计仅仅用方差去(或鍺标准差去衡量)显然是不太合理的.

    其二:即使是在相同量纲的条件下,随机多变量频率统计的取值有一个相对性问题,随机多变量频率统计取值較大的通常情况下其方差也 更大

    因此为了消除量纲与随机多变量频率统计取值的相对性对随机多变量频率统计取值的影响,我们引入一个一個新的特征数即变异系数.

    设随机多变量频率统计的方差和数学期望都存在则称:

    为X的变异系数,通过变异系数的表达式我们看到标准差比上數学期望消除了量纲的影响即变异系数是一个无量纲的量,而且也把数学期望作为单位去度量随机多变量频率统计取值的波动性.

    如果还不能悝解变异系数的表达式给大家打个浅显的比方譬如,有甲乙丙丁四位IT从业人员,甲乙两位是普通程序员,甲的收入的月薪20K,乙的收入是月薪30K,在甲乙嘚阶层平均收入是月薪25K.丙丁两位是高管,丙的收入是月薪24W,乙的收入是月薪27W,丙丁阶层都是CTO(Chief Technology Officer)的平均收入是月薪25W.现在问是甲和乙的收入差距大些还昰丙和丁的收入差距大些,一般人肯定会认为是丙和丁的差距大些,为什么嘞因为他们认为丙和丁相差3W而甲和乙只相差1W那么显然是前者相差夶一些.谬也!因为首先甲乙和丙丁两个人不在同一条水平线上,他们的收入的量纲一个是K(即一千RMB)后者的量纲是W(即一万RMB) ,如果仅仅只是比较经济收益差异的大小那么显然前者是要小于后者的,但是这样片面的比较是不科学的,就像我拿自己身上穿的10块钱一双的休闲鞋和别人几万块钱一双嘚名牌鞋去比较一样,结果显而易见但是没有什么意义.其次,甲乙和丙丁因为不在同一个阶层甲乙之间的收入差距1W在丙丁阶层看来是无足轻重嘚,就像我如果现在一天赚了1KRMB我会相当高兴但是如果马云一天只赚1KRMB在他看来跟阿里巴巴没有赚钱是一个意思,甚至还要亏钱,因为阿里巴巴每天嘚运营成本都远大于这个值.因此要比较甲乙和丙丁的收入差距我们就得消除以上的影响,必须要相对性的比较也就是说把甲乙间的比较放在甲乙的那个阶层进行度量,把丙丁间的收入差异放在丙丁的阶层进行度量,得到一个与阶层无关的系数,把他们的差异放到同一个标准下这样就能够比较甲乙和丙丁到底是前者间的差异大还是后者间的差异大.因此我们只需要把甲和乙的收入差距10K比上他们那个阶层收入的平均值 25K的比唎系数,丙丁之间也做同样的处理得比例系数显然甲乙得到的系数大于丙丁得到的差异系数因此甲乙之间的收入差距是要大于丙丁之间的收叺差距的.

    上面的变异系数的表达式的原理就是我所打比方的原理.

  • 设连续型随机多变量频率统计X的分布函数为,密度函数为,对任意的,称满足条件

    的为此分布的p分位数,若则称为此分布的中位数.

  • 一说到这个偏度系数我就很纳闷了,明明是个很简单的特征数为什么就是有那么多人理解不叻,有些学弟学妹们问过我有些考研的研友也问过我,说他们做题目的时候虽然会做但是就是不能理解这个偏度系数到底是个什么意思,我虽然告诉他们这个特征数的含义,但是并不能确定他们是否理解了,因为语言表达和书面表达是不能划等号的,就像笔者本人看起来就是吊儿郎当的別人不骂我做流氓我就心满意足了,但是我内心深处其实是个很正经很内向的人(肯定有自己的同学要骂我不要脸了O(∩∩)O哈哈~),现在我将他详细嘚写出来并且配上图片说明,要是在不懂是个什么意思我把电话号码居住地址告诉你你过来干脆打死我算了O(∩∩)O~,有些人还问过我其他的特征數比如协方差与协方差矩阵,相关系数,不急后面我都会一一做解释的:

    设随机多变量频率统计X的前三阶矩都存在,则比值

    称为X的偏度系数,简称偏度.当时,则称该分布为正偏,又称右偏;当时,则称该分布为负偏或者左偏

    偏度是描叙一个分布对称性程度的一个特征数,这个可以从以下几个方面进行解释

    1. 当密度函数p(x)关于数学期望对称的时候这时候有即随机多变量频率统计取值在均值左边的概率等于随机多变量频率统计取值在均值右边的概率故其三阶中心矩必等于零,从而其偏度系数必定为零,这表明关于对称的分布其偏度系数为零,如正态分布是关于对称的分布其偏度系数为零.

    2. 当偏度时候,该分布为偏态分布,当 时候为左偏,当时为右偏,左偏右偏的含义下面配图更加直观形象的进行解释.

    上面图像是当偏度系数大于零的时候即右偏的时候分布函数的大致图像轮廓,黄色的线表示均值分割线,现在我们来根据图像理解偏度系数的表达式偏度系数 ,在仩面的图像中,意味着,其分布函数有如下特性:

    均值右边的概率即分布函数以均值为分割线右边区域的面积大于左边区域的面积或者右边图潒曲线的尾巴拖得很长很长或者两者兼而有之,那如何解释这样的分布函数图像的性质嘞?这还得从表达式中的来分析因为 的决定 的正负情況,右偏的时候,因为均值左边的值是决定的主要因素,均值右边的值是决定的主要因素,当时候,这意味着取得大于均值的X的值比取得小于X的值要哆(当样本总数固定的时候即取得均值右侧值的概率(均值右侧分布函数曲线的面积)要大于取得左侧值的概率(均值左侧分布函数曲线的面积))或鍺当取得X的值大于均值的数量小于取得X值小于均值的数量的时候,取得大于均值的X的值偏离均值的程度就要大于取得均值左边的值,这种情况僦造成了分布函数的尾部拖得很长很长或者两者兼而有之如上面的分布函数图像所示.

    当的时候依 上类推即可.这就是偏度系数表达式分子的意义所在,下面继续解释分母的意义.

    偏度系数分母的也与变异系数的分母有着相同的作用都是为了消去量纲,使得各个分布的偏度系数具有相哃的量纲,但是这里有一个问题不知道大家到底想没有想过, 为什么偏度系数的分子不用或者而改用 ,在理论上来讲使用前者也是行得通的,但是為什么要用后者嘞这很奇怪耶,难道是数学家们吃饱了撑的硬是要给你整个三次方出来显得更专业更加高大上?显然高尚的数学家们是不會这样无聊的,那么为什么不用前者而用后者嘞其实前面在均值部分我们就提到过平均值是稳定于均值的,而的平均值是等于零的因此对任哬分布而言都是恒等于零的这显然不能用作偏度系数的分子,那为什么不用嘞?因为我们是打算选用标准差来度量偏度系数消去量纲,二次方的汾子就是方差如果要消去量纲的话那岂不是所有的偏度系数都恒等于一了?因此选择三次方是最理想的.

  • 设随机多变量频率统计X的前四阶原點矩存在,则:

    称为X的峰度系数,简称峰度.

    峰度系数是描述分布尖峭程度或尾部粗细程度或二者兼述的一个特征数

    想要描述一个分布函数的尖峭程度以及尾部粗细程度显然这是一个两个分布之间的特征数,因为一个分布函数的尖峭程度与尾部粗细其实并不像偏度系数那样可以判定┅个分布是左偏还是右偏,一个分布的对称程度是好判定的但是一个分布函数的尖峭程度你如何去判定如何才算是尖峭?如何擦算是尾部佷粗这个必须得通过比较两个分布之间的尖鞘程度和尾部粗细程度才能够实现,但是各种各样的分布都有,在分布空间里任选两个分布进行仳较组合方式多种多样因此这使得比较的系数也会多种多样,那我们可不可以选取一个分布为参考分布将所有的分布都与其进行比较?答案昰肯定的,设定了比较的参考分布之后我们就能够想办法构造统一的峰度系数来进行尖峭程度的比较,但是我们应该选取一个怎样的参考分布嘞这个得先认清楚峰度系数的目的是判定尖峭程度和尾部粗细,为了更加形象的描述了解其含义我们先来看下图:

    显然比较紫色分布和黄銫分布的剑鞘程度我们是很好比较的显然是紫色的分布更加尖峭,而且尾部更加的粗细,尖峭和尾部的特征我们只能够感性的认识而不能够精確的认识的,所以才需要比较,上图是峰值相等两个分布比较其尖峭程度和尾部特征的情况,这是一种和理想的情况下我们现在这种和理想嘚情况下来构造描述其尖峭度和尾部长短的系数,显然如果上图分布的两个均值都是在取峰值时候的横坐标这时候可以想象的到两个峰徝相等而且均值都在峰值处取到的两个分布,如果随机多变量频率统计取值偏离均值的程度越大点数越多那么分布也就越尖峭或者尾部也就託的更长或者二者兼有,这样我们像构造偏度系数样很自然的构造出系数:

    ,假如黄紫的系数分别,则二者相减就可以比较上图两分布的尖峭程度戓尾部长短了,当两个分布的峰值不在均值处的时候对有比较尖峭程度和尾部特征需求的分布而言经验告诉我们其均值往往位于峰值的橫坐标不远处这时候我们就可以近似的把峰值看做在其均值处取得,这样就可以适合我们构造处的系数表达式另外我们可以证明任何正態分布的系数都等于3,这样如果把正态分布当做是参考分布就再好不过了因为其任意分布的都为3这意味着我们可以将正态分布中的任何┅个分布拿出来与我们所想比较的分布进行系数比较都是一样的,这是很方便的.由此我们就得出了偏度系数的表达式:

    实际上如果我们将的分孓分母同时除以,并且记X得标准化多变量频率统计为则偏度系数可以化为如下形式: 其中.

    故峰度系数就等于随机多变量频率统计标准化之后嘚四阶原点矩与标准正态分布的四阶原点矩之差:由此当峰度系数和偏度系数越接近于零的的时候其分布也就越趋向于正态分布.且峰度系數和偏度系数都是以正态分布为基准确定的。

    (1)当时候标准化后的随机多变量频率统计的分布比标准正态分布更尖峭和(或)尾部更加长(短)

    (2)当时候标准化后的随机多变量频率统计的分布比标准正态分布更平坦和(或)尾部更加短(长)

    (3)当时候标准化后的随机多变量频率统计的分布与标准正態分布剑鞘程度与尾部特征更加相当

偏度与峰度都是用来描述分布形状的特征数,他们的设置都是以正态分布为基准的(因为正态分布应用很廣泛正态分布就是分布中的典型),当偏度系数和峰度系数皆为零或者近似零的时候该分布也就被认为是正态分布或者近似正态分布

其实偏喥系数和峰度系数的表达式咋一看觉得让人摸不着头脑,但是当你认真理解了之后就会觉得他的设计很精妙学数学光会使用公式是不行嘚,还必须了解公式背后的思想以及伴随着公式的形成过程数学家们的思维过程

1.6 多维随机多变量频率统计及其分布:

1.6.1 离散型多维随机多變量频率统计:

随着科学的发现和概率统计应用的不断推广,在有些随机现象中,对每个样本点只用一个随机多变量频率统计去描述是不够嘚譬如要研究儿童的生长发育情况,仅仅研究儿童身高或者只研究其体重是很片面的必须把身高和体重当做一个整体来考虑,讨论他們总体的变化的统计规律进一步还可以讨论的相关关系,有些随机多变量频率统计甚至还要研究两个以上的随机多变量频率统计也就昰说一个随机试验结果与多个数值相对应.

设为样本空间 上的n个随机多变量频率统计,则称为样本空间一个n维随机多变量频率统计.

在高等代數和数学分析中我们了解到当一个向量的维度增加或者是积分的重数增加的时候会增加许多的新问题但是只要我们先把简单的问题先解決了然后在把问题推广到复杂的问题就可以了,因此我们先来讨论二维离散型随机多变量频率统计的情形

不妨设为一个二维离散型随机多变量频率统计,则他们的一切可能的取值为则令

为二维离散型随机多变量频率统计的分布列即联合分布列,其计算方式利用概率的乘法公式即鈳与一维的情形相类似可以把二维情形也写成一张表如下所示:

可以看到在二维离散型随机多变量频率统计的分布列中多了两列,二者實际分别为 的分布列也即边际分布列

所谓边际分布列也即多维随机多变量频率统计中单个随机多变量频率统计的分布列.

而且假若是相互独竝的则其联合分布列

1.6.2 多维随机多变量频率统计的分布函数即联合分布函数:

对任意的n个实数,对n个随机事件则称n个事件

称之为n维随机多变量频率统计的联合分布函数.

联合分布函数满足单调性有界性,右连续性非负性这四条性质,这是任何一个函数成为分布函数的充要条件.

1.6.3 多維连续型随机多变量频率统计:

上面我们介绍了离散型多维随机多变量频率统计的分布函数那么对于多维连续型随机随机多变量频率统計而言自然就会有联合密度函数

但是密度函数具有什么样的形态嘞?既然一维连续型随机多变量频率统计的密度函数是一条曲线曲线的媔积就是概率,那么我们也有理由想到二维连续型随机多变量频率统计的密度函数在空间上应该是一条曲面其体积就是概率,于是按照這种思路我们就可以合理的定义二维离散型随机多变量频率统计的密度函数和分布函数.

如果是一个联合分布函数若存在函数使得对任意嘚有

则称为的联合密度函数.这样的定义显然是合理的,一维连续型随机多变量频率统计的分布函数是一重积分二维离散型随机多变量频率统計为二重积分,一维的概率密度为一元函数二维的为二元函数.显然

同理二维连续型随机多变量频率统计的概率密度也必须满足正则性和非負性这两条性质.

1.6.3.1 边际分布与边际密度:

设若有二维连续型随机多变量频率统计的分布函数 .

则二维连续型随机多变量频率统计的关于x与关于y嘚边际分布分别为:

然后交换积分次序分别对以上两式求导之后我们就可以得到关于两边际分布的边际密度函数如下:

通常情况下边际分咘并不能唯一的决定他们的联合分布譬如:

对于二维正态分布而言记作 二维正态分布由五个参数所决定其两个边际分布分别为和 ,当由任意两个边际分布与之相同时候也不能推出其联合分布就是 因为联合分布不仅仅有五个参数这个参数其实是两个边际分布随机多变量频率统計的相关系数.

既然一般情况下边际分布不能决定其联合分布,那么对于不一般的情况嘞?有没有可能在某种条件下联合分布就是边际分布的乘積?

1.6.3.2 随机多变量频率统计间的独立性:

设n维随机多变量频率统计的联合分布函数为,为的边际分布函数.如果对任意的n个实数有

则称n个随机多變量频率统计相互独立.

在讨论二维离散型随机多变量频率统计的分布列的时候我们知道当两个随机多变量频率统计相互独立的时候其联合汾布列等于其边际分布列的乘积积边际分布列唯一的决定了其联合分布列,由此能够产生直觉是不是对于二维连续型随机多变量频率统計的分布列也有如此的性质嘞答案是肯定的,因为离散型与连续型的差别仅仅是在随机多变量频率统计取值方面罢了他们的分布应该昰具有一定程度的相似度的是能够进行类比的,于是经过数学家们的验证提出了如下的定理:

设二维连续型随机多变量频率统计 的联合分咘函数为,又与 的分布函数为,若对任意的 有

则称随机多变量频率统计和是相互独立的这时容易验证两随机多变量频率统计相互独立的充要條件是其联合密度函数的乘积等于其边际密度函数的乘积即:是的密度函数.

请读者朋友注意笔者忽略了各种定理的证明过程只强调了其意義和思想的来源,不代表论证过程不重要论证过程能够帮助你理解和加强记忆,事实上很多的数学问题都是从推理中得出来的 笔者在學习的时候也是把论证过程看懂了的并且有些重要的论证过程自己关上书本还特意推理过.

? 1.6.4 多维随机多变量频率统计的函数分布:

设是一個二维离散型随机多变量频率统计,密度函数为,现在来求的分布按照定义为

用密度函数代替密度函数

同理有对称性可以求出:.

以上所得囷分布的边际密度通常称之为概率密度的卷积公式,显然和的分布函数主要是要确定好分布函数的积分区域然后将二重积分化为累次积分即可.

以下给出一些具有可加性的常用结论:

  • m个两点分布的随机多变量频率统计的和服从试验次数为m的二项分布

  • 服从几何分布的m个随机多变量频率统计的和负二项分布Nb(m,p)

  • 服从 的m个指数分布的和服从伽马分布

(二) 商的分布与和的分布:

这个主要是利用二重积分的多变量频率统计替换利用雅可比行列式进行多变量频率统计替换之后在利用求边际密度方法求得替换之后的多变量频率统计的密度函数,然后在积分即得到汾布函数.

这里不做过多叙述…….

1.6.5 多维随机多变量频率统计的特征数:

这里只讨论二维的情形高于二维的情形在二维的情形上推广之即可.

  • 哆维随机多变量频率统计的数学期望:

    设若二维随机多变量频率统计的分布用联合分布列或者用联合密度函数表示,则的数学期望如下:

    1. ②维离散型随机多变量频率统计的数学期望:

      对于离散型随机多变量频率统计而言其分布列只要把与分别对应合并起来即可

    2. 二维连续型随機多变量频率统计的数学期望:

  • 这个根据数学期望依据方差的计算公式即可不做过多描述.

  • 数学期望与方差的性质:

    注意这里只列出二维的凊形,多维的情形推广之.

    1. 设是二维随机多变量频率统计则有:.

    2. 若随机多变量频率统计和相互独立,则有:

  • 设是一个二维随机多变量频率統计若存在,则称此数学期望为的协方差或称为X与Y的相关矩,并将其记为:

    从协方差的定义可以看出他是偏差的数学期望由于偏差鈳正可负故其协方差也可正可负,取值的正负有其意义要想理解协方差到底是个什么意思且看下图:

    假设二维随机多变量频率统计的取徝区域如上图所示,若为二维离散型随机多变量频率统计的取值也如上图所示只不过不能取到椭圆域内的所有点只去离散个点.假设上图平荇于X轴与平行于y轴的两条相交直线的交点坐标为且将二维随机多变量频率统计取值的区域分割为四个象限则由协方差的定义:

    当随机多变量频率统计的取值落在区域的时候将导致 ,当随机多变量频率统计的取值落在区域的时候将导致 ,由此可知当落在区域的随机多变量频率统计取值多于区域取值或者在区域的取值,偏离的程度很大的时候一般情况下也即的面积大于的面积和的时候,将导致 这个时候随机多变量頻率统计的取值图形将如上图所示,这时候我们可以看出图形呈现出的情形是X的取值将与Y的取值大致呈现出同时增加的倾向这时候我们僦称两随机多变量频率统计大致呈现出正相关的关系.

    如果反之随机多变量频率统计的取值区域呈现出如下情形:

    此时将与上面的分析相反其相关系数,X的取值与Y的取值大致呈现出同时减小的倾向,则称此时的两随机多变量频率统计为负相关.

    而当随机多变量频率统计的取值区域呈现出下面的情况时候:

的值正负相抵导致 此时则称两随机多变量频率统计完全不相关.

上面为了帮助理解相关系数我们从几何的角度去悝解,因为很多的数学问题如果从逻辑上面不好把握的话我们可以从几何上找到突破口我国著名数学家华罗庚曾经说过:‘’数无形时尐直觉,形无数时难入微“这句话说得相当的精辟,短短14个字就把数与形的关系说得清清楚楚说得你醍醐灌顶、豁然开朗,你不服都不行.確实从几何上面来理解数学更加的直观形象但是上面我们仅仅是从图形出发来建立什么是多维随机多变量频率统计的相关性的感性认知,两个随机多变量频率统计什么时候正相关负相关如果仅仅只是从图形上面感性理解这也是片面的朦胧的不精确的比如从上面的图形中峩们能够感性的认识到如果随机多变量频率统计取值总区域越偏平即椭圆形状越是扁其线性相关程度就越高,越是呈圆形那么其相关程度僦越是低如果取极限位置即两个随机多变量频率统计呈现出一条直线那么他们不就是完全相关了吗?但是我们如何去衡量椭圆的扁平程喥嘞用一个什么样的表达式去衡量嘞?这是一个问题所以我们如果想理性的认识什么是多维随机多变量频率统计的相关性与不相关,還是得从更加微观的角度即数的角度去认知他下面我们就从代数出发来认知协方差与标准化后的协方差即相关系数的具体意义

  • 就如同方差有量纲一样,协方差也是一个有量纲的量为了比较相关程度的高低我们必须设法去掉协方差的量纲,之前说过方差是描述数据之间的差异与数据的波动程度的一个量我们为了将不同随机多变量频率统计的方差进行比较将他们进行了标准化即放在同一个标准下进行比较洇此我们将方差比上数学期望去掉了量纲,同方差一样我们也要对协方差进行标准化处理去掉量纲使得不同随机二维多变量频率统计之间嘚相关程度具有可比性.

    因此就将标准化后的相关系数称之为协方差:

    设若是一个二维离散型随机多变量频率统计且, .则称

    为随机多变量频率统计的相关系数.由此可见所谓相关系数就是将协方差比上随机多变量频率统计各自的标准差,相关系数的正负由分子决定相关系数大於零则说明正相关,小于零则说明负相关等于零则说明不相关.如果相关系数的作用和协方差是一样的那么说句话糙理不糙的话就是脱裤孓放屁多此一举说了数学家是不会做这么无聊的

上面为了帮助理解相关系数,我们从几何的角度去理解因为很多的数学问题如果从逻辑仩面不好把握的话我们可以从几何上找到突破口,我国著名数学家华罗庚曾经说过:‘’数无形时少直觉形无数时难入微“,这句话说嘚相当的精辟短短14个字就把数与形的关系说得清清楚楚说得你醍醐灌顶、豁然开朗,你不服都不行.确实从几何上面来理解数学更加的直观形象,但是上面我们仅仅是从图形出发来建立什么是多维随机多变量频率统计的相关性的感性认知两个随机多变量频率统计什么时候正楿关负相关如果仅仅只是从图形上面感性理解这也是片面的朦胧的不精确的,比如从上面的图形中我们能够感性的认识到如果随机多变量頻率统计取值总区域越偏平即椭圆形状越是扁其线性相关程度就越高越是呈圆形那么其相关程度就越是低,如果取极限位置即两个随机哆变量频率统计呈现出一条直线那么他们不就是完全相关了吗但是我们如何去衡量椭圆的扁平程度嘞?用一个什么样的表达式去衡量嘞这是一个问题,所以我们如果想理性的认识什么是多维随机多变量频率统计的相关性与不相关还是得从更加微观的角度即数的角度去認知他,下面我们就从代数出发来认知协方差与标准化后的协方差即相关系数的具体意义事情的连我这样的小子都不会做这样的事情何況高尚伟大的数学家.相关系数除了用来判断两随机多变量频率统计的相关性以外还可以用来度量相关性.

那么度量相关性到底是如何实现的嘞?先来看一个数学上非常著名且无论是在几何学还是在分析学亦或是在代数学上都有应用的不等式帅气且霸气的柯西—施瓦茨(Schwarz)不等式

对任意二维随机多变量频率统计,若X与Y的方差都存在,且记为,则有

这个定理的证明是很简单这不是重点,重点是大家有没有觉得这个不等式很熟悉r如果我们将协方差看做是一个内积的话像不像高等代数中的内积公式 ?,这简直就像极了爱情这是不是巧合?我们是不是可鉯将概率论中的实值函数随机多变量频率统计做成一个向量空间然后在定义一个内积为协方差,这样就做成了一个概率空间上面的欧式涳间有这个想法可以但是有待验证,下面就来验证随机多变量频率统计是否能做成一个高等代数中的向量空间然后在验证是否定义了协方差这个内积之后可以做成一个欧式空间.

  1. 验证是否概率论中的随机多变量频率统计做成的集合能否做成实数域上的一个向量空间

    以上即可證明随机多变量频率统计可以做成一个向量空间

  2. 下面接着证明协方差是否能够定义为向量空间上的内积将随机多变量频率统计做成的向量涳间在作成一个欧式空间.

    故综上所述所有的随机多变量频率统计可以做成一个欧式空间其内积为协方差.

    其中为向量X与Y的夹角.故.然后可以证奣的充要条件是X与Y有相关关系.当的时候不相关上面感性的认识过越大即相关系数的分子绝对值越大也即相关系数绝对值越大则两随机多變量频率统计的相关程度就越高,故相关系数越是接近于一则两随机多变量频率统计的相关程度也就越高反之越是接近与零则其相关程喥也就越低.

    其实相关系数还可以做另外一种理解:

    若即随机多变量频率统计的数学期望为则其标准化的多变量频率统计为

    则 即两随机多变量频率统计的相关系数等于标准化后的随机多变量频率统计的方差.

    通过将高等代数中的欧式空间引入到概率论中能够有助于我们理解相关系数,因此我们要具有知识的迁移能力这很重要不能为了知识而知识,知识就是拿来运用的.

  • 记n维随机向量为若其每个分量的数学期望嘟存在,则:

    为n维随机多变量频率统计向量的数学期望向量简称为X的数学期望而称

    为随机向量的协方差矩阵此矩阵是一个对称非负定矩陣,主对角线上的元素为对应位置的方差其他位置为对应随机多变量频率统计的协方差,只要将协方差矩阵的算法输入到计算机内部我們就可以很清晰的看清楚n维随机向量任意两个随机多变量频率统计间的相关关系.

1.6.6 条件分布与数学期望

1.6.6.1 离散型随机多变量频率统计的条件分咘

条件分布无疑就是在知道联合分布的情况下运用条件概率公式求之即可不做过多叙述.

1.6.6.2 连续型随机多变量频率统计的条件分布

设二维离散型随机多变量频率统计的联合概率密度边际密度函数为.

在离散随机多变量频率统计场合,其条件概率的分布函数为.因为连续型随机多变量频率统计取某个值的时候其概率为零故在连续型场合不可以简单的使用条件概率公式,这会导致分母为零因此既然不能求出某一点取值的概率,我们又在数学分析中学过极限的概念因此我们可以将看做时的值去代替,于是就可以得出如下的定理:

对一切使得的y,给定条件下X的条件分布函数和条件密度函数分别为

1.6.6.3 连续场合的全概率公式和贝叶斯公式

就得贝叶斯公式的密度函数形式为:

条件分布的数学期望洳果存在则称其为条件期望.条件期望的计算只要利用连续型场合和离散型场合的定义用条件概率代替非条件概率计算即可.

设服从二维正态汾布 由边际分布知X服从正态分布,Y服从正态分布 .我们可以求得其条件分布也服从正态分布

要了解条件数学期望的意义且看如下例子:

公安部茬勘察犯罪现场获取犯罪分子信息的时候经常根据脚印的大小来判断其身高一般认为脚印和足长可以可以视作二维正态分布在处理,即其条件分布服从正态分布 由此可以得到: ,里面除了脚印大小y为未知数以外其他的参数都可以看做是已知的因此只要知道了犯罪嫌疑人的腳印大小就可以推断其身高.

上面已经知道了我们可以用条件期望来进行推断实际上这种推断只是一种估计,那么这种推断是否是可靠的嘞可靠的依据又在哪里嘞?

条件均值说白了就是在已知的条件下去预测的值,那么用条件均值预测有些什么好处嘞下面进行说明.

我们已经知道条件均值是关于未知数y的一个函数,我们不妨假定还有其他的关于y的函数可以对x进行预测判断这个预测值好坏的依据是误差要尽可能的小即 ,但是是一个随机多变量频率统计取值并不固定,因此就要求其均值

为了去掉绝对值方便运算将其替换成.

我们可以证明当 的时候成竝因此用条件均值进行预测的时候其均方误差将达到最小,这就是用条件均值进行合理预测的理论依据.我们也将称之为是第一类回归.

但昰当某些分布的密度函数未知或者是函数过分复杂的时候我们也可以降低要求即不寻求最优预测,只需求满意预测即可当不使用条件均值时我们通常使用一个简单的函数即线性函数来替代他进行预测,不妨设为的线性预测则我们要求

为了求出参数a和b,可以进行如下处悝将上式分别对a和b求偏导数然后求出稳定点a,b即可得到参数a,b的计算公式(很显然必然有一个a,b的取值满足上式).

我们将其称之为第二类回归由此鈳知对正态分布而言其第一类回归就是第二类回归,即在理论上来讲用条件均值来预测犯罪嫌疑人的身高是合理最优的预测方案.

随机多变量频率统计的分布函数可以全面的描述随机多变量频率统计的统计规律但是分布函数和密度函数使用起来并不方便,比如知两随机多变量频率统计他们两个相互独立其密度函数分别为则的密度函数即为的卷积但是当我们要研究即n个随机多变量频率统计和的分布的时候我們就要求次卷积,我的妈耶这个计算量是相当的大的,即便是如今的计算机也是吃不消的因此我们必须需求其他的工具来解决这个问題,在数学分析中我们知道傅里叶(Fourier)变换能够将卷积运算转化为乘法运算即因此我们密度函数进行傅里叶变换将卷积运算转化为乘法运算嘫后在通过傅里叶逆变换即可以求得密度函数,乘法运算显然是要比卷积运算方便的.

设是随机多变量频率统计的密度函数则的傅里叶变換是 ,i是虚数也即.

设 是任一随机多变量频率统计,则称

显然任何一个随机多变量频率统计其特征函数都是存在的因为 .

设的特征函数分别为则嘚特征函数为

设随机多变量频率统计有N阶矩存在则的特征函数可微N次且对

,这个公式可以方便计算随机多变量频率统计的K阶矩只要对其特征函数求K阶导数即可

从上面我们知道任何一个随机多变量频率统计分布函数唯一的对应着一个特征函数,实际上也可以证明任何一个特征函数也唯一地确定了他的分布函数即特征函数与分布函数是一个双射.由此我们就可以利用傅里叶逆变换根据随机多变量频率统计的特征函数来确定其密度函数与分布函数.

由特征函数我们可以看到,数学各个分支看起来似乎相互独立其实是各分支相互渗透的,概率论的产苼离不开数学分析,高等代数和复变函数的发展而概率论的发展也反过来推动了其他数学分支的发展,知识与知识之间要有迁移能力要囿整体上的把握,这样才能对数学有全面的了解.

1.6.7 大数定律与中心极限定律

前面说过对于随机试验随着随机试验的次数逐渐增多,频率将會逐渐稳定到概率平均值将会逐渐稳定到均值, 这个稳定只是一个很直觉的说法那么如和让这种直觉转化成数学意义嘞?这就是下面偠解决的问题.

设是n重伯努利试验中A试验发生的次数又A在每次试验中出现的概率为 .则对任意的 ,有

上式中的就是n次随机试验的频率,也就是說随着n次数的增加其频率趋向于概率的概率趋向于一这个是与数学分析中的极限概念是不同,极限是存在 存在当,的时候任意的都满足

洏伯努利大数定律是强调的是概率 ,当n趋于无穷的时候其概率趋向于一,也就是说事件发生的可能性会越来越大,但也有可能 的事件会发苼因此我们就将频率依照概率收敛于概率.

对于伯努利大数定律实际上我们是讨论了形如的随机多变量频率统计,当时的统计规律其中昰独立的服从分布的随机多变量频率统计,因此我们将伯努利大数定律推广到更为一般的情形

若诸是随机多变量频率统计序列如果存在瑺数序列使得对任意的 有:

成立,则称随机多变量频率统计序列服从大数定律由此可知,伯努利大数定律只是上叙大数定律的一个特例.

設是一些两两互不相关的随机多变量频率统计又设他们的方差有界,即存在常数 使得诸 则对任意的 有:

此定理可有切比雪夫不等式得证奣

由此可见伯努利大数定律是切比雪夫大数定律的特例切比雪夫大数定律是大数定律的特例

在证明切比雪夫大数定律的过程中其实我们鈳以发现只要则{}服从大数定律,即对任意的 有:

切比雪夫大数定律是马尔可夫大数定律的特例马尔可夫大数定律的重要性在与对于随机哆变量频率统计序列已经没有了独立性、同分布性、不相关性的假定,在以上大数定律的证明过程中都是以切比雪夫不等式为前提的因此嘟要要求随机多变量频率统计具有方差但是进一步的研究表明,方差的存在也不是必要的下面介绍一个与方差无关的大数定律,辛钦夶数定律

设诸是一系列独立同分布的随机多变量频率统计且数学期望存在:

在上面的所有大数定律中伯努利大数定律是证明了频率依照概率稳定与概率而辛钦大数定律是证明了平均值依照概率会稳定与数学期望,现有伯努利大数定律而后将其推广给出大数定律的一般形式而后将伯努利大数定律的条件一步步放宽,伯努利大数定律数切比雪夫大数定律的特例子切比雪夫大数定律是马尔可夫大数定律的特唎,无论是切比雪夫大数定理还是伯努利大数定律亦或是马尔可夫大数定律他们三者的证明都是与切比雪夫不等式有关因此要求其随机哆变量频率统计序列具有方差,但是辛钦大数定律是与方差无关的他至于随机多变量频率统计序列是否独立以及各自的数学期望是否存茬有关.

随机多变量频率统计序列的两种收敛性:

在大数定律中我们从频率的稳定性出发,引入了

即随机多变量频率统计序列{}依概率收敛于瑺数a的概念很自然的我们也把他进行推广,即不把它收敛于一个常数而是收敛于一个随机多变量频率统计于是引入如下定义:

设有一列随机多变量频率统计 如果对任意的,有

则称随机多变量频率统计序列{}依概率收敛于 记作

大数定律只是上叙依概率收敛的一种情况特殊情况

洳果我们已知 那么他们的分布函数之间会有什么样的关系嘞?

定义:设, 是一系列分布函数如果对的每个连续点都有

则称分布函数列{}弱收斂于

若随机多变量频率统计序列依概率收敛于随机多变量频率统计 ,则随机多变量频率统计序列的分布函数列 弱收敛于的分布函数

一般来說此定理反过来不成立

其中c为常数的充要条件为

为退化分布是的分布函数

此定理说明随机多变量频率统计和的分布弱收敛于退化分布这就昰大数定律

分布函数列{}弱收敛于分布函数的充要条件书相应的特征函数列{} 收敛于的特征函数 .

前面我们了解到特征函数有便于减少求独立随機多变量频率统计和的分布的计算量而且可以很方便的求出和的分布的一些特征数,有了这个定理之后我们将极大的拓宽特征函数的使鼡范围当求独立分布和的极限问题的时候这个工具将发挥出巨大的威能

之前曾经提到过高斯在研究误差理论的时候曾经利用了正态分布,那么大家有没有想过为什么会选着正态分布来研究误差嘞那么现在我们来研究一下误差到底是一个什么样的随机多变量频率统计,以峩国的东风导弹为例设靶心为原点,则导弹的弹着点为 ,现在我们已经知道都服从正态分布 可以看做是导弹射击的横向误差要和纵向误差,而造成产生误差的原因是有无数个微小的因数积累总和而成的比如空气的阻力,空气的湿度炮弹的火药差异,发射站的具体情况等等一系列原因造成的我们不妨假设这一系列的因素造成的横向误差和为误差为,即 我们暂且先把这一系列误差随机多变量频率统计看做是独立同分布的,现在我们来研究随机多变量频率统计和的分布数学家们发现,当的时候可能趋向于无穷这时候其方差越来越大均值也越来越大,造成分布极其的不稳定而且求其分布函数越来越困难,此时我们研究这种情形就没有什么现实意义我们只讨论取有限值时候的随机多变量频率统计,伯努利大数定律告诉我们:

这是因为先进行了随机多变量频率统计和的去中心化让后比上一个增长因子这样我们才能使得使得其分布函数序列弱收敛于一个分布函数,然后我们用近似分布区代替和的分布使得其特征函数序列也收敛于一個特征函数,这样我们就能够运用特征函数去求出随机多变量频率统计和的分布问题:

回顾一下我们之前的标准化我们不妨将随机多变量頻率统计和中心化之后再比上其标准差进行标准化

这样就能够使得不论n为多少 使得的分布能够大致稳定下来即依照概率能够使得当收敛於某一个,其分布函数也弱收敛于一个分布函数.

当是服从参数为的两点分布的时候,则有下述历史上著名的

在n重伯努利试验中事件A在每次試验中出现的概率为 ,为n此试验中事件A出现的次数,则

此定理的说明‘’二项分布收敛于正态分布‘’当n很大的时候可以用来近似计算二項分布的取值

而且此定理还可以用来计算伯努利大数定律事件发生的概率,而伯努利大数定律只是说明频率收敛于概率并没有说事件发生嘚概率是多少由此可知此定理比伯努利大数定律更强.

此定理的发明由棣莫弗首先研究,而后由拉普拉斯推广这个定理的提出就是正态汾布出现的雏形,但遗憾的是两位数学家并没有把正态分布当成一回事情只是把它用来近似计算二项分布,以前我们提到过二项分布收斂于泊松分布但是这里又提二项分布收敛于正态分布这是不是冲突嘞这其实不冲突,二则收敛的条件不同罢了收敛于泊松分布是要求 ,而正态分布则是要求 ,经过其他数学家的推广然后高斯才用正态分布来计算误差,而后拉普拉斯又整合中心极限定理发现随机误差正是滿足中心极限定理的.

将上面的定理推广之后就能够得到更加一般的定理即林德贝格—勒维(Lindeberg-Levy)定理:

若诸是一系列独立同分布的随机多变量频率统计且

上面的定理我们是在独立同分布的情形下提出的,但在现实环境中众多的微小元素虽然是独立的但是却未必是同分布的因此峩们要考虑独立但是未必同分布的的随机多变量频率统计序列的分布问题,为解决这一问题就有了林德贝格定理:

设随机多变量频率统计序列满足林德贝格条件(这个定理主要是保证能够稳定下来不趋向于无穷)则当是对任意的x有

故此定理证明了由大量的微小且独立的随机因素并且积累而形成的多变量频率统计,将会是一个正态随机多变量频率统计这样就能够理解为什么误差理论可以用正态分布来描述了.说皛了中心极限定理就是用来描叙正态分何以成为正态分布,什么样的随机多变量频率统计服从正态分布的一个定理.

  • 1. 给出以下四个说法:

    ①绘制频率汾布直方图时各小长方形的面积等于相应各组的组距;

    ②在刻画回归模型的拟合效果时,相关指数R

    的值越大说明拟合的效果越好;

    服從正态分布N(4,2

    ④对分类多变量频率统计X与Y,若它们的随机多变量频率统计K

    的观测值k越小则判断“X与Y有关系”的把握程度越大.

花了我一天整理出来的东东呀夶家可要好好利用,别辜负我的心意哟
一、名词解释:4分/题
1、视觉对比2、神经齐射理论,3、双眼视差4、记忆搜索的范畴大小效应,
1、哬为注意分配及如何改进  2、何为运动知觉及有哪些影响因素?
3、何为谓动作反应时及有哪些影响因素    4、技能已形成则具有那些特点?
1、试述人类记忆信息编码的方式    2、试述并比较能力的二因素说与三维结构模型。
5、试述你对现代认知心理学这一研究范式的认识

【原杭大不分年份试题】


一、名词解释:5分/题
1、大脑左右两半球功能不对称性, 2、彩色对比与彩色后像  3、系列位置效应  4、双重编码
23、声音掩蔽嘚一般规律 24、情节记忆与语义记忆  25、再造想象与创造想象  26、前提的气氛效应
二、回答问题:10分/题
1、结合实例说明心理是人脑对客观现实的主观反映2、什么是知觉?知觉有何基本特征
3、什么是遗忘?遗忘有何特点如何根据遗忘特点进行有效复习?4、试举例说明解决问题思维的阶段性
5、试述三种性格类型学说。6、试述并比较知觉模式识别的关键特征理论与原理论
7、试述佩沃(Paivio)提出的长时记忆中的双偅编码说及其试验依据。8、试述影响问题解决的主客观因素
9、试述情绪的不协调理论。     10、试述人本主义心理学或精神分析理论(任选一個)
11、试结合实例比较经典条件反射与操作条件反射  12、试述斯蒂文斯定律及其意义。
13、有何支持知觉整体先于部分的实验依据    14、试述並比较三种选择性注意理论。
15、试述概念形成实验研究的新进展   16、试述能力的形成和发展的条件。
【2006年华东师大心理学试题】
1感觉性测量的方法  2表象从感知到思维的重要作用。 3各情绪理论的主要区别
4意志行动的基本特征  5布伦塔诺的“意动心理学”的基本观点
6格式塔心悝学如何把“场论”运用到心理现象的研究
1外显记忆与内隐记忆的主要区别于关系  2问题解决的策略
3气质的高级神经活动类型理论   4能力的个別差异性
5华生的“概念行为主义”与“方法论行为主义”及其对当代心理学的影响
6“无意识”概念的历史演变看无意识问题在当代认知心悝学的地位
1责任扩散, 2操作定义 3准试验, 4埃默特定律 5蓝道环, 6心理旋转
1论述多种记忆分类类型      2阐述心理试验仪器的发展新动向以及列出十种心理学仪器
第一题和去年一样,都是一个大表选择公式的题目但是包括了参数检验和非参数检验吧!感觉比较难!
1用一个公式表达一下命题:某种疾病的发生机率虽然微乎其微,但是天长日久总会发生的
2是书上的84页那个图,书名一个心理学统计的知识点!估计昰那两个的定律都在书上自己看!
1是有关概率的计算问题,由于问题太长我没记全!不是很难!
2说明无交互作用的双因素方差分析的數据结构和方差分析表结构!

2005华东师大普心(包括心史、认知)

华东师范大学实验心理学2006年真题


1责任扩散,2操作定义3准试验,4埃默特定律5蓝道环,6心理旋转
7接受者操作特性曲线,8出声思维9费里效应,10混合设计
1论述多种记忆分类类型    2阐述心理试验仪器的发展新动向以忣列出十种心理学仪器
还是从真题开始吧实验心理学比起普通心理学来,还是稍微难一些对于很大一部分同学来说,实验心理学比较難理解还有就是比较麻烦的统计。但是从真题上看呢其出题规律似乎更简单了,就是2个题型名词解释和论述题。
今年的名词解释还昰沿用传统书上几个百个名词中随机抽取了10个名词来做题目。总的讲实验的2本参考书(杨本和郭本)都有涉及。这10个名词大多数还是鈈算偏的可能蓝道环和埃默特定律是偏的,我后者没答出来答了个类似的其他的一个定律。
具体的答我就不说了因为书上都有,我說说怎么答实验心理学的名词解释和普通心理学不一样,后者是每个3分前者是每个6分,也就是说实验心理学的名词解释需要答的更详細一些更全面一些要将相关的情况尽量写清楚,大约答个5行左右就够了除了核心的定义之外,需要记忆其他相关情况还是以理解和夶致记忆为主,不需要全部记住到时候能写多少是多少,用自己的话把相关情况写出来做到最多失2分左右就可以了。
至于论述题今姩和去年相比稍微麻烦了一些。去年竟然是一道信息检测论的计算题几乎所有人都会做。今年又回到和前年的传统中了出了2到论述题目,有意思的是一道是杨本的一道是郭本的。先说第一道这道题目其实是很重点的内容,是郭本那书中详细论述的5种记忆类型的内容只要把五种记忆类型写出来,把各自记忆定义说一说相关的研究成果展开讲一讲,基本上也就可以了这个题还是很考理解,其实理解了之后很多研究观点用自己的话就可以说出来了。
第二题说实话基本是个送分题因为实验仪器发展动向是杨本最后一章的重点内容,就那么几点然后展开一下,不难至于后面的10种仪器,那更简单郭本讲了12种仪器,杨本上讲的仪器更多关于仪器,建议大家全看几乎每年都有题目考到仪器。
所以总的说实验心理学(不算统计)的100分今年还是一般,不是很难如果能够将书上的几百个名词全理解记忆,把各章的核心重点内容理解的话还是很有希望考到70分以上的如果你的统计(50分)能够考30分以上,那么实验心理学考100分以上是臸少的。
另外基本可以判断,郭本的重要性在提高但是杨本依然不能忽视,尤其实验仪器这一块郭本的几章新内容很有可能是明年論述题的热门,像注意的操作定义、研究方法感觉直接测量,无觉察知觉人工智能,情绪的研究方法等
相比而言,实验需要理解和記忆的名词比普通心理学更多更专业化。因此理解的要求更大需要花的时间更多尤其是郭本的实验心理学,第一遍看的时候难度要仳杨本更难,需要一定耐心

华东师范大学普通心理学06真题


1注意 2自上而下加工 3程序性知识 4需要 5言语 6元认知 7交往动机8幻想 9深度知觉 10性格
1感觉性测量的方法。 2表象从感知到思维的重要作用 3各情绪理论的主要区别。4意志行动的基本特征 5布伦塔诺的“意动心理学”的基本观点     6格式塔心理学如何把“场论”运用到心理现象的研究
1外显记忆与内隐记忆的主要区别于关系   2问题解决的策略    3气质的高级神经活动类型理论
4能力嘚个别差异性    5华生的“概念行为主义”与“方法论行为主义”及其对当代心理学的影响
6“无意识”概念的历史演变看无意识问题在当代认知心理学的地位
对于专业课的复习真题是非常重要,那么第一步就从刚出炉的06真题开始
首先,从题型可以看出普通心理学所考的全昰主观题。无论是名词解释还是简答题甚至主观题,都需要回忆回忆的要求高于再现,因此相对于要求再现的客观题来说主观题的難度更高,不仅需要理解还需要记忆,从某种程度上说也就是死记硬背,当然这种死记硬背是建立在理解的基础之上的
其次,普通惢理学考的不仅是《普通心理学》一本书的内容同时还考了认知和心理学史的内容。在考试说明上称心理学史占50分认知和普心占100分。泹实际上06年的心理学史的分数不到50分,顶多40分(简单5、6和论述5、6)认知占了33分(名词解释2、3、6和论述1、2),而普心却占了77分之多!
但昰如果和去年的考试相比认知和普心的分数可能刚好调了个。去年认知第一次加入参考书结果至少考了70分左右的题目。由此可见心悝学史实际占40——50分,而认知和普心没有绝对的分配随着每年的情况不断发生变化。预计明年的认知的分数可能会增加而普心的分数會回落。而心理学史则还会维持40或48的格局因为心理学史没有名词解释,只能出2道或3道简答加2道论述
接着,各个题型具体怎么答名词解释应该是比较简单的,这10个名词解释在认知和普心的2本书中都是有的它既会考比较重要的,如程序性知识、元认知、注意、性格等吔会考些偏的,比如交往动机也就是说类似的名词都会考到,这些名词2本书加起来至少有300个左右实际上这就是一个随机抽取的模式,300個选10唯一能将所有分拿到的就是将这300个名词都记住,即使记不住也要理解理解了也能大致的写出来。
那到底具体该怎么答呢我们举個例子交往动机。交往动机的定义只有一句话指个体愿意与他人接近、合作、互惠并发展友谊的动机。但是仅写这句话还不够,应该稍微扩展一下再加上交往动机是个体心理发展的必要条件,也是社会生活的要求又称亲合动机。如果还能记住一些的话把那个关于茭往动机的实验也稍微说说。也就是名词解释的回答应该包括它的核心定义和一些具体的扩展而这些具体扩展是由书上的该部分内容来萣的,包括实际应用、生理基础、实验等等当然最核心的还是那一句话,必须要记忆至于扩展的部分个人建议只需要理解,大致记忆┅下考上的话,能写多少写多少另外要注意的是,名词解释不是写的越长越好大约3到5行就够了。
而简答题就有些难度了尤其是那2噵心理学史的题目。这个详细说一下第一题还行,讲的是感觉测量的几种方法:最小变化法、恒定刺激法、平均差误法和信号检测论烸种方法简要说明一下即可,不用展开第二题实际上就是书上的讲的表象的作用,只要答出表象与知觉、思维的联系区别以及表象是感知到思维的中间阶段和表象打破人的认识受到当前事物制约的局限即可第三题看起来有点麻烦,但实际上很简单因为情绪的各种理论嘚名称就解揭示了它们的区别——早期理论(注重生理研究)、动机唤醒理论(重视情绪的动机作用)、行为理论(注重情绪行为习得)、精神分析和体验理论(从精神分析术语来解析情绪)、认知理论(强调认知对于情绪的作用)。这也说明了要求对于整节内容的宏观把握的必要性一节或者一章学习之后,需要一个整体把握
第四题最简单,书上原文有第五、六是心理学史的题目,比较难答而且这2噵还都不是什么重点,至少对于跨专业的人来说意动在书上看起来不大起眼,复习时候容易纰漏但是他确实是心理学史上的重要人物。近年来心理学史的题目越出越难越出越偏,更加不容易把握因此各位对心理学史有个思想准备。         
第五题书上没有现成答案的,这吔是心理学史的一个特点因此需要将书中的相关内容整理成各种要点,实际上就是将书中的各种论点提出来进行复习这就加大了复习嘚量。要想答好第五题就要提取《西方近代心理学史》第六章第一节的各个论点——意动心理学认为心理学的对象不是感觉、判断等的内嫆而是感觉、判断等的活动,这种活动也称意动;意动必指向一个客体没有客体就没有意动;研究的方法是内省。这些在书上不是现荿的需要自己去提取的。这很难因为不可能作到将整书的东西全部这样弄,因此只有重点出击,将认为重点的内容进行论点归纳复習至于何为重点,何为非重点将在后面的文章详述。
相对于第五题第六题就更难了,这道题我不敢保证我的答案是对的因为书上沒有讲到其“如何运用场论来研究心理现象”只讲到了场论的基本要点和概念,我是把它理解为通过一些基本概念来研究心理现象那么答案就是这些基本概念:生活空间、行为与移动、力与力场、紧张与张力系统。当然这几个概念是非常抽象的如果平时没有很好理解,那很难在考试中写出来我认为整张卷子难难就难在心理学史上,这些东西本身就很难理解因为缺乏足够的信息去理解,而书上都是简單的引述这些著名心理学家的观点而无论证所以大家看心理学史,要做好第一遍看天书的准备! 简答题答的其实不用过于详细把该答嘚几个要点答出来就可以了。有些人认为做主观题就是名词解释写成简答简答写成论述,那论述呢写成论文?而且时间也是个问题彡个小时的时间其实还是比较紧张的。所以过分详细展开不是件好事言简意赅也能体现的你思维逻辑能力和表达能力。据我的经验华東师范的心理考试,就这么写没什么问题另外从简答题的内容可以看出它的可以出题的范围很广,需要比较宽的知识准备
1外显记忆与內隐记忆的主要区别与关系    2问题解决的策略    3气质的高级神经活动类型理论
4能力的个别差异性     5华生的“概念行为主义”与“方法论行为主义”及其对当代心理学的影响
6“无意识”概念的历史演变看无意识问题在当代认知心理学的地位
接着讲论述题,如果说简答有那么一点麻烦嘚话那么论述是这门专业课的主要卡分的项目。尤其对于跨专业的同学来说很难答的准确、到位。这一点我深有体会比如第一题就昰如此书上关于内隐和外显的区别写的不是很多,顶多也只是一个简答题的长度我当时就郁闷了,怎么写呢仅写“外显记忆是有意识提取的记忆,内隐记忆是无意识提取的记忆”书上其实也就这句话。实际上在碰到这种题目的时候所能做的就只有综合你所复习的所囿有关的知识没有其他办法。你不是说要说区别吗只要有关的区别,我都拉上什么“测验形式的上差别,直接测验与间接测验”什麼“程序性知识和陈述性知识的区别”等等,而联系则用到了实验心理学中知识了内隐与外显的相互作用,同一个心理过程不会是绝对嘚内隐或者外显甚至再拉上2种不同的内隐记忆的理论。
其实到现在我都很难去答全这个题只能将自己的理解尽量的写全,或许这类题目就是如此书上找不到但是科班出身的就能答的更好一些,这样的题目当时一定是做过这也是本专业的一个优势吧。这也说明了笔记嘚重要性
2到4题还是可以答的,书上基本上有比较详尽的答案复习全面的话,这类题就必须拿下要说一下的是第4题,这道题是几年前絀过的很有意思,这说明了出过的题也可以再出心理学史的佛洛伊德就出了好几年。
最后讲讲最后2题简直就是最难的2道,尤其是最後一道第5题也是需要归纳华生那章内容的,尽管没有直接写明当时有6点,必须有选择的加以改造突出其影响。我是这么答的要点昰:把心理归结行为,忽视内部心理研究从而造成一种无头脑的研究;其行为主义是一种元素主义;对神经中枢的忽视所带来的影响;荇为主义环境决定论;动物心理研究方面的影响;行为主义的另一面,好的一面的影响就是这么写,也还不够但是没有其他可以写了,所能掌握的就只有这些了
最后一道题,就更需要发挥了需要扯上很多相关内容。无意识的历史有很多,大致是布伦塔诺的意动心悝学赫尔巴特的意识阈,叔本华的无意识意志、尼采的超人说精神分析的潜意识,最后是认知心理学的内隐记忆、产生式系统内隐學习等。历史方面书上还是有的只不过需要汇集各本书的知识。但是地位就几乎没有涉及或者就很少。我只能说地位是高的是热点等等,然后举出一些例子来证明其中心地位总的说,最后2题还有第一题很难答全或者不大可能答全,只能作到少扣分而已这也是为什么这门专业课,120+难以见着的原因了
从上面分析可以看出,论述需要更高要求的理解理解的范围要扩大,需要更高要求的记忆记忆的內容扩大到一节甚至一章、全书、几本书。需要联系章与章之间的知识点需要跨几本书来答题目,比如说最后一题有心理学史的,吔有认知心理学的第一题,有普心也有认知甚至还有点实验心理学。而在具体技巧方面只能说尽量扯上相关内容是我唯一心得,不偠空着可以发挥,能扯就扯甚至自成一理也可。 从前2篇的真题解析可以得出复习的总的思路和对策(仅指《普通心理学》)名词解釋需要对概念的记忆和理解,简答题则要对某原理、论述的简要评述大部分出题书中原**有,而论述题则要求对某个论断展开讨论往往昰某节的内容,相当于块状知识
因此,复习准备程度至少达到这样的要求: 一、全书17章的所有概念必须记忆和理解; 二、全书适合简答絀题必须记忆和理解; 三、全书适合论述出题必须记忆和理解
达到了上述要求,《普通心理学》的分数拿到80%将没有多大问题至于其余嘚20%则要看你理解的深度、记忆的广度和临场发挥的程度。 那么怎样才算是适合出名词解释、简答和论述呢名词解释问题不大,基本上所囿的概念都是潜在可能凡书中出现的有定义的心理学名词都算,书后的各章的第一题是参考凡上面写的各个概念也是重点。简答和论述就有些麻烦除了书后的题目需要记忆和理解之外,某些内容也非常适合
适合考简答题的内容特征是: 一、有多项列出的,至少三项鉯上; 二、篇幅不大大多是某节内的某个版块或某个主题。
适合考论述题的内容特征是: 一、有多个明显的分论述点每个分论述点又囿若干展开; 二、篇幅较大,往往涉及某一整节或半节的内容
大家可以根据近年考题加以对照,关于我认为的适合的简答、论述将在後面的文章公布。
那么只剩下最后一个问题理解记忆的程度要达到怎样的标准?这个可参看前2篇文章的关于各个题型的解答要求名词解释要求对核心定义要记忆,对关于该概念的其他涉及要理解大致记忆简答题要求对各项要点记忆,略微展开论述题要记忆各个重要嘚分论述点,展开要大致记忆和理解当然所有东西都能够记忆的话,那也是可以的不过,其所需时间将无法计算而且也没有多大必偠,就相当于把全书都背下来一样的毫无必要
所以,在三轮复习过程中第一轮,通览全书;第二轮理解所有难点,记下所有可能考洺词、简答、论述的内容;第三轮记忆。其中理解第一理解也是帮助你扩大记忆广度的好方法,有些没有记忆的东西还是可以根据洎己的理解写出一些东西来,尽管不全这对于心理学考研,要求的内容过于繁重复杂是很有帮助的 普通心理学的经验就写到这,这本書《普通心理学》的重点、难点和适合考简答、论述的部分将在后文给出敬请期待。

2005实验心理学(不全)

【04年华东师大统计试题:】


1給了一些数据,要你根据数据在正态分布曲线图上标示出p,O,Y
2,一些填空题包括抽样分布的方法,大样本二项分布的平均数和方差因素囷水平的差别,质和量的相关的种类测定系数和相关系数的关系。
3从大样本独立四格表的比率检验公式推导卡方检验的公式。   4论述等级评定数量化的原理。
5一个计算题,比较两组前后射击成绩的差异用相关样本t检验
一、解释下列术语(3×10)
1、简答心理过程以及它們之间的内在关系      2、注意分配以及注意分配要具有哪些条件。
5、冯特一生在心理学方面的历史功绩有哪些  6、简答什么是信息加工的认知惢理学。
三、论述题(12×6)
3、试述意志过程与认识、情绪情感过程和个性心理之间的相互关系4、举例说明智力技能形成的五个阶段。
5、試述弗洛伊德精神分析理论的早期和后期理论中的主要内容
6、试述皮亚杰提出的认知结构的四个基本概念及其相互关系。
二、问答题(15×4)
1、具体说明反应时研究方法在心理学研究中的地位和作用  2、视觉实验中的自多变量频率统计、因多变量频率统计和控制多变量频率统計
3、记忆理论和研究进展    4、说明立体镜的原理。
一、填充题(16×1)
1、用来测量的量尺既要有--------,又要有---------测量所得数据的平均--------,这是才鈳以计算差异系数
4、相关系数抽样分布的形态随着总体相关系数ρ和样本容量n的大小而变化,当--------时样本r的抽样呈正态分布;当-----------时,r的抽样分布接近于正态分布;当 ---------- 或-----------时r的抽样分布呈偏态。
二请谈谈下列三个公式有什么关系(8)
有三个公式,过于复杂无法输入。来洎:vincent0 这三个公式是王孝玲《教育统计学》(1993年6月第一版)中的7-17式7-24式和11-21式
三、请根据定义公式提出相关样本四格表的x2检验缩减公式(5)
四、什么是二元线性标准回归方程?(5)
(一)为了了解某校三年纪480名学生的学习成绩首先将他们的成绩分为上、中、下三层,各层人数分别為120、300、60各层的标准差估计为10、12、13,假如要求从全年级中抽取60人请用最优配置法计算各层应抽取的人数(6)
(二)五位教师对甲乙丙三篇作文分别排定名次如下表:
一、名词解释(每题5分,共25分)
什么是相关样本请列举相关样本显著性检验的各种情况。
三、计算题(每題5分 共15分)
1、如果有一个相关系数r=0.5,请将其转换为等距单位的Zr值
2、有5名女生,物理测验成绩分别是6869,7071,72;另有7名男生成绩分别昰40,5060,7080,90100。现需要知道男女生成绩是否方差齐性请计算相应的检验统计量(不需要查表)。
3、某小学根据各方面条件基本相同的原则将32名学生配成16对然后把每对学生随机分入实验组和对照组,实验组的16名学生参加课外科研活动对照组的16名学生不参加此活动,一學期后统一进行理解能力测验。结果发现有9对学生的理解能力测验成绩明显拉开了距离,其中8对是实验组学生得到“及格”对照组學生得到“不及格”;1对是对照组学生得到“及格”,实验组学生得到“不及格”问:参加课外科研活动对理解能力测验有无显著影响?
一、简述题(每题3分共15分)
1、教育测验与智力测验的不同之处   2、效度与信度的关系   3、鉴别指数对测题的意义是什么
4、考夫曼的智力量表与传统智力量表在哪些方面有不同    5、MMPI中双高峰的意义和作用
二、计算题(每题3分,共15分)
1、某测验的被试为2—5年级的小学生已知信度昰0.85,标准差为10现欲知道仅用于4年级时信度是多少,4年级的标准差是5
2、测验有20道测题,其信度仅为0.55若把测题增加到60题,信度能达到多尐增加到120题呢?
3、一个儿童参加斯坦福—比纳智力测验得到智商分为111,请问如以95%可靠度要求其置信区间在哪一段分数内?
4、某儿童茬韦氏儿童智力测验中言语智商124,操作智商115已知这两个分量表的信度分别是0.97和0.93,请问这两种智商间有无显著差别:
5、一个五择一的测量难度值0.61另一个四择一的测题难度值为0.64,请问这两个测题哪个难度值更高些
三、问答题(共20分)
1、为什么说测验的原始分数不能用来解释测验的结果?(5分)
2、在选择题中怎么样的选项是可以被接受的(5分)
3、眼下智力定义尚未有统一看法之前,智力测验可不可以进荇为什么?如何做更为合理(10分)

2001年华东师范大学


【考试科目:普通心理学  招生专业:心理学 】
一、简述下列术语(每小题3分,共30分)
二、论述题(每小题10分共70分)
1、从反映的内容、形式和时间三方面,分析思维与感知觉之间的区别与联系
2、阐述遗忘发生的主要原洇。   3、影响一个人性格形成和发展的主要因素是什么请逐一加以阐述。
6、阐述斯金纳对个体行为分析的核心观点   7、列举和说明信息加笁心理学的主要研究内容。

【考试科目:心理统计学与心理测量学  可以使用计算器   心理统计学部分 】


1、完全随机设计和方差分析和随机区組设计的方差分析有什么区别(10%)
2、什么是非参数检验?它有什么特点(5%)
3、为了建立最好的多元线性回归方程,一般采用什么方式選择自多变量频率统计(5%)
1、通过随机抽样,抽取了A、B两组被试施以不同的教学方法,期末考试成绩如下:
为检验教学方法的效果有無显著差异请计算必要的检验统计量。(10%)
2、有3位教师对5位学生的作文进行等级评定结果如下:
A生得到的等级评定分别是:3、5、3;
B生嘚到的等级评定分别是:1、2、2;
C生得到的等级评定分别是:2、1、1;
D生得到的等级评定分别是:2、3、2;
E生得到的等级评定分别是:2、4、3;
请計算3位老师评定的肯德尔和谐系数。(10%)
3、134位学生参加寒假长跑训练开学后发现长跑成绩显著进步(由不及格变成及格)的有38人,显著退步(由及格变成不及格)的有19人问长跑训练有无显著效果?(5%)
4、100名学生的数学成绩和语文成绩之间的斯皮尔曼等级相关系数为0.78问:二者从总体上说是否存在相关?(5%)
一、简述题(每题3分共15分)
1、心理测量属于哪一种水平的测量,为什么   2、态度量表的编制有哪幾种方法。
3、项目鉴别指数有什么意义  4、投射测验的理论假设是什么。   5、如何理解心理测验的三要素
二、计算题(每题3分,共15分)
1、巳知某量表的分半信度为0.63请计算原长度的信度系数?
2、已知某测题高分组通过人数70%低分组通过人数是38%,其鉴别指数是多少该鉴别指數能否被接受?
3、已知某个测验的信度为0.75要使该测验的信度达到0.90,必须增加多少题目
4、假定韦克斯勒儿童量表中国修订版的信度为0.95,請计算出其标准误
5、假设使用某种测验选拔员工100人,经过一段时间的工作检验得到以下四组数据:
正确接受为42人,正确拒绝为34人错誤接受为10人,错误拒绝为14人
请计算出该次选拔的总命中率。
三、问答题(共20分)
1、对心理学界各种智力定义你如何评价(10分)    2、测验標准分数的意义。(5分)
3、在测验实施时主试应该注意哪些问题(5分)

【考试科目:实验心理学 招生专业:基础心理学    发展与教育心理學    应用心理学】


一、名词解释(每题5分,共60分)
1、习惯误差 2、无关多变量频率统计 3、月亮错觉 4、双手调节器 5、双耳时间差 6、单盲实验
二、問答题(每题20分共40分)
1、指出并分析下面实验中的自多变量频率统计、因多变量频率统计和控制多变量频率统计,并指出此实验得出了什么结果
莱博维茨(Lelbowitz,1967)研究了年龄与形状恒常性的关系在他们所用的实验仪器中,首先呈现给被试一个物体这是一个可以倾斜成各种角度的图形。实验让被试在四种倾斜角度的比较刺激中选择一个与观察刺激看起来同样的形状这些比较刺激是一系列从圆形到逐渐拉长的椭圆形。被试年龄范围从4-21岁实验中许多条件可以利用。图8-30是观察刺激在两种倾斜角度下不同年龄被试的形状恒常性保持程度曲线
图8-30 不同年龄被试对两种倾斜角度不同刺激的观察之恒常性曲线(采自Lelbowitz,1967)
2、简述记忆研究的过去、现在和展望(侧重理论和方法上阐述)

【考试科目:教育心理学】


一、对以下成对能力的界定及获得作简要阐述(每题8分,合计40分)
4. 有组织的言语信息与认知策略;   5. 陈述性知识与程序性知识。
二、对知识与能力的界定无论在理论上和实践中都会有一些不可操作的说法,请(1)依据当今认知心理学家的观點对它们的界定与分类作出陈述;(2)并就它们之间的互动情况作举例说明(20分)。
三、人们通常不会把学生在写字时能熟练控制自己嘚手部运动称之为动作技能的学习(1)请您对何时才会出现动作技能的学习作出确认;(2)并就动作技能获得的阶段及其影响因素作逐┅描述(20分)。
四、对于态度与品德的形成与改变心理学家已提出多种理论予以解释请(1)阐述这些理论的要点,(2)并据此对德育教育的特点提出您的建议(20分)

2000年华东师范大学


【考试科目:普通心理学(含心理学史)】
一、简述下列术语(每小题3分,共30分)
二、论述题(每题10分共70分)
1、试述知觉是人对感觉信息的组织与解释过程。
3、试述概念形成的过程和影响概念形成的因素 4、试述场独立性和場依存性与人格特质之间的关系。
5、试述斯金纳行为主义心理学体系的主要内容和基本观点 6、试述格式塔心理学的研究方法。
7、试述认知心理学与行为主义心理学的本质区别
【考试科目:心理统计与测量(需带计算器)  心理统计部分 】
一、是非题(10分):请仔阅读以下呴子,判断其是否正确用T表示正确,用F表示错误填写在前面的括号中。注意不得使用任何其他符号。
(  )1.差异系数是一种相对差异量 (  )2.抽样分布指的是抽取的样本中个体数值的次数分布。
(  )3.从正态总体中随机抽取的容量为n的一切工作切可能样本的平均数的分布吔呈正态分布
(  )4.当自由度逐渐增大时,t分布逐渐接近正态分布 (  )5.总体上的各种数字特征叫总体统计量。
(  )6.相关系数可以直接计算其平均数(  )7.对一元线性回归方程,可以有多种方法检验其显著性
(  )8.偏态量和峰态量是用以描述数据分布特征的统计量。
(  )9.中位数检验就是比较两个样本中的中位数高低
(  )10.从正态分布图来看,z=0处的概率是最大的
1.什么是标准分数?使用标准分数有什么好处(4分)    2.方差分析是逻辑是什么?(4分)
  如果有两个样本一个是实验组,另一个对照组分别施以两种教学方法,后期测验后如何对其成績(百分制)进行统计检验以确定两种教学方法有无显著差异?
  有一个双因素方差分析实验A因素为教材,共3种;B因素为教法共4种。茭叉分析后得到12种处理假定每个处理中有2名被试。经过教学后进行测验得到一个方差分析表,请完成它注:不必说明有无显著意义等。(答案按照1-12填写在答题纸上)
  研究人员对10个家庭的儿童的问题行为程度(X)及其母亲的不耐心程度(Y)进行了评价结果如下:
求X与Y嘚相关系数。注:X与Y的总体均不为正态分布
一、简述题(每题3分,共15分)
1.比纳-西蒙量表与先前的测验相比有哪些特点
2.推孟修订的斯坦鍢-比纳量表与比纳-西蒙量表相比有哪些改进。
3.韦克斯勒儿童智力量表的构成及特点 4.投射测验的特点。 5.心理测验的三要素
二、计算题(每題3分共15分)
1.某个测题高分组有80%的被试通过,低分组12%的被试通过其难度是多少?
2.已知某测题高分组通过人数是70%低分组通过人数38%,其鉴別指数是多少该鉴别指数能否被接受?
3.已知某个测验的信度为0.75要使用该测验的信度达到0.90,必须增加多少题目
4.斯坦福-比纳测验14-18岁组的信度为0.98,请算出其标准误
5.如果已知某被试斯坦福-比纳量测定IQ为120,那么真分数在95%的可靠度要求下变动范围是多少
三、问答题(共20分)
1.试論如何正确使用测验,防止滥用的方法(7分) 2.测验的标准化应包含哪些方面的内容。(7分)
3.谈谈如何认识心理测量的间接性特点(6分)
【考试科目:实验心理学】
问答题(10分/题,共10题)
1.写出10个心理实验自多变量频率统计(限写10个)  2.写出10个心理学常用仪器(限写10个)
3.何谓反应时减法法    4.比较三种传统心理物理法的优缺点。
5.身高1.75米在100米处被知觉为1.65米。请用常性系数计算公式算出其常性系数
6.分析信号检测論的两个独立指标d’和β。    7.试论记忆研究的传统方法与新方法。
8.何谓人工概念试举例说明之。    9.请用一个具体实验说明情绪和认知的辨证關系
10.何谓练习(学习)曲线?它有哪几种基本类型
1999年华东师范大学
【考试科目:普通心理学(含心理学史)】
一、简述下列术语(每尛题3分,共30分)
二、论述题(每题10分共70分)
1、试述经典性条件反射与操作性条件反射的异同。   2、试述创造性思维与一般思维的区别
3、試述智力结构诸理论。    4、试述性格和气质的区别与联系
5、试述格式塔心理学的基本观点及其组织原则。  6、试述E?C?托尔曼的新行为主义惢理学的主要看法
7、试述人本主义心理学的基本理论。  
【考试科目:实验心理学】
一、简答题(每题4分共40分)(任选10题,若多做最後一题作废)
二、问答题(每题15分,共60分)
1、控制额外多变量频率统计的方法有哪些 2、情绪有哪些心理、生理指标。

【考试科目:心理統计与测量(可带计算器)心理统计部分】


一、设Z~N(012)根据Z值求出相应的概率。(5×2=10分)
二、有3种语文实验教材为检验其在4种不同教學方法中的教学效果,交叉分组后得到12个处理经过教学后,在每个处理中抽取2名被试进行测试得出部分数据如下表,请完成这个方差汾析表无需查表作结论。(12分)
三、什么是独立样本什么是相关样本?(8分)
四、现有40位学生的英语测验成绩如下问男女学生成绩囿无本质差异?(10分)
五、170名6年级学生的数学与语文成绩的相关系数为0.30问:从总体上来说,6年级学生的数学与语文成绩之间是否存在相關(5分)
六、什么是测定系数?写出出它的公式和含义(5分) (附正态分布概率表)
一、概念解释(16分,每题4分)
二、计算题(12分烸题2分)
1、某同学经韦克斯勒儿童智力量表测试,其智商为120转换为T分数是多大?
2、韦氏儿童智力量表的r比=0.96问该测验的测量误差有多大?  3、请估计这位同学的IQ真分数
4、一个测验奇偶相关系数为0.7,全长测验的r比有多大=0.35,那么它的鉴别力有多大=0.75,下端27%
5、某测验的测题全蔀都是五选一的选择题第一题上端27%的=0.6,那么矫正机遇之后的难度为何值?
6、如果上述测题的第一题的
1、指出以下活动是测验、测量、既是测验又是测量、或既非测验又非测量:(6分,每小题1分)
A.零点公司调查员通过电话要求每个被调查人结一系列有关商品的是非题作答
B.調查员把以上调查中对每个商品作出肯定反应的数目用表格的形式表示出来
C.一位一年级老师让每个儿童抄写拼音字母,然后根据抄写的囸确数将儿童分类
D.一位社会心理学家观察了坐在公共汽车双人座的彼此陌生的同性和异性间的相互关系的表现
E、在一章教完之后,教师讓学生完成五道题并收回答卷
F、实验心理学专业的一名学生记录了一只老鼠学会在听到蜂音器声音就按杆所需的时间。
2、韦克斯勒儿童智力量表(WISC-R)的基本特点是什么它在哪些方面继承了,又大哪些方面发展了比奈量表(8分)
3、根据你使用心理测验的体会,说明认识惢理测量的间接性特点的意义(8分)
1998年华东师范大学
【考试科目:普通心理学(含西方近代心理学史)专业:心理学学科 】
一、简释下列名词(每小题3分,共30分)
二、问答题(每小题10分共70分)
3、举例说明了解学生的气质特征对教育工作的意义。   4、试述能力的个别差异
5、试述心理学发展过程中(从19世纪末到20世纪后期)的主要学派和思潮。
6、试述华生的行为主义心理学的基本观点7、试述皮亚杰关于儿童發展阶段及其标志这些阶段的行为特征。
【考试科目:实验心理学】
一、选择题请你在正确的答案前打上圈(每题4分,共40分)
C、因素实驗和函数实验同时进行   D、视情况而定有时先作函数型实验,有时先作因素型实验
A、温度反应比较快冷觉反应比较慢      B、痛觉反应比较快,触觉反应比较慢
C、视觉和听觉比较快触觉和嗅觉比较慢  D、听觉和触觉比较快,味觉和嗅觉比较慢
3、阈限必须反复加以测量因它是一個统计值。这是因为阈限
C、是刺激维上的一个逐渐的过渡区    D、反复测量可以消除偶然错误
4、在知觉中封闭阈限一般呈现的周长必须有完整形的
5、用螺旋图形装在色轮上
A、当色轮顺时针转动时,则见到螺旋扩大当色轮突然停止,可看到相反的运动
B、当色轮顺时针转动时,则见到螺旋缩小当色轮突然停止,可看到相反的运动
C、当色轮逆时针转动时,则见到螺旋扩大当色轮突然停止,可看到同向的运動
D、当色轮逆时针转动时,则见到螺旋缩小当色轮突然停止,可看到同向的运动
A、取决于物体的照度 B、取决于物体的亮度 C、取决于粅体所反射到眼中的光量 D、取决于物体的反射率
7、属于运动幻觉现象的一个例子是:
8、声学上习惯用的参照强度是:
9、闪烁刚刚达到融合時的光刺激间歇的频率称为闪光临界频率(CFF),不同的CFF差异很大但一般在
10、在声音的掩蔽中,一般而言应着解决
二、问答题(每题20分,共60分)
【考试科目:心理统计与测量 可以携带计算器 《心理统计》部分 】
一、名词解释(3×5=15)
1、几何平均数 2、相关样本 3、方差齐性 4、协方差  5、非参数检验
二、简答题(5×2=10)
1、标准正态分布的曲线有哪些特点   2、方差分析的逻辑是什么?
2、对10名同三学生的语文成绩和英语成績进行排名得出以下结果:
3、某校3个班的测验结果如下:为了进行方差分析,
请计算组间平方和、组内平方和、组间自由度、组内自由喥和F比值(10)
【《心理测量》部分 】
一、简要解释概念(共9分)
二、计算题(共14分)
一代数测验有40个“五选一”的选择题,实话于高一姩级100名学生现获如下资料:第一题的难度P为0.6,St=10∑pq=7.5
①计算第一题矫正机遇之后的难度 (1分)
②如第一题上端27%的P=0.75,下端27%的P=0.35该题鉴别力指數为多大 (1分)
⑤如一学生实得分数为30分,在95%的可靠度的范围内估计此生的真分数 (3分)
⑥如果已知这100名学生的语文成绩、政治成绩、粅理成绩,数学区里统考成绩和高二时的立方体几何成绩欲求代数测验准则关联效度,有哪几种计算方法每一种计算方法的效度又有什么称呼? (3分)
3、简要叙述韦克斯勒儿童智力测验(WISC—R)的离差智商的计算方法  (6分)
4、如果要你编制一个智力测验试述编制过程  (9汾)

1997年华东师范大学


【考试科目:普通心理学(含西方近代心理学史)】
一、简述下列各对概念(每小题3分,共30分)
1、感受性和感觉阈限  2、表象和想象  3、语义记忆和情节记忆 4、陈述性知识和程序性知识 5、数据驱动和概念驱动 6、语言和言语 7、形象思维和抽象思维  8、情绪和情感  9、能力和智力  10、个性和性格
二、问答题(每小题10分共70分)
1、试述注意的基本特征。 2、试述解决问题的思维过程 3、试述个性倾向性及其關系。
4、试述制约个体心理发展的因素 5、试述冯特对心理学的贡献和局限。
6、试述勒温的动力场理论 7、试述皮亚杰的心理学的基本理論和基本概念。
【考试科目:心理统计与测量   “心理统计”部分(共50分)】
一、名词解释(15分)
1、方差分析的三个基本前提是什么(5分)   2、在抽样调查中有哪些主要的抽样方法?(10分)
1、某大学调查3000名学生对某一社会现象的看法结果表示赞成的有860人,表示反对的有1140人鈈置可否的有1000人。问这3种看法的人数之间是否具有显著差异(10分) [请注意试题末尾的提示]
2、对13名男生和9名女生分别进行同一内容的心理測验,结果如下:(设测验成绩服从正态分布):
【“心理测量”部分(共50分)】
一、简要解释概念(每题3分共15分)
二、计算题(每题6汾,共12分)
1、一个测验应用于某一群体其标准差是8.00,信度是0.64假如应用于另一群体,其标准关是12.00试用克莱公式计算信度,并对结果加鉯说明
2、某被试获IQ分数为69,其测量标准误差为3试估计该被试真分数95%可靠度的所在范围,并对结果进行解释
三、回答问题(共23分)
1、試说明信度是效度的必要条件,而不是充分条件(7分) 2、简要说明编制心理测验量表时选择测题应考虑的因素。(8分)    3、以智力测量为唎试论心理测量的间接性。(8分)
【考试科目:实验心理学】
[第一部分]请在正确答案前打“√”(每题4分,共40分)
一、最初对图形与褙景加以区分的是:
二、汉字的辨认在心理学上主要服从于
1、知觉的恒常性原则 2、知觉的整体性原则。 3、字体的笔划多少 4、字汇量。
1、一个纯粹的物理概念   2、一个纯粹的心理概念。
3、既不等于放射能也不等于视觉,而是一个关系的概念——心理物理概念   4、无法定義的概念。
四、响度量表的单位是:
五、记忆系统中储存能量最大是
六、可见光谱波长的大致范围是
七、光谱中色光混合的按加法法则,如
八、“米勒综合症”表现为
九、短时记忆信息的保持
十、为什么声波的削心对可懂度的影响较大而对削峰影响较小?这主要是因为:
问答题每题20分, 共60分
一、0.5米被知觉为身高1.8米的人,走到20米处被知觉为1.6米、问知觉的恒常性保持了多少
二、影响反应时有那些因素? 三、何谓“控制”控制无关多变量频率统计的方法有哪些

华南师大考研题()2006年华南师范大学心理研究方法试题


1.能提供各个数据在其佽数分布中的位置信息的量是
2.为更全面更客观地描述一个数据和比较两组数据,常需要了解数据的
3.取若干学生参加某数学竞赛的成绩计算成绩与性别的相关关系,最好用
4.被试团体的同质性程度会影响
5.测验总分分布出现负偏态说明测验整体难度
6。信度和效度的关系是
A. 信度高效度必然高 B.信度高,效度不一定高C.效度高信度必定高  D.效度高,信度不一定高
ROC曲线生态学效度,Stevens定律部分报告法,拉丁方法标准正态分布,实验范式埃默特定律
1、如何测定听觉适应的效果   2、如何用信号检测法做再认研究?
3、如何判断反应时数据是否存在顺序效應和疲劳效应
4、进行统计假设检验的步骤有哪些试论述假设检验思想
6、通过一个实验例子,说明反应时减少的原理    7、试论述调查研究中瑺用的抽样方法
1、设计一个实验,考察熟悉性与意义性对记忆效果的影响
2、某年高考总分符合正态分布其中μ=500,σ=100考虑到招生指标,只有5%的学生能升入重点大学问重点大学的最低录取分数线应该定为多少?

【2005心理学基本理论】


一、名词解释(每题4分共40分)
二、简答(每题10分,共60分)
4、简述主要的情绪理论  5、简述关于脑功能的重要学说   6、简述概念结构的主要理论
三、论述(每题25分共50分)
1、述评当湔关于注意认知研究较有影响的理论  2、述评重要的人格理论
一、名词解释(每题4分,共40分)
1、对偶比较法2、问题行为图3、辨别力指标(d’)4、集中量数5、深度视锐6、麦考勒效应
7、准实验设计8、暂时阈移9、色光混合三元色10、标准分数(z分数)
二、简答题(每题8分共56分)
1、在被试取样时,应该根据哪些因素确定样本的大小
2、能否用两总体平均数差异z检验或t检验逐对检验多个总体平均数的差异显著性问题?为什么
3、情绪实验时,常用的因多变量频率统计指标有哪些 4、记忆研究时,材料呈现有哪些方式
5、主观轮廓形成的条件? 6、试述分层抽样的原则和方法
7、简述心理量与物理量之间的关系?
三、综合题(每题27分共54分)
1、例举至少5种控制干扰多变量频率统计的方法?
2、茬一项反馈对知觉判断的影响研究中
问实验组的平均结果是否显著高于控制组(用到的统计量在括号中给出了)
【2004年《普通心理学》】
6、概念驱动加工  7、标准分数 8、系统误差 9、对偶比较法 10、操作定义
二、比较“特异化理论”与模式理论的异同。
三、 信号侦察论与传统的阈限测量有何不同
四、试分析影响能力形成的原因和条件。
五、 控制无关多变量频率统计的方法(至少5种)
【2004《发展与教育心理学》】
1、潛伏学习  2、归因3、认知方式4、连续接近技术5、精加工策略6、观察学习
7、双生子爬梯实验  8、回避型依恋9、观念采择能力10、新皮亚杰学派
1、简述有意义学习的条件与过程 2、简述奥斯古德三维迁移模式理论的基本思想
3、简述Ts=Ms×Ps×Is的含义,其理论的主要思想  4、简述维果斯基的心理发展觀
5、简述影响心理发展的因素及其相互关系
1、论述建构主义关于学习与教学的基本思想
2、述评皮亚杰、柯尔伯格关于道德认知发展理论及其对于当代道德教育的启示

四、 1什么是口语报告法什么是问题行为图?(8)
2下面是被试为解答如下密码问题的一些口语记录请把它们轉换成问题行为图?(12)
(1) 两个D每个d都是5,因此T是零”
(2)“现在,我还有没有另外的T没有,但是还有一个D就是说在那一边还囿个5。”
(3)“现在我分别有两个A和两个L在某个地方,而这个R则三个两个L等于一个R,当然我
现在可以进1,这意味着R必然是奇数因為两个L——两个任何数字相加必定得出偶数,而我将
有一个奇数因为两个L——两个任何数字相加必定得出偶数。而我将有一个技术所鉯R可能是
1、3而不是5、7或9。”
(4)“现在看G既然R必将是技术以及D是5,G必定是一个偶数我看这道题的左边,那里说D
+G哦,可能还要加另外┅个数如果我必须从E+G。哦可能还要加另外一个数,如果我必
五、把下列分数转换成标准分数(15)
六、总体中抽取研究样本的方法有那幾种并作出一定的评价(15)
七、什么是平行分布式加工的研究范式(20分)

【2003《发展与教育心理学》】


一、名词解释(4×10=40)
1、控制点2、自峩效能感3、品德4、操作性条件反射5、支架式教学设计
6、年龄特征7、最近发展区8、视觉悬崖实验9、两难故事10、代沟
二、简答题(10×5=50)
1、简述遷移的产生式理论的主要观点  2、简述陈述性知识与程序性知识的区别和联系
3、简述奥苏贝尔的教学理论的主要观点  4、简述新老精神分析学派发展观的异同
5、简述关于语言获得的主要理论
三、论述题(30×2=60)
1、试论联结派学习理论与认知派学习理论的主要区别
2、试述皮亚杰关于兒童认知发展的理论及其对教育的意义
【2003《认知心理学》】
一、解释下列概念(3×10=30)
1、认知科学   2、原型3、结构优势效应4、鸡尾酒会效应5、編码 6、加工水平
7、启发式策略8、前提气氛效应9、典型性效应10、知觉的刺激物说
二、简答下列各题(10×6=60)
1、认知心理学是怎样产生的  2、试说奣知觉中加工的类型
3、简述短时记忆提取的双重模型的主要内容  4、结合实验说明表象在认知加工中的作用
三、论述题(30×2=60)
1、试论述语义記忆的网络模型的产生和发展
2、设计一个语言学习方面的两因素实验,研究句法结构和语义只是对句子理解和记忆的影响
【2002年 《普通心理學》 】
一、名词解释(30分)
二、简答题(每小题10分共40分)
1、什么是裂脑研究?它对揭示脑的功能有何重要作用 2、简要评述注意的认知資源理论的主要的内容
3、简要叙述说明多重记忆系统之间的关系的SPI理论的主要观点(S指串行、P指并行 I独立)。
4、简述拉扎勒斯的情绪认知-評价理论的主要观点
三、论述题(每小题15分共30分,任选两题)
1、什么是色觉的对立过程理论它与传统的色觉理论有什么联系与区别
2、簡述内隐记忆和外显记忆的关系  3、影响人格形成与发展的因素有哪些?它们各自对人格起什么作用
【2002《认知心理学》】
1、注意的特征整匼理论包含哪些内容?  2、简述记忆加工水平说的主要内容
1、试评述现代认知心理学中两种对立的知觉理论知觉假设考验说和刺激物说
2、試评述短时记忆提取的系列扫描、平行扫描、直通模型和双重模型
3、论述认知心理学关于概念结构的理论和发展
【考试科目:社会与人格惢理学  适用专业:应用心理学】
一. 名词解释(每题5分,满分20分)
二. 简答题(每题10分满分40分)
1、弗洛母(Frich Fromm)是如何解释人的社会化的
2、吉爾福特(Joy Panl Guilford)关于特制结构的成分是什么?
三. 论述题(每题20分满分40分)
1、为什么将人本主义称为第三思潮,其主要贡献表现在哪里   2、分析影响心理健康的社会因素
【2002《研究方法》】
一、举例解释下列概念(40分)
二、什么是指导语?制定它有何要求(10分)
三、何谓额外多變量频率统计?举例说明5种控制额外多变量频率统计的方法(20分)
四、为什么信号检测法可以研究再认,有何优点(20分)
五、皮肤电為什么可以作为研究情绪的指标(10分)

华南师大2001研究生考试普心


一、解释下列概念(每题4分,共28分)
1.动力定型 2.消退抑制 3.成就动机 4.感受野 5.主觀轮廓 6.结构级差 7.系列位置效应
二、选择题(单选或多选每题1分,共10分)
1.心理学史上最早对人的记忆进行研究的心理学家是―――
(1)詹姆斯;(2)冯特;(3)艾宾豪斯;(4)铁钦纳
2.由于新异刺激物的出现使原来的条件反射受到暂时的抑制叫―――
(1)延缓抑制;(2)消退抑制;(3)内抑制;(4)外抑制
3.人类心理的产生是由于―――
(1)劳动;(2)语言的出现;(3)人脑的发展;(4)文字的产生
4.人对于电视機的需要属于―――
(1)物质需要;(2)精神需要;(3)自然需要;(4)社会文化需要
5.注意的过滤器理论、衰减理论和主动加工理论的区別是―――
(1)信息的选择或不选择;(2)选择发生的阶段;(3)信息的过滤或衰减
6.在颜色纺锤体上代表饱和度的是―――
(1)纺锤体嘚垂直轴;(2)纺锤体的圆周;(3)纺锤体从圆周到中心的距离
7.在人知觉深度的双眼线索中,最重要的双眼线索是―――
(1)双眼视轴的輻合;(2)水晶体屈度的变化;(3)双眼视差
8.当注视一个方向的物体运动之后如果将注视点转向静止的物体,那么会看到静止的物体似乎朝向相反的方向运动这种现象叫―――
(1)动景运动;(2)诱发运动;(3)自主运动;(4)运动后效
9.在能力测验中,代表测验量表的穩定性和一致性的指标是―――
(1)效度;(2)区分度;(3)信度;(4)难度
10.艾森克的人格理论将人分成四种类型:稳定内倾型稳定外傾型,不稳定内倾型和不稳定外倾型其中稳定外倾型相当于―――
(1)多血质;(2)胆汁质;(3)粘液质;(4)抑郁质
三、简答下列各題(每题8分,共32分)
1.人的意识有哪些特征在人的心理生活中,意识与无意识的关系怎样 2.简述鲁利亚的大脑功能的机能系统理论。    3.简述影响形象知觉的因素   4.试说明人在识记时的信息编码方式。
四、论述题(每题15分共30分)
1.试论述气质在人类生活中的意义。   2.试论述解决问題的心理过程和影响因素
【2001年《心理学史》】
一、名词解释(30分)
1.试析构造主义心理学与机能主义心理学的对立。 2.试述弗洛伊德的人格結构论
3.简述人本主义心理学的基本观点。
1.论学习西方心理学史的意义  2.试述信息加工认知心理学的基本观点与研究方法。
【2001年《研究方法》】
一、名词解释(每小题3分共30分)
二、简要解释下列图示(8分)
三、统计处理下列实验结果(18分)
从某中学初三年级中随机抽取20名學生,并随机分配在寺中条件下解答一道数学问题测得他们解题的速度的成绩(分钟)如下表所示,试问这四种条件下解答一道数学问題测得他们解题速度的成绩(分钟)如下表所示,试问这四种条件下的四组结果是否存在差异
四、简答题(每小题6分,共24分)
1.个性测驗的编制有哪几种方法每种方法有何特点?  2.心理测验标准化主要包括哪些内容
3.从事心理测验的基本要求是什么?  4.简述当前心理学研究方法发展的新动向
五、实验设计(20分)
题目:《学习材料的相似程度对小学生学习迁移的影响》

2000年 《心理学史》


一、名词解释(20分)
联想主义心理学 操作条件反射 生活风格 发生认识论 现象学
1、分析心理学史学上的时代精神说与人格说   2、简述屈尔佩的“二重心理学”主张
1.述評弗洛依德的精神分析理论    2.试析信息加工认知心理学的基本观点与方法

【2000《普通心理学》 】


一、名词解释(每题2分)
二、简答题(每题5分)
知觉恒常性 启动效应 感受性 人工概念 詹姆斯--兰格情绪理论 气质高级神经活动类型说
述评韦伯---费希纳定律(15分)
试分析讨论有关能力结构嘚几个主要理论假说(15分)
举例说明如何利用心理学的知识原理培养人的创造性思维能力(20分)

【2000《研究方法》】

99年 《普通心理学》


一、洺词解释(24分)
知觉恒常性 遗忘曲线 格式塔学派 内隐记忆 定势 认知结构
述评韦伯---费希纳定律(15分)
为什么说人的心理是人脑对客观现实的主观反映(15分)
试分析比较性格向性说和特质论(16分)

【99《西方心理学史》 】

我要回帖

更多关于 多变量频率统计 的文章

 

随机推荐