智商的计算公式是什么?
===================
一、什么是心理评价
心理测评是企业选拔和安置人才的重要手段,也是选拔合格人才、发挥其才能的重要保证。所谓心理测评,是指通过一系列科学方法,对个体的智力水平和人格差异进行测试的一种科学方法。美国心理学家卡特首先提出了心理评估这个词。1904年,法国心理学家比娜和西蒙编制了第一个儿童智力测验量表,随后来自美国斯坦福大学的心理学家图伊蒙教授提出了心理商数的概念,简称智商。智商的计算公式是:智商=(心理年龄/实际年龄)×100。
二战后,许多企业家看到了心理量表在招聘人员中的积极作用,因此,心理评估技术得到了极大的发展。我国的心理测评是在1978之后开始在实践中广泛应用的。企业招聘中的心理测评始于20世纪80年代中后期。随着人力资源开发与管理的科学化、规范化发展,心理测评技术越来越广泛地应用于中国企业的人才选拔和安置。通过心理测评,可以知道一个人是否符合某个岗位的需求。所谓人事安排,就是让合适的人担任合适的工作。通过心理测评,我们可以客观真实地了解一个人的性格和能力,并把他放在合适的位置上,以确保人们能够充分发挥自己的才能。
二、心理评价的主要方法
心理评估有四种主要方法:
1.纸笔测验
纸笔测验,简称笔试,是要求被试根据项目内容将答案写在纸上,以了解被试心理活动的一种方法。纸笔考试主要有七种形式:选择题、判断题、配对题、填空题、简答题和短文。纸笔测试在员工招聘中的作用非常大,尤其是在大规模的员工招聘中,可以快速了解员工的基本活动,进而划分出一个基本符合需求的边界。
2.标度法
规模是一个比纸笔测验更严格的测量工具。他们可以被视为统治者。有了这把尺子,就可以测量臣民的属性。心理测验一般由一个或几个量表组成。他们的建设程序更严格,对象化程度更高,往往有规范可以参照。如韦克斯勒智力测试量表。
3.投影试验
有些心理特征是很难直接观察和测量的,比如人的欲望、动机、需求等等。你需要使用投影测量法。所谓传递法,就是让被试通过一定的媒介建立自己的想象世界,在不受约束的情境下,不自觉地揭示自己的人格特征的一种研究方法。它可以适用于各种目的和用途。主要方法如下:
(1)联想科技。为了向受试者呈现一些刺激,请报告对这些刺激的反应,并根据受试者的反应进行分析。常用的有各种墨水投射测试,各种单词的联想测试等等。
(2)构图技术。它意味着受试者需要根据一个或一组图形或文字材料讲述一个完整的故事。这类测试主要测量被试组织信息的能力,从测试结果中分析被试的深层心理。比较著名的有:主题统觉测验、麦克利兰成就测验;还有的是衡量人的信仰、宗教信仰、价值观等的测试。这项技术主要集中在分析受试者的输出。
(3)单词补全法。向受试者呈现一些未完成的句子,要求他们根据自己的想法完成句子。比如“我认为我们的企业……”,被试可以做出各种反应。这个方法比上面两个简单,但是很能说明问题。
(4)同等排位技术。要求受试者对一系列目标、愿望、需求等进行排序的方法。根据一些标准。很多价值观,成就动机,态度都是用这个技术来衡量的。
(5)性能技术。这是一种关注过程分析的技术,很少关注主体的输出。参与者被要求参加一些活动,通过这些活动,他们的需求、愿望、情感或动机可以被表现出来。他们对事物的处理和人际交往方式都有自己独特的特点。这些活动都需要符合现实生活的场景,比如玩游戏、演戏、角色扮演、画图等等。
(6)案例分析技术。这是一门综合性的技术,既包含了表现的元素,也包含了投射的元素。案例设计贴近现实,要求被试根据文章提供的线索做出自己的判断和评价。受试者在操作时要付出一定的努力,充分发挥自己的想象力,这样的方法才能引起受试者的极大兴趣。
研究者对投射测验的争议很大,有赞成的,也有反对的,但一致的意见是这种方法很有前途,其主要优点是隐藏了主测的意图和目的,从而创造了更客观的外部条件,使测试结果更真实。其缺点是难以分析,关键在于如何提高投射测验的信度和效度及其客观性。而且主持投影测试的人员需要接受专门的培训,否则最好采用其他的测量方法。
4.仪器测量方法
这是指通过科学仪器对受试者进行测试,了解其心理活动的一种科学方法。随着科学技术的发展,测量心理活动的仪器越来越多,如多导仪、眼动仪、动作稳定性仪等。这些工具在衡量人们的兴趣、动机、技能等方面发挥着重要作用。
三、心理评价的技术指标
一个好的心理评估应该是可信的、有效的和可重复的。这涉及到心理测评中的一系列技术指标。
1.标准化、客观化和规范化
在收集研究数据时,要考虑被测材料、情境、被试、被试以及结果的处理方法,进行系统控制,保证收集的信息是客观的。要尽量控制无关变量的干扰,收集与研究课题最相关的信息。
(1)标准化
标准化是指收集信息的条件和程序应该有统一的标准。它的意义在于,我们要保证使用相同的参照系,用相同的方式收集材料,这样得到的结果通过比较才有意义。
无论是做实验室研究、田野调查还是准实验研究,在收集资料时都要注意系统性和控制度,按照同样的程序进行工作,可以在很大程度上克服个人主观性对研究过程的影响。具体来说,应从以下几个方面进行控制:
①测试材料。测试材料实际上是一个测量量表,主考官根据被试的回答得出被试某一方面特征的测量结果。因此,问卷、工具和调查表格应该标准化,使被试能够接受同样的刺激并做出相应的反应。特别是在管理心理学的学习中,要注意测试材料对受试者的适宜性。
②测试环境。这个条件几乎和考试材料一样重要,有时受试者在不同的环境中参加同样的考试可能会得到不同的结果,这主要是环境的差异造成的。环境对受试者的影响主要表现在对无关变量的控制上。被试在一个新奇的环境中,难免会产生一些与测试无关的情绪,自然会影响测试结果。其他因素包括照明、通风、噪音、温度、湿度和其他条件。尽量让受试者在自然条件下进行测试,环境不能与熟悉的条件相差太大,否则也会产生不良影响。
③测试程序控制。考官要控制好考试的程序,先做什么,再做什么,最后做什么,要按照考试说明书的规定,不能随意处理。考官要与受试者建立良好的合作关系,让受试者了解考试的目的,如何正确应对,减少受试者的顾虑。在整个考试过程中,考官要观察被试的反应,及时回答他们的问题,但不能给他们提示帮助他们回答。
④测试时间。这个因素也会影响测试结果。一般来说,测试有时间限制。比如学生考试有一定的时间限制,过了时间就交卷就没有意义了。考官应提前向受试者明确说明时间限制,并提醒受试者在考试过程中注意时间。这样做的意义在于,受试者的结果可以在同一个基准上进行比较。
测试时间还有另一个意义。最好是在同一时间段,比如同一上午和下午,参加同一个考试。对于一个样本,受试者应在尽可能相同的时间内接受测试。在人力资源管理中,经常要进行工作态度的调查,这尤其应该引起研究者的注意。⑤考官的培训。主持评价的人员应具备一定的资质,掌握相应的知识和技能,能够胜任工作。主持新的评价时,考官要做好充分的准备,了解评价的每一个细节。如果可能的话,他们应该先体验一下或做一个预测试,然后再征求受试者的意见,以便更好地开展工作。
(2)客观化
客观工作是保证测试结果解释的一致性,尽可能减少评价者的主观性,需要一套程序来保证。主要包括以下几个方面:
①评价设计。评估的设计应符合客观实际,并征求各方面专家的意见,使测试结果能反映待测结构的变异程度。在设计测验时,要尽量减少那些可能产生“社会期望”的项目,以免误导被试。
②评分法。如有可能,应尽可能采用定量评价方法,少用或不用书面评价方法。标准测试要为主考官提供评分方法和计算公式,让主考官对同一结果得到更加一致的评价。审查人员应经过充分培训,掌握评价标准。评价时,要以客观的态度来评价被试的表现。如果考官反复给出主观评价,我们可以考虑更换。也可以考虑通过增加考评员来减少考评的偏差。
③测试程序控制。监考人员在考试过程中应保持公正客观的态度,不应在被试的作业上表明立场,不应表扬正确答案或提示被试等。可以在考完试后和他们讨论,但绝对不允许在考试时暗示他们。
(3)标准化
规范化从另一个方面保证了测试结果的质量。心理测量的数据类型不同于其他学科的数据类型(例如,物理、化学等。),而一个措施的意义只有在与其他措施比较的基础上才能显示出来。因为心理测量量表的单位并不统一,可以相互换算,而且很难确定绝对零度的位置。有鉴于此,心理学家以标准化的方式来表征测量结果的显著性。
归一化是指每次测试都要提供一组测试成绩作为比较的基准,便于解释测量结果的意义。这样一套分数应该包括以下几个方面:
(1)经常是这个样子。法线图案的构图要有代表性,它能代表母亲几个主要方面的特征,而且要尽可能表现母亲的多面特征。比如一般可以从性别、年龄段、受教育程度、收入、地域等不同的自然、社会、经济方面进行分类,并给出各组的数据。构造这样一个正态样本并不容易,可以利用抽样技术进行样本选择,统计计算样本的代表性。
②适用范围。范式越有代表性,其适用范围就越广;在引进国外量表时,应特别注意其规范的适用范围。有些定额还有一定的时限,需要及时补充新的信息,提供新的定额数据。
③分数转换法。不同的定额有不同的分数换算方法,即根据定额的分数分布形式,将原始分数换算成标准分数的方法不同。常用的换算方法有百分位数法等。
2.可靠性
信度是衡量心理测量质量的指标之一。这个概念可以从三个方面来理解:第一,信度是指心理测量结果的稳定性和一致性的指标。如果用相同或可相互转换的测量工具反复测量同一组客观事物,能在多大程度上保证这些结果是相同的?其次,可靠性是指测量的准确性。即使我们可以保证重复测量的结果在很大程度上是稳定一致的,但我们仍然不能保证结果是准确的。准确性的定义包含了稳定性的定义。最后,从理论和应用的角度来看,可靠性是指测量工具本身能够保证准确的程度。
测试中常见的误差有两种:一种是系统误差,另一种是随机误差。系统误差的误差集中分布在一个方向,在量上是恒定的;而随机误差是由各种随机原因造成的,很难控制。误差分散在各个方向,数量也是随机分布,有大有小。绝大多数的测量误差都是随机误差,因为系统误差很容易发现,一旦发现就可以消除,而随机误差是由一些未知的原因造成的。从这个角度观察信度问题就清楚了:我们得到的测量分数其实是由两部分组成的,一部分是“真实分数”,一部分是测量误差导致的“误差分数”,这两部分分数之和就是测量得到的“总分”。可靠性的定量定义可以通过方差的进一步分析得到:在测量中,测量误差的方差越大,测量的可靠性越低,反之亦然。我们可以给出两个等价的定义:
(1)测量工具获得的数据的“真实得分”的方差与“总分”的方差之比,就是测量的信度系数。
(2)用测量工具获得的数据的“误差分数”的方差与“总分”的方差之比与1.00之差为测量的信度系数,其中1.00代表测量的理想状态,即误差分数为零,信度系数等于1.00。
因为我们无法真正衡量“真实分数”,第一个定义只具有理论意义,无法实际计算;但第二种定义可以用于实际计算。他们的公式是:
计算可靠系数的公式和方法有很多,通常有几种:
(1)半法。将测试项目分为两部分,分别计算这两部分的得分,将这两部分的相关系数作为半信度系数。这种方法简单易行,省时省力。测试项目减半时,可分为奇数项-偶数项,也可按其他标准减半。这种方法得到的数值只计算了测验中一半项目的信度系数,需要进行修正才能得到整个测验的信度系数。
(2)复制法。复本是指研究者同时编制的两个量表,在内容、形式、难度等方面是等价的。要求被试参加两次测验,每次一次,然后将两次测验成绩的相关系数作为复制品的信度系数。如果两次测试几乎同时完成,则该系数为重复系数,如果间隔时间较长,则相关系数为稳定系数或等效系数。这种方法得到的结果可以说明问题,但不容易编制出两个等价的音阶,因此在实际中的应用受到限制。
(3)复试方法。如果难以编制两个量表,可以用一个量表对同一样本进行两次测量,两组分数的相关系数可以作为重测信度系数。这种方法往往容易引起受试者的厌恶、厌烦和不愿合作;此外,样品的成分、两次测量的间隔以及待测结构的稳定性也会影响测量结果。
(4)内部一致性检验方法。这种方法最近很流行,可以从信度和效度两个方面说明问题。该方法提出了从信度和效度关系的角度检验测验量表内部一致性的思想。如果一个测量尺度是有效的,它必须是一致的。每个量表的不同层次要指向构念的方向,不同的测量项目要覆盖待测构念的一部分,为测量做出自己的贡献。如果量表中的所有项目都是高度内在一致的,那么整个量表只能测量结构的某一部分,而不是全部。该方法不仅可以测量整个量表的信度系数,还可以从项目层面分析其贡献。
3.有效期
效度是衡量心理测量质量的另一个指标。有效性的一般定义是测量工具能够正确测量期望的测量结构的程度。信度是效度的必要条件,但不是充分条件。效度应进一步解释经验水平指标与理论建构的关系。所以有效性大致可以分为两类:一类是经验有效性,这是比较常见的一类,它们主要代表一些可观测变量之间的相关程度。因此,通过分析两个或两个以上变量之间的关系,这种效度可以用一些观察变量预测其他观察变量;另一种效度是理论效度,主要代表观察变量与理论构念之间的关系,这些变量往往是潜在变量,无法直接观察到。
常用的有效性如下:
(1)内容有效性。指的是测量工具的内容符合待测结构的程度,即一个待测内容的范围是什么,然后求这个范围对应的指标。被测指标不能是对应结构的重复,也不能是所有指标的集合,而应具有代表性。事实上,这两项任务非常困难,应该允许不同的研究者采取不同的方法。在测试测量工具的内容有效性时,应重新考虑这一过程,主要由相关专家进行判断,他们应提供实际证据,以表明设计逻辑和测量目的之间的一致性。
(2)标准的关联效度。一个或一组测量指标与其他有效测量指标之间的相关程度可以作为测量工具相关性有效性的判据。这里所指的有效衡量指标可以与衡量同时存在,也可以是实践中的有效指标,如学业成绩、工资收入、管理业绩等等。从时间上看,效标相关效度有两种,一种是同时效度,可以用测量结果与一些已有指标的相关系数作为效度系数,另一种是预测效度,可以用测量结果与一些未来指标的相关系数作为效度系数。
效标关联效度预测的指标与一些实际指标相关,有助于解决实际问题和决策。例如,在继续教育和职业咨询、人力资源管理等领域有大量的应用。另一方面,当我们开发一个新的量表时,我们也可以将这个新的量表与已被证明高度有效的量表结合起来,探索新变量与其他变量之间的关系。
(3)结构效度。这种有效性用来衡量某一特定测度与其他测度之间的关系是否符合理论假设。建构效度难以成立,应从两个方面提出证据:①应指出该测量与理论上应与之相关的所有其他测量具有高度相关性;(2)应该指出的是,该测量值与理论上不相关的所有其他测量值之间的相关性非常低。建构效度需要从不同的角度提供各种证据来解释被试的构念,并且需要从不同的角度提供一套建立构念效度的指标。这种效度对于拓展心理学的知识领域尤其有价值。
四、心理评价的具体内容
在人员选拔中,常用的心理测试主要是衡量人员的认知能力、性格和兴趣,因为经过大量的研究发现,这三个心理特征与工作的关系最为密切。
1.认知能力及其测试
智力是心理测验中最早尝试测量的内容之一,对这个问题结构的探索80多年来一直没有停止过,可见这个问题的复杂性。不同的学校对测量这一问题进行了各种实验:最早的智力测验是由Biner等人开发的,他们试图通过测试来识别学校中儿童的心理缺陷。后来,斯皮尔曼在对大量测试结果进行统计分析的基础上,提出了智力双因素理论。他认为智力有两个因素。一个是通用因子,用(G)表示,代表个体的普通能力。另一种是特殊因素,用(S)表示,代表个人的特殊能力。
现在的认知能力测试不再是早期的模式,而是涵盖了广泛的领域。这些测验根据实际表现选择项目和构建量表。这样一来,测验的预测能力提高了,但同时测验的特异性也增强了,所以在选择人员时要注意选择合适的量表。在工商组织选拔人员时,可用的认知能力测试包括以下几类:
(1)机械容量
从事各种机械工作的人需要具备一定的感性认知能力,这种能力处理物体之间的空间关系,并将这种关系转化为视觉图像;转化过程中的感知速度和准确性也很重要。比如要求操作人员会画图、会读图,根据机械蓝图加工装配机械零件。还有一些机械能力测试,侧重于测量人员的机械原理知识和经验。构成机械能力量表的项目侧重于感性特征的能力,而不一定是一般意义上的智力,因为它们主要预测机械工作的表现。所以每次测试之间的相关性不高,每次测试测量的是一个相对独立的机械能力。发现机械能力得分与一般智力测验得分的相关系数较低,说明机械能力的测量在内容上不同于一般智力测验。
(2)心理运动和身体能力
Lechmann等人对工作所需的脑力运动和体力进行了广泛的调查和分类,提出了以下19基本能力及其测量:选择反应时;反应时间;肢体运动速度;手腕-手指运动速度;多肢协调;手指灵活性;手巧;臂-手稳定性;速率控制;控制精度;动态强度;体力;静态强度;爆发力;广度和灵活性;动态灵活性;整体身体协调性;总体物理平衡;耐力。
其中1至10项属于精神运动能力,11至19项属于身体能力。必要时,精神运动和体能测试可以与其他测试结合,其有效性不会降低。
(3)视觉能力
视觉能力是完成很多任务的必要条件。这方面的测试主要由眼科医生进行,选择主持人的部门制定相应的标准,互相配合。视觉能力的测试主要从以下几个方面进行:视敏度、深度知觉、辨色力、视线偏离倾向等。不同的职业对视觉能力的要求标准不同。
(4)信息处理能力
有些工作是处理信息而不是机器,所以需要衡量人的信息处理能力。近年来,这一测试已不仅限于管理和文书人员的选拔。这类测试主要从人类处理信息的特点出发,分析机械自动化和信息化如何取代人类的智力活动,以及人机交互过程中工作人员需要具备的能力条件。并以此作为选择标准。信息处理能力与一般智力的关系更为密切。
认知能力测验的效度一直是研究者关注的焦点。经过大量的研究发现,认知能力可以在广泛的工作领域中有效地预测工作绩效,而这些测试还不如针对简单工作的测试。最好使用精神运动能力测试来预测简单工作的表现,其他测试效果不佳。几个测试的组合可以增加选择的有效性。除了用于选拔目的之外,认知能力测试也适用于衡量各种培训工作的有效性。
2.兴趣与人格及其测量
兴趣与情绪、动机、态度、性格等心理过程和特征密切相关。是指人们试图去理解和探索某种事物的心理倾向,是在情感体验中获得这种知识的满足感而产生的。稳定的兴趣是后天形成的,受社会实践的制约。
近十年来,心理学家设计了大量人格和兴趣的测量工具,如霍兰德的“职业偏好问卷”。这些测量工具适用于许多领域,它们的基本假设有两个:
(1)在保持一定动机的情况下,性格或兴趣因素影响职业适应性和工作绩效,有些人可能更适应某个职业,可能从工作本身获得更大的工作满足感。从职业咨询的角度来说,帮助人们选择适合自己性格和兴趣的工作,有助于他们的职业设计。如果他们有一定的能力,他们可能会取得成功。
(2)从工作角度来说,某些职业确实需要特定的人来从事。这些人的性格或兴趣的特点与其他人不同。性格或兴趣的某些特征对其职责的完成有直接而充分的影响。这对提高工作效率非常重要。
基于这两个假设,研究人员向从事职业咨询的人推荐了可以通过投影技术或问卷进行的性格和兴趣量表。
投射技术包括主题统觉测验和罗夏墨迹测验。
常用的问卷有加州心理问卷、爱德华个人偏好顺序表、人际价值观问卷、个人价值观问卷、职业偏好问卷等。