作者juztrue (荣)
看板PSY
标题Re: [疑问] 关於心理测验的书籍
时间Fri Dec 3 08:15:58 2010
前文吃光光
想说回应一下skylikewater的问题,也整理一下手边有的心测书籍(周文钦那本其实是研
究方法的书,心测只有稍微提到)有关建构效度的部分。王文中的双叶心测是2008出的没
错,但是该书所翻译的原文书是2001年出的…,列一下各本书籍内容,应该能看得出来
Murphy版的真的很特别…吧。Murphy版除了多特质多方法矩阵讲的比较详细以外,并没有
讲甚麽效度验证的策略,只有在”建构”这个概念上以其他书本少见的方式,多加着墨而
已。
朱锦凤(2010)。心理测验 理论与应用。台北:双叶。
建构效度:是指测验的编制过程中,以客观方法来验证一份测验是否符合理论假设,以反
映该测验在建构结构上的有效程度。…一份测验所有验证测验结构及测验理论的分析,都
称为建构校度。
<验证建构效度的8种方法>
1.发展上的改变(development Change):一份测验的分数结果及表现,会随着发展阶段的
演化或随着年龄的增长而增加的状况。
2.因素分析(Factor Analysis):藉由统计方法,分析出最少数量且互相独立的行为特质
3.内部相关分析(Internal Correlation):又称内部一致性分析,也就是各分测验的相关
分析。各分测验的相关分析可呈现各分测验的结构与关联性。
4.聚歛效度(Convergent and Discriminant Validation):以聚合效度(Convergent
Validity,或称辐合效度)与区辨效度(Discriminant Validity)的方式来验证一份测验的
理论架构。聚合效度是指用不同方法测量相同特质的效度系数,区辨效度是指用相同方法
测量不同特质的效度系数。理论上,聚歛效度是以多特质-多方法矩阵(Multi-Trait
Multi-Method Matrix)来验证据阵中各种效度系数的适切性
5.差异效度(Differential Validity):一份测验针对不同效标,各分测验具有区辨受试
者能力差异的程度。差异效度主要目的,是帮助筛选或分类的决策时,能够有效分辨不同
族群的差异,以提高决策效益。
6.前後测实验的介入(Experiment Intervention):一份测验经过前侧及後侧之分数结果
的变化,来验证一份测验的有效性;通常因为学习的效果,後测会比前测高分。
7.结构方程模式(Structure Equation Model, SEM):以多元回归概念为基础,将进阶的
统计中的结构方程模式应用在验证测验架构与理论的契合度。
8.项目反应理论(Item Response Theory, IRT):针对电脑化是应测验发展出来的选题理
论。…编制一个能侦测侦测受试者作答历程及思考过程的适性测验,IRT是必须配合的理
论效度分析之一。
===============================
葛树人(2001)。心理测验学(三版)。台北:桂冠
与构念有关的效度证据:此一验证再决定测验分数所代表的意义是否与其所欲测的构念相
符合。…构念都是由理论上所创造出来以理解人类行为或心理特质的概念,具抽象性。…
如果效度良好,则测验所产生的分数即可真实反映受测者的特质,测验者可依该构念之理
论对所测得的结果加以诠释。
<以构念为考量的验证法>
1.内部凝聚性检验:此类方法旨在检验测验内部之品质(如试题、分测验、反映过程)是否
测量同样的心理构念。使用此法时以测验总分为效标并计算各试题或分测验与总分之关系
,所得之相关系数即代表测验内部之凝聚程度,凝聚程度越高即表示越倾向於测量同一心
理构念。
2.外在相关系数检验:验证对象测验与其他测验工具间之关系。…选用一已具有效度之测
验来做为效标,然後计算对象测验与此效标测验间之相关系数,即得测验的效度,此一系
数又称符合效度(Congruent Validity)。…除此以外,相关法有包括以对比样本
(contrasted groups)为效标之效度检验,在使用此法时其主旨是衡量测验对不同样本之
辨别能力。…例如一组为患有抑郁症组,另一组为非患有抑郁组,若要检验某一忧郁量表
之构念效度,若该量表能有效区别出两样本,即证明其能准确地测量心理特质。
3.因素分析:为验证已够念为中心的效度最常用的方法,它是一种多变数统计方法,可同
时分析大量变项间之关系并找出他们在测量上的共同性。…如果测验原来产生的分数结构
符合因素分析所产生的特质结构,则表示该测验具有良好的因素效度(Factorial
Validity)。
4.幅合效度与辨别效度检验:前者表示一测验与其理论上同类之变项具有高相关,後者表
示它与其在理论上并不相干之变项应不具相关。…并由多元特质-多重方法矩阵来同时检
验这两种效度。
5.发展现象与实验效果之检验:在心理学研究中有少数特质其发展过程与成长年龄或阶段
具有密切关系(例如智力、成就)。…因此在检查这类测验的效度时,便可以比较不同年龄
阶层的受试样本在测验上的表现是否呈现如预期之显着差异,如果结果确实如此,责次验
之效度即获得肯定。…最後,与构念有关的效度亦可藉着分析实验变项对测验分数影响之
方法加以衡监。…如果用来测验此依变项之测验具有效度,则其分数应能正确地反映研究
假设中所推论的效果。
===============================
周文钦(2004)。研究方法 实徵性研究取向(二版)。台北:心理。
建构效度:一个测验能够测量到它所欲测量之建构的程度。易言之,一个测验能够符合其
赖以编制之理论的程度。依此论之,凡是从心理学的建构或理论来分析或解释测验分数所
代表的意义,就是在验证建构效度。…建构是指一种理论上的构想或概念,它是看不见也
摸不着,甚至可说是存不存在都有待求证,但为了研究或实务上的需要,我们假设它是存
在的。所有的建构都包含两种特质:第一个特质是在本质上,它们是某规则的抽象摘述;
第二个特质是,它们与具体的可观察的实体或事件有关或相关联。
<验证建构效度常用的统计方法有下述诸种>
1.相关检定:某测验是依据现有的优良之理论所编制,这时可将受试者在这两个测验上的
得分,求其积差相关,如这个相关系数达到显着,就可说某测验具有理想的建构效度。
2.差异检定:有许多理论都证实有年龄、性别或实验前後、考试前後等有显着差异,这些
现象都可以运用差异检定的方法来验证测验的建构效度。
3.因素分析:验证建构效度最常用的统计方法之一。测验分数透过因素分析的结果,可以
让我们了解该测验所欲测量之特质的层面为何。…层面一致,则该测验具有良好的建构效
度,获得了支持的证据。.
===============================
游恒山(2010)。心理测验(Robert. J. Gregory原着),台北:五南。
Gregory, R. J. (2007). Psychological Testing: History, principles, and
application (5th ed.). Boston, MA: Allyn and Bacon.
构念是指某一理论上的、不具实体(无形)的特性或特质,随不同人们而异。…构念从行为
推论出来,但不只是行为本身。一般而言,构念在理论上被认为具有某些形式独立存在,
而且对人类行为施加广泛但在某种程度上可以预测的影响力。当某一测验立意於测量某个
构念时,它必然是根据有限样本的行为预估某一推断的、基础的特性的存在。构念效度是
指对基础构念的这些推断的适当性。
所有的心理构念有两个共通特性:
1.没有单一的外在指涉事项(external referent)足以验证构念的存在;也就是说,构念
不能被操作性地界定。
2.尽管如此,一连串联动式的假设可以从现存关於该构念的理论中被推衍出来。
构念效度的证明始终建立在研究方案上。…为了评估某一测验的构念效度,我们必须累积
得自许多来源的各种证据。
<构念效度的验证法>
构念效度的证据可以觅之於实际上任何实徵研究,只要它们是针对适当的受试者团体检视
测验分数。大部分构难效度的研究落在下列范畴之一:
‧从事分析以决定测验题目或分测验是否同质,因此是在测验单一构念。(测验同质性)
‧探讨发展上的变化,以决定这些变化是否符合该构念的理论。(相称的发展变化)
‧从事研究以确认测验分数上的团体差异是否跟理论保持一致。(理论-符合的团体差异)
‧从事分析以决定测验分数上的干预校应是否跟理论保持一致。(理论-符合的干预差异)
‧该测验与其他有关和无关的测验及量数之间相关情形。(幅合效度和辨别效度的检验)
‧就测验分数与其他来源讯息的关系进行因素分析。(因素分析)
‧从事分析以决定测验分数是否容许对受试者作正确的分类。(分类准确性)
1.测验同质性(Test Homogeneity):假使某一测验测量单一构念,那麽它的组成题目(
或分测验)可能将是同质的,也称为是内部一致的。…各试题或分测验与总分数之间的相
关系数即代表测验内部的凝聚程度;凝聚程度越高就表示越倾向於测量同一心理构念。
2.相称的发展变化(Appropriate Developmental Changes):许多构念可被假定将会从
早年儿童期到成熟成年期(或许还超出这个范围)显现有规律之年龄等级的变化。
3.理论-符合的团体差异(Theory-Consistent Group Differences):个人当被认为在测
验所测量的构念上倾向偏高时,他就应该拿到高分数,至於个人当被认为在该构念上拥有
偏低的数量时,他就应该拿到低分数。
4.理论-符合的干预差异(Theory-Consistent Intervention Effects):测验分数将会
随着预定或非预定的干预而以特定的方向及数量发生变动。例如就一份空间定向的测验而
言,受试者在给予空间认知训练後,在此测验的分数应该比训练前来得高。
5.幅合效度和辨别效度的检验(Convergent and Discriminant Validation):当某一测
验与其他也拥有同一构念的变项或测验之间有高相关时,这就证明了该测验的辐合效度;
当某一测验与其他所测量构念互异的变项或测验之间没有相关时,这就证明了该测验的辨
别效度(或称区别效度)。多元特质-多元方矩阵是一系统性的实验设计,以便同时验证心
理测验的辐合效度与辨别效度。
6.因素分析(Factor Analysis):一种专门化的统计技术,特别有益於研究构念效度。
…因素分析的目的是监定在解释成套测验间的交互相关上所需要最少数目的决定因子(因
素)。换句话说,因素分析的目标是找出最少一组维度,称之为因素,这些维度可以解释
所观察之个别测验间一系列的交互相关。
7.分类准确性(Classification Accuracy):许多测验是为了筛选目的而被使用,以便
监定出符合(或不符合)若干诊断标准的受测者。对於这些工具而言,准确分类是效度的必
要指标。…研究人员应特别注意跟效度有关的两项心理计量特徵:灵敏性(Sensitivity)
与专对性(Specificity)。灵敏性与准确监定出具有某一症候群的病人有关(例如每一百位
病人中可准确检定出79位病人有该症候群,其灵敏度即79%);专对性则与准确监定出正常
人有关(例如每一百位正常人中可准确监定出83人没有该症候群,而有17人被误判为有该
症候群,即专对性即83%%)。…当选定一个截切分数而提升灵敏性,这必定将会降低专对
性,反之亦然。
===============================
王文中、陈承德译(2008)。心理测验(Kevin R. Murphy、Charles O. Davidshoferm原着)
。台北:双叶
Kevin R. Murphy、Charles O. Davidshoferm(2001). Psychological Testing:
principles and application(5th ed.).Prentice Hall.
建构是某种规则性的抽象总结,而且建构与具体、可观察的实体或事件有关。…虽然建构
是假设性的抽象概念,不过所有的建构都跟真实、可观察的事物或事件有关。
建构说明(construct explication):详细描述特定行为与抽象建构关系的历程。
1.找出与所欲测量之建构有关的行为
2.找出其他建构,并决定它们是否与所欲测量的建构有关
3.找出跟这些其他建构有关的行为,并根据这些建构的关系,判定每个行为是否与所欲测
量的建构有关。
<验证建构效度的方法>
虽然任何方法都可能可以用来评估建构效度,不过有些方法似乎比较常见。最基本的方法
,是计算该测验分数与其他测验分数的相关。…另一种常用的方法是因素分析。…第三种
方法则是对所欲测量建构的实验操弄。...还有一种常用於评估建构效度的方法,是如果
我们使用多种方法来测量一种以上的特质或建构,这些测量间的相关就形成了多特质-多
方法矩阵…。
===============================
危芷芬译(2006)。心理测验(Anne Anastasi & Susana Urbina原着)。台北:双叶。
建构效度:表示测验可以测量理论建构或特质的程度。…建构效度的建立必须逐渐累积各
种来源的讯息。任何资料若是有助於了解该特质之性质,以及对其发展和形成条件产生影
响,都可以作为建构效度的适当证据。
<建构确认程序>
1.发展变化:许多传统智力测验所使用的主要效标就是年龄区辨。我们预期某种能力在儿
童时期会随年龄而增强,因此如果测验是有效的,测验分数应该显示出同步的增进。
2.与其他测验的相关:新测验所测量的行为领域类似於其他同样称为「智力测验」或「机
械性向测验」的既有测验。…与效标预测效度不同的是,此时相关只须达到中等程度即可
,不可以太高。如果新测验与现有测验的相关太高,但是又缺乏简洁或易於施测等其他优
点,则新测验就是多余的
3.因素分析:是ㄧ种确认心理特质的方法,尤其与建构确认的程序有十分密切的关连。
4.内部一致性:这种方法的特徵是,效标就是测验分数本身。…分测验与总分的相关也是
此技术的另一种应用。
5.聚合效度和区辨效度:测验分数与理论上应该有关的其他变项呈现高相关(即聚合效度)
,而且它不应该与无关变项产生显着相关(即区辨效度)。…使用多重特质-多重方法矩阵
来获得聚合效度与区辨效度的证据。
6.实验介入:例如要检验使用於个别教学计画之测验的效度,则可行的途径之ㄧ是比较测
试前和测试後的分数。
7.结构方程式模型:建立因果关系模型的基础在於非常熟悉各变项以及所研究之情境的现
有知识,模型中所假设的关系应该具备合理的理论基础。…在因果模型中,方程式的数目
通常多於未知数,所以可能同时产生数个模型。然後再根据原先实徵数据所形成的相关矩
阵,以检定其适合度。
===============================
总结来说,建构是一抽象概念,却是心理学家想要测量到的目标。而测验工具究竟测得此
抽象概念到甚麽程度,即为建构效度;因为建构是抽象的,而可观察行为、测验分数等是
具体的,以具体的测量去推敲建构是否测得,此历程并没有简单又显而易见的方式。於是
心理学家便如同侦探一般,运用各种”手段”,提供(间接)证据去证明测验工具测量到该
建构的程度如何。至於这些”手段”,便是上述种种效度验证的策略。
<比较各书多种建构效度验证的异同>
朱锦凤 葛树人 周文钦 游恒山 王文中 危芷芬
因素分析 ◎ ◎ ◎ ◎ ◎ ◎
实验介入 ◎ ◎ ◎ ◎ ◎ ◎
发展改变 ◎ ◎ ◎ ◎ ◎
聚合效度和区辨效度 ◎ ◎ ◎ ◎ ◎
测验同质性 ◎ ◎ ◎ ◎
与其他测验的相关 ◎ ◎ ◎ ◎
团体差异 ◎ ◎ ◎
结构方程模式 ◎ ◎
项目反应理论 ◎
分类准确性 ◎
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 114.45.108.180
1F:推 CrazyCharlie:请接受小弟一拜!! 12/03 12:48
2F:推 afu321:非常完整的整理啊!!高手!! 12/03 22:35
3F:→ chaos0807:怎会只有四银XDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDD 12/03 22:57
先在word上打完复制贴上压
4F:推 skylikewater:热心大推 我是看陈承德老师的学术着作列表的 12/04 00:37
5F:→ skylikewater:不过查了Amazon,他自己写错了XD 12/04 00:38
6F:推 nxdwx:推朱锦凤老师XDDD 12/04 18:26
7F:推 s19880831:推朱锦凤老师~~ 12/06 01:30
※ 编辑: juztrue 来自: 114.45.103.40 (12/06 17:56)
8F:推 polb:朱锦凤老师阿....这样好吗 12/13 00:40