角度 角度右边 角度下降 角度左 关闭 用户 菜单打开 菜单关闭 搜索 地球 酒吧 电话 店铺

ETS在统计188金宝搏哪里下载和精神仪中的研究遗产

ETS自1947年成立以来,在统188金宝搏哪里下载计和精神仪研究中追求研究。以下是ETS在这些领域的研究贡献的例子:

古典测试理论

古典测试理论返回到20世纪初,为如何计算测试分数并纠正测量误差提供了基础,以便获得教育和心理测试的可靠结果。该理论为使用测试分数,特别是涉及可靠性的计算来构成许多计算的基础。该理论是基于将测试接受者分为两个组件的分数:称为“真实分数”的组件,它对应于测量目标(例如,数学技能)和称为“测量错误”的组件。

许多ETS研究人员对此字段留下了188金宝搏哪里下载持久的贡献,这反映在诸如此类的关键出版物中:

  • 心理测试理论(1950) - 这本普林斯顿大学的心理学教授和ETS研究顾问的心理学教授的这种影响力教科书涵盖了各种数学理论和解释测试结果的统计方法。188金宝搏哪里下载它仍在使用中。
  • 心理测试分数的统计理论(1968年) - 这是Frederic Lord的古典测试理论上的一个明亮作品,他于1949年3月加入了ETS作为统计分析总监,以及统计日梅尔文诺克。

项目响应理论(IRT)

项目响应理论(IRT)超出了经典测试理论,并提供了设计,分析和评分人体能力,态度和其他变量的心理测量评估的新方法。在广泛使用的IRT模型中,测试接受者对测试问题提供正确答案的可能性取决于测试者的能力以及三个参数:

  • 问题如何单独测试不同能力的测试者
  • 问题的难度水平
  • 无法解决主题的考试者的概率将提供正确的答案

在ETS,IRT用于项目分析,项目银行和得分等式。这一领域的一个关键工作是罗德项目响应理论在实用检测问题中的应用(1980)。ETS也进行了早期工作IRT软件(逻辑)(木材,Wingersky,Lord,1976)。

在项目响应理论中的开创性研究的另一个例子中,ETS将IRT统计和专188金宝搏哪里下载家测试构建算法纳入操作计算机的自适应测试范式(自适应测试中严重限制项目选择的方法,长袜&斯旺森,1992年,ETS研究报告No. RR-92-3188金宝搏哪里下载7),在管理局中使用的范式gr®和GMAT®评估。

等同于测试分数

等同性测试分数的创新方法有助于建立标准方法,以便在全球范围内测试各种计划,以使其分数随着时间的推移和多个测试表格而进行比较。关键ETS授权出版物包括:

这三章在备受尊敬的版本的参考工作中教育测量总结了对每个相关时间段的等式和链接方法的最新状态。

探索性和确认因素分析

ETS对探索188金宝搏哪里下载性和确认因素分析的研究有助于在备受尊敬的书中编纂的现代因素分析,“现代因素分析“(哈曼,1976年)。此外,在ETS的工作提供了一种方法和软件(LISREL),用于估计涉及未测量变量的多个指标的线性结构方程系统。李斯里尔的分析程序在整个社会科学中使用,以测试变量之间的理论关系(“riisrel:一种用于估计涉及未测量变量的多个指标的线性结构方程系统的一般计算机程序,“Joreskog&Van Thillo,ETS研究公告,188金宝搏哪里下载RB-72-56,1972)。

大规模调查评估研究188金宝搏哪里下载

188金宝搏哪里下载支持ETS研究人员支持大规模调查评估的研究对大规模调查评估背后的科学留下了重大贡献。

按项目采样估算规范(ETS 188金宝搏哪里下载Research BulletinRB-61-021961)主通过使用矩阵采样来展示一种更有效地估计规范的方法,该方法将大型物品池被分解为更小,不同的项目集和向其他学生的不同样本进行管理。这种矩阵采样现在广泛应用于国家和国际集团评分评估(“通过组分数评估监测教育进展。“Mazzeo,Lazer,&Zieky,章节教育测量,第4届。,2006年)。

具有不完整数据的配对比较的最小二乘解(ETS研188金宝搏哪里下载究公告,RB-55-05,1955),Gulliksen描述了一种使用不完整数据的早期方法。

在20世纪70年代,鲁宾和Thayer(“向不同样品的测试相关Psychometrika,V43 N1 P3-10,1978年3月)提出了基于新的估算方法,其中统计模型用于对缺失值的性质进行假设;现在是常见的方法。

随后,Mislevy(1991),为新收购合同的ETS工作国家教育进展评估(NAEP),创造了一种新颖的鲁宾与主在矩阵抽样工作中合成的合成,Bock的反向最大似然方法对IRT估计的边际最大似然方法,以及复杂调查采样设计的数据分析的一般进步(“用于研究多项选择与自由响应测试项目之间差异的框架,“ETS研究188金宝搏哪里下载报告,RR-91-36)。由此产生的合成 - 以及源自IT的方法 - 为NAEP中仍在使用中仍在使用的分析方法的基础。这种方法背后的基本思想底层底层the modern international group surveys (e.g., TIMSS, PISA and PIRLS) (Mazzeo, Lazer, & Zieky, 2006).

测试公平

ETS通过标准化方法对差分项目(DIF)进行了开创性的测试公平性。考虑到每组总体技能水平后,一个良好的测试问题应该对所有社会和文化背景的测试者进行同样的难度。这是为了避免问题的内容可能难以反映考验测试者生活经历的原因,而不是他们在被测试的地区的知识或技能。DIF描述了控制组的整体能力之后的这种变化。可以对任何一组测试者进行差异分析,但差异分析通常侧重于女性测试者和从指定的族裔群体的考验者。

ETS在这个188金宝搏哪里下载领域的研究,包括“差分项目性能和Mantel-Haenszel程序,“(荷兰&thayer的一章”测试有效性“,由Wainer&Braun,1988年编辑,“Dif检测和描述:Mantel-Haenszel和标准化”(Dorans&Holland的一章差分项目功能由荷兰&Wainer,1993年编辑)导致DIF程序的操作使用,在评估测试结果的公平时,这已成为标准做法。在本发明之前,DIF程序,ACANOFF和FORD开发了一种早期的方法,用于在他们的书中查看跨组的项目物品竞争对学术能力测试的互动(1973)。