毕业设计 多级评分模型及非线性最小二乘参数估计 共33页,13673字 摘要 考试评价问题可以用随机抽样理论中的经典测量理论实现。本文首先从经典测量理论中试卷的四个评价指标——难度、区分度、信度和效度出发,对我校2005年12月的CET4考试成绩做分析,揭示了经典测量理论(CTT)的局限性。然后引入项目反应理论(IRT)中的多级评分模型,将被试(参加考试的学生)反应与其潜能联系在一起,从本质上说明了IRT能够克服CTT的这些缺陷,并依据项目的性质对测量的影响设定参数,再通过模型控制这些参数,从而达到减少测量误差、提高测量精度的目的。进一步地,利用求解非线性最小二乘问题的若干种方法在MATLAB软件上估计这些参数,从总成绩和单项成绩两方面分别对求得的结果加以比较、分析和说明。最后提出了与测验相关的项目信息函数,为学校英语题库的设计和自适应生成试卷提供了一些有用的建议。 关键词:经典测量理论 项目反应理论 多级评分 logistic模型 非线性最小 二乘估计 目 录 摘 要 I ABSTRACT Ⅱ 第一章 引言与综述 1 第二章 经典测量理论 3 2.1经典测量理论的参数指标 3 2.1.1项目难度 3 2.1.2 项目区分度 3 2.1.3 信度与效度 4 2.2 经典测量理论的应用 5 第三章 多级评分多参数模型的提出 8 3.1 二级评分题的三参数Logistic模型 8 3.2 多级评分题的其它模型举例 8 第四章 模型参数估计 10 4.1 Gauss-Newton法提出 10 4.2 Gauss-Newton法改进 10 第五章 三参数Logistic模型实现 12 5.1 模型参数假设 12 5.2 目标函数提出 12 5.3 项目反应理论(IRT)的应用 14 第六章 多级评分模型的实践意义 20 6.1 项目信息函数的建立与实例分析 20 6.2 项目信息函数在题库生成试卷中的运用 22 6.3 题库生成试卷的其它方法 22 结 束 语 22 参 考 文 献 23 致谢 26 附录目录清单 127 |
查看评论
已有0位网友发表了看法