简介:本研究基于多层面Rasch模型,通过分析评分结果对PRETCO口试评分标准的效度进行了验证,结果发现:PRETCO口试评分标准能够有效区分考生的能力;评分员评分的内部一致性总体较好;虽然评分员之间的严厉度有明显差别,但是这些差异并不影响总体的评分质量;评分员使用了评分标准中所有分数段;各个分数段的评分总体分布较为合理;因此,PRETCO口试评分标准的整体效度较高。但是,研究同样发现一些问题:“朗读”任务评分标准中两个分数段与考生能力出现了负增长;“陈述”任务评分标准一个分数段的使用频次过低,个别分数段阈值差距较小,评分员对这些分数段难以把握,容易产生混淆。基于此,本研究尝试为完善PRETCO口试评分标准以及评分员的培训提供一些启示与建议。
简介:摘要:近几年,国内中学作文研究者对中高考作文评分标准进行了综合优化,力求降低分数偏差,提高考试成绩的客观评价。在考试之外,评分标准可以用在日常的教学中,学生就会自我反省,自我提高,客观统一的作文评分标准无疑会极大地推动中学写作教学。
简介:摘要:教学竞赛是高校教学改革实践中开展范围广、参与人数多的一项教学活动。但是目前高校教学竞赛中在教师备课阶段出现了课程教学设计不科学、对学情分析浮于表面不够深入透彻等问题。本文针对现行的高等院校教学竞赛的评分标准做一个初探研究,希望能对广大一线教师备课起到一定作用。
简介:基于多层面Rasch模型,研究分析某省随机抽样高中考生短文朗读和自由交谈两种口语考试任务的评分维度及量表的使用情况。结果表明,短文朗读任务和自由交谈任务的评分维度设置均较合理,能够较准确地反映考生的能力,但是短文朗读量表的等级之间存在非等距性问题,自由交谈任务评分维度中"交际策略"与其他三个维度存在显著差异。这些信息对于修改和完善评分量表及相关维度具有重要意义。