如何用EXCEL制作成绩分析的正态分布图
摘要:教学评价在学校教育教学工作中的重要地位毋容置疑。考试是对学生进行的一种教育测量,也是对教师教学质量、出题水平的评价。特别是数理统计方法的应用,使得我们对学生的教育测量转化为教学评价得到了有效的帮助。本文论述了如何用EXCEL制作考试成绩的正态分成图,并结合其它相关的衡量标准,比如,区分度,学生成绩柱状分布图,难度系数,优秀率等,融合于一个图表中进行分析。这是一种有效的可操作的方法,能让每一位教师从图中获得一种易于接受的直观认识,并且方便找出教学中存在的问题,并为以后教学改进措施的制定提供有效的帮助。
关键词:教学评价,EXCEL,成绩分析,正态分布。
教育评价学是教育科学领域中的一个重要的应用性很强的分支学科。在当今世界教育领域中,教育评价、教育基础理论和教育发展被认为是三大研究范围。教育是人类有目的、有计划、有组织的活动,教育活动涉及教育方案、教育活动的实施、教育活动的参与者等等,要提高学校教育活动的有效性,就必须对这些内容进行适当的评价。因此,教育评价对于学校教育的改革和发展,对于学校教育的管理和决策,都有着至关重要的作用,所以备受各国政府及其教育行政部门的重视。
在学校日常工作中,通过教育评价活动来强化管理,已受到人们的广泛重视。不论是宏观的教育行政管理还是微观的学校工作管理,都把教育评价当作一种有效的管理手段。就一所学校而言,管理水平的高低在一定程度上能反映出该校的评价工作开展得怎么样,而评价水平的高低又能体现出学校领导者的管理水平。实施素质教育的关键是教师素质的高低。为了提高教师素质,教育行政部门和学校都加大了对教师的管理力度,开展了对教师的教学评价工作。通过有效地评价教师,不仅调动了教师工作的积极性,而且进一步促进了师资队伍的建设。所以,要做一个有效的管理者,就要重视教育评价的作用。
教学评价是教育评价的重要组成部分。它以考试作为一种基础性的手段,来收集有关学生对知识的掌握程度方面的信息;以测验作为测量的手段,获得客观的数据,进行进一步的分析、综合,并作出价值上的判断。
在学校教育教学工作中,从研究的目的出发开展评价工作,就是要通过评价活动促进教育教学改革实验的进行,从而提高教育教学的科学研究水平。因此,教学评价将有助于学校及教育工作者自身进行检查、反思,并主动改进教育教学工作,从而有助于提高教育教学质量。教学常规工作中的段考、期考,不仅仅是为了测量学生的知识掌握程度,我们还应该使用现代的数理统计技术和现代信息技术来对考试成绩进行仔细、有效的分析,从中找出需要改进的教学问题,并为今后的教学改革提供依据。因此,我们就需要使用正态分布曲线来给我们的成绩分析提供一个有效的参考。
一、如何用EXCEL制作成绩分析的正态分布图呢?我们先来看一份样图:
从图1中,我们可以看到一些信息,横坐标为从0分到150分,共计151个刻度,纵坐标为人数(相当于样本的频数)。在这里,纵坐标没有使用“频率”而是使用“频数”来做单位,这是因为我们不是只抽取一部分“样本(随机抽取学生)”来进行分析,而是对整个“总体(整个年级)”来进行分析,因此,我们使用频数(具体的人数)来做纵坐标单位,更加具有实际意义,也更为直观。图中的黑色柱状图是学生成绩的分布,粉红色的曲线是由学生该科成绩的平均分和标准方差所决定的正态分布曲线,左边的红色竖线是低分率的线,中间的黄色竖线是及格率的线,右边的绿色线是优秀率的线。上面还附有该科的平均分、难度系数、区分度、低分率、及格率、优秀率等数值。
相应的一些评价参数的制作方法如下:
1、平均分
平均分在EXCEL里使用函数:AVERAGE(Number1,Number2……)其中:Number1,number2,……是要计算平均值的 1~30 个参数。
例如:在新的单元格中插入AVERAGE(D3:D923),“D3:D923”就是学生成绩所在的单元格范围。
2、难度系数
难度系数是反映试题的难易程度,即考生在一个试题或一份试卷中的失分程度。如满分150分的试题,考生平均得分108分,平均失分42分,则难度系数为42/150=0.28。
难度系数的计算公式为:L=1—X/W
其中,L为难度系数,X为样本平均得分,W为试卷总分(一般为100分或150分)。
为了简化试卷难度系数的计算,在EXCEL中可以用以下简单的计算公式进行计算:
P=平均分/满分值
题目的难度值越大,则题目的难度越小;题目的难度值越小,则题目的难度越大。
一般认为,试题的难度指数在0.3-0.7之间比较合适。整份试卷的平均难度指数最好掌握在0.5左右,高于0.7和低于0.3的试题不能太多。
3、试题区分度
为了简单计算, 教师可以使用下面的一种方法进行计算区分度: 先将分数排序,P1=27%高分组的平均分,P2=27%低分组的平均分,区分度D=(P1-P2)/满分值。
区分度一般在0~+1之间,值越大区分度越好。试题的区分度在0.4以上表明此题的区分度很好,0.3~0.39表明此题的区分度较好,0.2~0.29表明此题的区分度不太好需修改,0.19以下表明此题的区分度不好,应淘汰。
4、低分率、及格率、优秀率
我们按照低分线、及格线、优秀线分别为总分40%、60%、80%来确定,在图中分别用红线、黄线、绿线来注明,并且在图中上方注明对应的低分率、及格率、优秀率,这样看起来比较形像直观。
5、学生成绩的柱状分布图
在EXCEL里使用函数:COUNTIF (range,criteria),其中range为单元格范围,直接左键拖击单元格即可选定,criteria为判定标准,可以是数值(直接输数字即可无需引号,如0,1等)或字符(须用英文双引号括起,如”YES”,”A”,”男”,”老师”)等,
例如:我要计算50分的人数,则插入的函数为COUNTIF(D3:D923,”=50″) ,“D3:D923”是学生成绩所在的单元格范围,“=50”则是条件。另外需要注意的地方是,如果考试成绩不是整数,比如:50.5,在使用“=50”的条件下,就不会计算在内,这时就必需使用取整函数:ROUND(number,num_digits),按指定的位数对数值进行四舍五入。为了避免不必要的麻烦,一旦发现该科成绩存在小数部分,一般都应该是取整在先,统计人数在后。也就是先用ROUND取整,再用COUNTIF计算人数。从0分到150分的人数都统计出来后,就可以用EXCEL的“图表向导”制作出相应的柱状分布图了,如图2所示。
6、正态曲线
制作正态曲线需要使用函数:NORMDIST(x,mean,standard_dev,cumulative)
X 为需要计算其分布的数值,Mean 为分布的算术平均值,standard_dev 为分布的标准偏差,Cumulative 为一逻辑值,指明函数的形式。如果 cumulative 为 TRUE,函数 NORMDIST 返回累积分布函数;如果为 FALSE,返回概率密度函数。
例如:如果满分为150分,那么我们就要从0分到150分一共151个分值进行计算正态曲线的值,然后才能做出对应的曲线。假如我们要计算50分,那么在表达式中:D1080*NORMDIST($C$980,D1078,D1079,FALSE),“$C$980”对应的就是50分所在的单元格,“D1078”则对应我们事先计算得出的平均分,“D1079”则对应我们事先计算得出的标准方差,“FALSE”则是我们需要的概率密度函数类型。“D1080”则对应这批分析成绩的总人数,是用来矫正正态曲线的重要参数。只有经过矫正后,学生成绩的柱状分布图才能与正态曲线结合起来。因为学生成绩的柱状分布图的纵坐标是人数,那么柱状图的总面积则为成绩的总人数。而正态曲线与横坐标轴包含的面积则为1,所以只有把正态曲线的值乘以总人数,两者的面积才能相等,这样两者才能完美结合起来。从“频率=频数/样本数”这一关系来说,正态曲线图的纵坐标单位是“频率”,因此乘以“D1080”( 样本数)才可以得到“频数”,这样两者的纵坐标单位才一致,才能放置于同一个坐标系内。
从0分到150分的人数都统计出来后,就可以用EXCEL的“图表向导”制作出相应的正态曲线分布图了,如图3所示。
当我们把“学生成绩的柱状分布图”与“正态曲线分布图”共同制作在一个图表中,就可以得到如图1所示的效果图了。在这样一幅效果图中,我们建立了一批数据频数分布柱状图与该批数据平均值和标准差所确定的正态分布曲线的对照关系。有了参照,我们就可以分析这批学生该科考试成绩的质量了。另外再附加上平均分、难度系数、区分度、低分率、及格率、优秀率等数值以后,就可以开始对成绩进行更为详细和完整的分析了。
二、做完各科目的成绩正态分布图以后,对于以下的一些例图,我们可以尝试做一些分析。
1、从图4中,我们可以看出试题的区分度很好,达到0.56,但是从成绩分布来说,不符合正态分布。针对这种情况我们可以采取一些教学上的改进措施,比如:抓基础题的练习,学生每天的习题量要够份量,每天要督促学生独立完成作业,要注重学生平时学习的过程。
2、从图5中,我们可以看出,该科的总分(120分)用最右边的绿色竖线来标识,左边的绿色竖线则是优秀线。因为做学生成绩分析是所有科目一起做的,为了减少操作的麻烦,也是为了能进行不同科目的横向比较,虽然不同科目的成绩没有可比性,但是对于他们的教学评价却有一定的可比性,为了能让直观感觉一致性,对于横坐标的刻度标准应该要一致,所以我们统一用150分来确定横坐标的最大值。这时候,我们只需要在满分值的地方用一条绿色的坚线来注明。该科的满分为120分,考虑0分为第一刻度,那么120分就应该在121的刻度位置。试题的区分度在0.37,但是从成绩分布来说,应该是属于正偏态分布。
如果频数分布的高峰向左偏移,长尾向右侧延伸称为正偏态分布(考试分数集中在低端),也称右偏态分布;同样的,如果频数分布的高峰向右偏移,长尾向左延伸则成为负偏态分布(考试分数集中在高端),也称左偏态分布。
从这里我们可以了解到,在编制试题的时候,平时测验的难度设定要利于学生的学习,同时还要考虑及格率,防止损伤学困生的自尊心,但一定的难度却能增加区分度,这对全面了解、掌握学生学习情况有十分重要的作用。除此之外,难度水平的确定还要考虑对分数分布的影响,一般以正态分布为前提,有时正偏态分布更能激发学生的学习积极性。
3、从图7中,我们可以看出存在两个峰值,中间凹,两边凸,说明两极分化严重。在教学改进措施中,应该加强对薄弱学生的关注,督促检查他们的学习,从而尽量减小他们与优秀学生的差距,在图中则尽量体现为两个峰值合为一个峰值。
该科的总分(100分)用最右边的绿色竖线来标识,右边的绿色竖线则是优秀线。我们可以看到粉红色的正态曲线已经溢出了满分线。因为该科的平均分比较高,区分度为0.41,正态曲线就会比较矮,由于正态曲线是两端对称性的,所以就会存在一端溢出的现象,这也可以说是用正态曲线来分析成绩的一个局限性。因此,当难度系数在0.5,区分度不超过0.5的时候用正态曲线来分析是最合适的。
从以上各类情况,我们可以看到,用EXCEL来制作成绩分析的正态布图,并且结合难度系数、区分度、成绩柱状分布图、低分率、及格率、优秀率等参数来对学生的考试成绩来进行分析,这是一种有效的可操作的方法。通过对多种衡量参数融合为一体来进行分析,使得我们对教学质量的整体把握更为详细和有效。如果只是单一的学生成绩分布图,没有正态曲线来做参考,那也只能是一副图而已。就相当于数量没有单位,就没有了衡量价值。
因此,通过这种可操作的方法来对学生考试成绩进行分析,并作出教学评价非常有意义:1、有利于全面贯彻国家的教育方针。2、有利于学校教育教学决策的科学化。3、有利于推进学校管理、评价工作的规范化。4、有利于提高教师的编制试题能力,有利于促进教育教学质量的提高。5、评价作为一种反馈——矫正系统,用于教学过程中的每一个环节上判断该过程是否有效;如果无效,必须及时采取什么变革,以确保过程的有效性。
总之,教学评价的目的,不仅要对教学质量状况做出价值判断,而且要对教学改革提出设想,使教学改革沿着正确的方向发展。在教学改革中,我们教师应该可以借助这样一种分析评价的方法来肯定成绩、总结经验、发现问题、找出差距,从而有针对性地采取改革措施,从而达到提高教学质量的目的。
参考文献:
[1]支敏编著.教育评价的基本原理与运用[M].贵阳:贵州人民出版社,2006.8
[2]许世红,胡中锋著.数学试卷分析方法[M].华东师范大学出版社,2009.10
转载请注明:数据分析 » 如何用EXCEL制作成绩分析的正态分布图_excel正态分布图