科技行者
算力行者
过去几十年中,大数据改变了一个又一个领域。在气象科学领域,借助大数据,人们已经建立了更好的气象模型,提前预报天气;在高能物理领域,通过分析每秒4000万次质子碰撞的数据,人类可以寻找曾经难以捉摸的希格斯玻色子的证据;在生命科学领域,通过大数据,研究人员得以在超过30亿核苷酸的人类基因组中,探究其中至少一个版本的全序列,从而展开个性化基因研究;电商领域更是离不开大数据......我们知道,大数据的应用有很多,现在在教育行业,大数据应用也越来越多。
“正如越来越多的学生开始使用教育软件和在线学习平台,这些平台获取每一个学科、每一个学生的学习数据也变得越来越容易。”2017年1月10日,在论答公司(learnta inc.)于北京主办的教育大数据研讨会上,美国宾夕法尼亚大学(university of pennsylvania)教育学院终身教授ryan baker指出。从baker的分享中我们得知,教育数据挖掘至关重要,这些数据为教育平台提供模型,这些模型让学习系统从千人一面变成千人千面,从而改善目前的教育环境。具体情况,我们听听这个教授怎么说。
人类基因组测序
在美国,大量的学生每天都在使用cognitive tutor、assistments、reasoning mind这样的在线学习系统。比如,学生可以通过故事线索学数学,也可以在工作任务的情境中做语文题,甚至,孩子们一边“打僵尸”一边玩“数字游戏”:每个孩子都有很多武器,每件武器上都有自己的数字,如果要击败僵尸,武器上的数字必须整除僵尸胸口上的数字。
网络教学(左下角:僵尸动作游戏zombie division)
baker认为,这些个性化教育平台至少要做到三件事:1、确定学生的有关数据;2、了解对于学生的学习来说什么是真正重要的;3、有针对性地为学生提供合适的教学。
所有这些在线学习系统都会产生大量的数据流。当一个学生使用一个在线学习平台时,他每小时会产生数以百计的行为,多个学生就产生了教育大数据,比如在做出错误回答前可能会暂停和思考、寻求帮助、快速更改设置、从僵尸身边跑开等,这些数据可以用于教育数据挖掘与分析。
这些教育数据挖掘有很多应用的方向,比如可以预测学生是否会辍学还是会成功完成学业;或者能自动检测学生的学习投入程度、情感、学习策略等,目的就是为了更好地实现个性化教学;甚至可以给老师、家长提供学习分析报告,进行教育科学的基础研究。
现在,通过教育数据挖掘,很多研究团队已经开发出了研究模型,这些模型可以推断很多事情:
1、学生的元认知(meta-cognition,即学生对自己认知的认识)和求助行为。比如,这个学生有多自信?当他需要帮助时,有没有在寻求帮助?他有没有在给自己解释问题,有没有思考这个答案是正确的还是错误的?最重要的,当他面临挑战时,能否坚持下去?
2、有没有投入学习、还是开始分心了。baker举了一个很有意思的亲身经历,看到有学生为了找正确答案而瞎蒙,在填空题里面填了“1”,发现不对,又改为填“2”,一直试到“38”这个数字,才找到正确答案。另外,有一些孩子会有非常难以解释的行为,比如做数学题时不用方程的符号而是画了一个笑脸。
3、学生情感。baker 的研究团队和其他研究团队,已经创造了研究模型,可以根据数据推断,学生是否感到厌倦、沮丧、困惑、好奇、兴奋、快乐,是否投入,等等。
4、长期的学习结果。比如,学生能够记住刚才他学的东西吗?学生也没有准备好学习下一个主题、下一个知识?这个中学生能上大学吗?他会从大学毕业还是辍学?
学生的成绩与结果数据表
并且,这些模型已经被大规模地应用于自适应学习系统,为成千上万的的学生所使用。
baker列举了全球七个大规模应用教育大数据分析模型的自适应学习系统,包括:
1、knewton,系统自动决定下一步该给学生推送什么样的学习问题,已经在全球范围实际应用于多个学科。
2、aleks,基于先行知识结构和知识点模型,为学生推荐学习内容,已经应用于美国高中与大学的数学和科学学科。
3、cognitive tutor,自动检测学生的知识掌握情况,把握教学进度,直到学生最终掌握知识;同时,自动检测学生的学习专注程度,为学校做出相关分析报告。已经应用于美国的初中和高中数学学科。
4、learnta(论答自适应学习系统),基于先行知识结构和知识点模型,为学生推荐学习内容;同时,自动检测学生的知识掌握情况,把握教学进度,直至最终掌握每一个知识点。根据中国学生的学习需求而本土化开发,目前涵盖数学和英语学科。
5、reasoning mind,自动检测学生的学习专注度,为每个地区的教学管理员提供教师教学效果的报告,已经应用于美国的小学数学教育。
6、duolingo(多邻国),自动检测学生的记忆,建议学生应当在什么时候复习之前学过的知识,已经在世界范围内应用于外语词汇的学习。
7、civitas, course signals, zogotech, 这些系统提供各种风险预测模型,给老师和学习顾问提供可具体实施和操作的学生信息,已经在世界范围内的大学开始应用。
印度老师用手里的移动端采集学生的学习投入程度数据
baker说,有足够的实证研究证据证明,这七个学习系统中至少有以下两个系统对于学生的学习是有显著效果的:
其中一个是由胡祥恩教授在美国领导开展的多项实证研究项目,证明了aleks系统能够有效提高各个不同族裔的美国学生的数学学习成绩。
aleks系统
第二个是论答(learnta)的自适应学习系统。ryan baker的研究团队和论答公司合作,基于中国三个不同地区开展了三个实证研究项目,研究结果表明,学生通过论答自适应学习系统学习,比通过一个传统的在线学习系统学习效果更好。
论答自适应学习系统
从长远角度,baker分析了这些教育大数据算法模型的潜在发展方向:
首先,通过学生知识和学习模型,来确定学生在什么时候需要更多支持,在学生掌握上一个知识之前,不会推荐该学生去学习下一个知识;而当学生需要支持的时候,系统会自动介入,并同时告诉该学生的老师和父母。
其次,通过学习投入程度模型,来检测学生什么时候开始变得厌倦或者沮丧,并相应地调整学习任务,比如为那些厌倦的学生选择一些更有趣的学习活动,为沮丧的学生选择相对容易一些的学习任务。学习投入程度模型也可以用来确定为了让学生更投入学习,需要什么样的学习活动,最终甚至可以确定需要在什么时候提供、给什么样的学生提供这些学习活动。
另外,还能告诉老师和父母,学生在什么时候开始在学习上变得分心。
最后,当一名学生没有真正学会时,学习模型就可以检测出来,并相应提供更多的练习,用不同的方法为学生提供解析,或者鼓励学生自己去阐释问题。
baker最后总结道,这些不同的模型和方法现在都有很多应用的案例。教育人工智能(artificial intelligence in education)、智能辅导系统(intelligent tutoring system)、教育数据挖掘(educational data mining)、学习数据分析(learning analytics)等研究领域已经有大量有关这些模型和方法的研究文献。下一步的目标应当是在系统中不断优化现在已经成功应用的模型和方法,最大限度地造福于中国和全世界数十亿的学生。
据悉,baker是美国宾夕法尼亚大学(university of pennsylvania)教育学院终身教授、学习数据分析研究中心(penn center for learning analytics)主任,国际教育数据挖掘协会(international educational data mining society)的创始人、《教育数据挖掘》杂志(journal of educational data mining)的主编。baker教授在各类期刊和会议发表了260余篇学术论文,先后主持了美国科学基金会(national science foundation),盖茨基金会(gates foundation)等研究基金的多项项目,累计获得研究经费超过1600万美元。baker的研究实验室同时与亚洲,南美洲,以及欧洲的大学和研究机构开展合作项目。baker本人也在哥伦比亚大学教育学院(teachers college, columbia university)和爱丁堡大学同时担任教职,并在coursera 和 edx 慕课平台上开设了“big data in education”《教育大数据》课程,注册学生来自100多个国家和地区。
本次活动的合办方包括宾夕法尼亚大学学习分析学研究中心(penn center for learning analytics)、中国人民大学统计与大数据研究院、华中师范大学心理学院、knewton公司、芥末堆。
好文章,需要你的鼓励
“是不是让小牛电动车也拥有siri语音交互”?“是不是也让电动车可以像汽车那样,蓝牙近距离开锁”?