胡小勇 等 | 基于画像技术的教师研修路径智能推荐研究
发布时间2024.05.07
胡小勇1, 孙 硕1, 穆 肃2
(1.华南师范大学 教育信息技术学院, 广东 广州 510631;
2.华南师范大学 教育人工智能研究院, 广东 广州 510631)
摘 要:教师是教育的第一资源,研修是促进教师专业发展的重要方式。在大数据、数字画像等新技术赋能下,优化教师研修路径以提升教师发展质量变得尤为重要。文章构建了多模态数据和画像技术支持的教师研修路径智能推荐模型,包括数据伴随式采集分类与预处理、教师画像生成、研修路径算法三个模块,实现教师研修特征与优质研修资源的智能匹配。在教师研修路径动态优化方面,模型通过提供基于画像的个性化导研服务、基于知识图谱的资源关联推荐、基于群体智能的群体路径发现、基于目标导向的过程评价和基于研修行为的智能预警,满足教师的个性化研修需求,为发掘研修数据潜能、促进教师智能研修模式创新提供参考。
关 键 词:教师画像;教师专业发展;多模态数据;个性化研修;智能推荐
一、引 言
研修,一直被视为教师终身学习和专业成长的重要方式[1]。2021年,教育部《关于实施第二批人工智能助推教师队伍建设行动试点工作的通知》强调,要建设和应用教师大数据,形成教师画像,开展教师智能研修[2]。大数据能够挖掘教师在多场景中的多模态数据,如在线平台自动记录的文本交互数据[3]、课堂教学中伴随式采集的师生行为数据[4]、可穿戴设备获取的生理数据[5]等。而画像(Portrait)技术作为一种重要的大数据应用,能够以数据标签形式精准描摹教师的特征、需求、行为和偏好等规律。如何用好画像技术,将教师个性化标签与优质资源相匹配,为其推荐合理的智能研修路径,成为构建智能研修服务体系、优化研修质量的关键问题。然而,因缺乏合理的数据框架、全息画像模型和适切算法的支持,教师智能研修面临难以有效落地的窘境。对此,本研究结合多模态数据采集和画像技术,构建教师个性化研修路径的智能推荐模型,以期为教师发展提供支持。
二、研究综述
(一)画像技术有效服务教师的个性化研修
刻画用户画像最早由Cooper[6]提出,是实现资源推荐服务的重要方法。研究者将画像技术迁移到教师群体,催生了教师画像的概念[7],从画像构成要素、分析技术和可视化等方面进行了探究。
在画像构成要素方面,教师研修情况主要基于基本信息、行为特征和研修成果等进行描摹。胡小勇和林梓柔指出,画像作为教师个体标签体系的集合,结合教研场景可分为基本特征、教研心理、社会交互、教研行为和教研成果五类标签[8]。王冬冬等则深入挖掘学员的行为特征,采用主成分分析法构建了网络研修社区环境下的教师模型,为教师评价提供了理论参考[9]。
在分析技术方面,回归分析、聚类分析和预测分析等方法有助于深度挖掘数据,实现对教师特征的精准描述。例如:薛杨等使用K-means算法进行聚类分析,通过画像技术实现了教师问题的精准诊断,提升了研修服务的针对性和有效性[10]。朱靖等结合基于规则的预测和基于决策树的预测两种方式,为教师发展预测提供了依据[11]。
在可视化分析方面,研修数据背后隐藏的个体特征与行为规律,可通过基于文本[12]、表格、统计图形[13]、词云(标签云)[14]或融合的表示方法进行展示,为资源的个性化推送提供可视化依据。
(二)多模态数据有助于全面精准描绘教师画像
利用声音、视频、表情、生理等多模态[15]研修数据构建教师画像,能够超越单一模态数据局限,解决过程信息不全[16]、数据残缺[17]等问题,立体化挖掘复杂多维的过程数据[18],既能全面真实地反映研修情况,又能降低教师学习行为的预测错误率[19]。描绘教师画像的核心数据可以分为四类:
(1)个人背景类,主要是从人事系统或研修平台管理系统获取的教龄、学科、教育背景等数据;
(2)自我报告类,即通过量表、问卷、访谈等形式获取的数据,如认知风格、学习偏好和研修动机等;
(3)研修行为类,来自教师发展系统或平台的学习、交互行为记录,以及个体研修时外接感应器所捕捉的眼动、面部数据等;
(4)生理体征类,是指通过可穿戴设备得到的脑电、皮电、心电等生理信号,能更加客观地反映教师的学习状态[20]。
不同信息形态的数据流相互补充,描绘教师画像的不同方面,在动态、精准、真实、全面反映教师研修中发挥巨大潜能[21]。如何获取和合理利用多模态数据构建完整的教师画像,为研修个体提供高质量服务,已经成为当前相关领域亟待解决的现实问题。
(三)智能算法支持个性化研修路径推荐
个性化研修路径是教师在研修过程中根据自身学习偏好、认知风格、能力素养水平、学习需求和环境因素所选择的学习活动路线和知识序列[22-23]。研修路径推荐能够助力教师研修的动态服务和优化,这一过程的实现需要借助多元的智能型算法。当前,研修路径推荐算法主要包括基于内容、知识、会话的推荐算法以及协同过滤和混合推荐五种(见表1)。
(1)基于内容的推荐,通过比较教师偏好与内容属性特征,为教师提供最适配的研修资源。例如,Raj等通过人工定义若干规则,将学习内容特征与学习者风格模型关联起来,计算资源与学习者的相关性分数,用于排序推荐资源[24]。
(2)基于知识的推荐,将研修知识和资源相匹配,根据教师在相关学科领域中的知识偏好提供优质研修内容。例如,Shi等构建了以学习目标为导向、包括六种语义关系的跨学习领域知识图谱,结合学习者学习目标和资源特征实现学习路径推荐[25]。
(3)基于会话的推荐,即捕获教师状态变化的算法,主要用于推荐模型的训练。例如,朱天宇等提出了能够预测学习者知识掌握状态的个性化练习题推荐方法,该方法根据学生的答题会话记录形成认知诊断模型,表示知识掌握状态,预测答题情况,并据此推荐练习题[26]。
(4)协同过滤是推荐系统中的经典算法,从历史行为数据中挖掘用户偏好。在研修中,教师作为学习者,可以通过协同过滤算法分析学习偏好,完成教师群组划分和相似推送。例如,申云凤利用学习者的学习行为日志数据进行建模,采用协同过滤算法为目标学习者选择和提供学习风格、认知水平相似的同伴[23]。
(5)混合推荐,将多种算法相结合,缓解单一算法可能导致的矩阵稀疏、冷启动等问题,以提高研修路径推荐的准确度。例如,Ibrahim等结合基于内容的协同过滤推荐算法,构建了基于本体混合的推荐系统框架,通过个性化课程推荐满足用户多元学习需求[27]。
表1 研修路径推荐算法
三、基于画像技术的研修路径智能推荐模型逻辑框架
以画像技术和多模态数据为基础,本研究构建了教师研修路径智能推荐模型,通过智能算法关联教师关键特征和优质资源,形成最佳路径(如图1所示)。模型包含三个模块,前一模块的输出是后一模块的输入。多模态数据采集、分类与预处理模块负责对研修相关数据进行感知、挖掘、转换以及分类,并存储在统一的数据池中;教师画像生成模块能够对预处理后的研修数据进行分类标记,生成事实标签、模型标签和预测标签,分析个体研修特征并将其可视化呈现;研修路径推荐算法模块融合多种智能算法为教师精准匹配适切的优质学习内容和工具,以实现个性化推送。
图1 基于画像技术的教师个性化研修路径推荐模型
(一)多模态研修数据采集、分类与预处理
1.多模态研修数据采集
多模态数据是构建教师画像的基础,其采集手段包括平台采集、视听录制、图像识别、智能感知等。
平台采集支持获取个体在线学习或交互时的研修行为数据,使用平台自动记录技术、日志搜索分析技术和网络爬虫采集技术等,抓取网络研修平台公开数据和用户日志。
视听录制支持获取教师线下课堂教学中的音频、视频数据,在教师现场授课的同时,使用自动录播技术记录课堂教学和交互实况录像。
图像识别支持检测研修过程中的图像类数据,从非结构化内容中分析和反映研修效果。例如,数码笔借助高速摄像头和光学点阵技术,不仅能将纸张上书写的文字或图片以数据的形式存储,还可精准捕捉笔尖的运动轨迹、速度与受压变化,感知教师的笔迹信息。
智能感知通过可穿戴技术、非接触式感知技术等采集教师研修行为和相关生理数据,如佩戴眼动仪能够精准追踪眼睛的视点轨迹、注视的时间与次数,甚至是瞳孔变化。
2.多模态研修数据分类
数据分类可以更好地挖掘数据存在的价值,增强模型的有效性。根据教师画像生成与研修特征的相关性,多模态研修数据划分为核心数据、拓展数据和外延数据三类。
核心数据是指直接从研修平台获取的教师相关数据,包括:
(1)教师特征,包含年龄、工作经历等结构性背景数据;
(2)研修心理,即通过各种自我报告形式获取的数据,主观反映教师心理状态和认知风格,是比较传统的学习状态数据来源;
(3)交流互动,教师在研修时开展的讨论、互评等交互数据;
(4)自主学习,包含在线平台记录的日志信息,以及通过智能分析系统转换生成的线下行为数据和生理信号;
(5)伴随产出的研修成果类数据,如教学设计和科研论文等。
拓展数据主要指与研修相关的教学活动数据(如课堂中教师言语和非言语行为、多媒体教学内容、师生互动等),在完整采集核心数据的前提下,这类数据能够辅助判断教师的研修需求。
外延数据包括学生学情数据、学校公开的教育数据以及区域教育部门的教育大数据等。总体来看,各层级数据相互联结、融通,对多场景、全时序的多模态研修数据进行分类,实现信息的多源互补。
3.数据预处理
由于前期获取的数据结构性质不同、质量参差不齐,有必要进行数据预处理,以便后续教师研修特征的提取。数据预处理包括数据清理、数据集成、数据归约和数据变换等步骤。
数据清理主要包括移除异常值、替换缺失值、光滑噪声数据、平滑或删除离群点等数据操作[28],用于清理异常和重复数据,纠正错误数据。
数据集成是为保证教师画像后续构建的准确性和易操作性,需要把所有类别的数据集合为一体,通过教师数据库管理系统,合并、处理和管理多源异构的数据。例如,某位教师可能有N条研修成绩记录,因此,有必要将这N条成绩进行加权平均运算进行合并。
数据归约是在保留数据完整性的基础上,对上一步形成的庞大研修数据集进行压缩,以提高数据挖掘效率。
数据变换是为了尽可能筛选更多具备实用价值的数据,对不同类型、格式的数据进行规范化、离散化和稀疏化处理,使其统一变换成适合画像技术的格式。
(二)基于多模态数据的画像生成
1.特征标签提取
特征标签提取是构建教师画像最为重要的环节,标签是规范程度较高且具有语义的短文本,既能直接被人理解,也方便计算机提取、聚类[29]。基于研修核心数据,教师画像可以分为五类(见表2):教师特征、研修心理、交流互动、自主发展、研修成果。不同数据需要分别通过统计分析、建模分析、模型预测等方法生成事实标签、模型标签、预测标签。
表2 教师画像构建框架
事实标签是采用文本挖掘、自然语言处理等统计算法对原始数据进行简单统计分析得到的标签。例如,通过研修管理系统获取用户性别、学历和工龄等基本信息,直接统计转化生成教师特征标签。
模型标签是教师标签体系的核心,需要通过定义规则或建立模型来计算得出。例如,对教师学习历史数据进行深入分析,得到内容关注标签,判断该教师所关注的研修主题和内容。
预测标签是在事实标签和模型标签的基础上,利用聚类和预测等算法对画像模型进行训练优化后,输出的具有概率预测和价值预测功能的标签。例如,通过识别教师高频浏览的研修资源,预测下一步可能需要的服务,为研究路径的智能推荐提供依据。
2.教师画像可视化
教师画像的可视化表征以人物肖像与标签词云相结合的形式为主。利用如Wordle、tagCloud、Tagul、Tagxedo等标签可视化工具,根据标签权重,用不同大小的文字形象直观地表现教师研修特征。同时,画像的表征方法还有很多,如结构化的文本描述、展示教师特征的表格绘制以及表达群体特征的直方图、折线图等。此外,随着可视化技术的发展,3D建模、虚拟现实、AI智能展示等新技术也在不断丰富着画像的可视化手段[30]。
(三)基于教师画像的研修路径推荐算法
精准画像既可以客观描述研修个体特征,还能跟踪发现行为规律和动态预测需求变化。路径推荐模型根据交流互动、自主发展等特征标签,结合智能推荐算法,实现个性化检索服务、学科研修资源推送、同伴推荐等功能。其中,个性化检索功能为教师提供最优检索结果,帮助提升检索体验[31]。例如,基于教师最近检索行为、画像表征的长期需求和偏好,采用加权混合方式,推测教师可能需要的检索信息,在最佳位置呈现最为匹配的检索结果。学科研修资源推送功能采取基于内容的推荐算法,依据学科背景、认知偏好、近期兴趣等标签,推送平台中符合教师特征的学科类文本、视频资源。同伴推荐功能依据画像表征的工作背景、研修行为、认知风格等特征,为教师匹配相似型或互补型同伴[32]。
四、基于画像技术的教师个性化研修路径动态优化
教师研修路径的优化,关键在于个性化导研服务、资源关联推荐、研修路径发现、基于目标导向的过程评价、研修行为的智能预警,从而实现研修路径智能推荐的整体构想。
(一)基于画像的个性化导研服务
所谓个性化,需以教师的研修需求为导向,提供有针对性的服务。首先,针对研修个体初次登录平台时,没有数据所造成的“冷启动”问题,可通过需求和偏好调查,挖掘教师在人事系统或其他资源平台中的基础信息,填补画像空白,实现资源的精准推送。随着研修的深入开展,伴随研修过程产生的多模态数据使得画像愈加完整、全面。路径智能推荐模型一方面通过交流互动类标签和自主发展标签表征和预测教师需求和学习偏好,另一方面训练研修资源的语义表征,提高资源推送的精准度,最终实现教师个体和资源的双向适配。最后,画像还能够动态表征研修情况和实时预警教师困惑,以便提供下一步的导研指引和答疑服务。
(二)基于知识图谱的资源关联推荐
在进行研修资源推荐时,根据教师需求和偏好标签,匹配具有相应特征的资源,能够在一定程度上实现自适应推送,但忽略了研修知识和资源之间存在的内部联系。因此,实现资源关联推荐需要建立在知识图谱基础之上,图谱的任意一点表示为一个信息单元,信息单元之间的逻辑关系通过有向边描述。相应地,利用教师专业发展所需的核心知识构建知识图谱,将图谱中各知识节点延展为个体发展的具体能力及其对应的研修内容,利用路径推荐模型建立知识标签,将具有内容逻辑的主题列表发送给教师。由于教师对主题的感兴趣程度会随着时间的推移而发生变化,可以为图谱中的知识节点分配权重值,从而发现研修个体对不同知识的兴趣差异。
(三)基于群体智能的研修路径发现
群体智能概念源于对自然界中生物群体行为规律的观察,表示为非智能群体通过简单合作表现出智能行为的特征[33]。在大数据时代,教师群体产生了大量可供分析的研修数据。一方面,应用K-Means聚类分析等智能技术对教师进行聚类,输出各类群体画像,基于聚类分析的结果,探究这几类群体研修时表现出的问题,寻找符合他们需求和解决实际问题的途径,可帮助其实现有效发展。另一方面,挖掘分析具有相同或相近偏好、知识水平的群体研修最优路径,在决策时综合参考该群体对路径的评价以及目标教师用户在知识水平和学习风格上的特点,以实现更高质量的研修路径推荐。
(四)基于目标导向的过程评价
在提升自身专业素质能力[34]和提高教育教学实绩[35]的目标导向下,教师研修效果的评价设计要突破结果性局限,重视过程性评价,量化测试与质性分析相结合。本研究所构建的教师研修路径智能推荐模型中,自主发展和研修成果标签能够表征教师个人的研修目标达成情况和需求,以此作为后续知识点相关内容推送的重要参考。同时,借助数据可视化工具,以直观明了的图形、图像呈现研修效果,将评价结果更加清晰有效地传达给教师,既增强了数据的可读性,也有助于教师从多角度进行自我评价和反思,并更具针对性地调整学习态度和方式。
(五)基于研修行为的智能预警
路径推荐模型通过挖掘和分析教师在线研修数据,精准识别学习情况,预测潜在危机,并向教师提前发出警示信息,同时对其研修行为加以干预,提供相应的指导和帮助。一方面,研修管理系统通过检测登录平台次数,发现极少登录平台的“边缘用户”,系统以自动消息弹窗或电子邮件的形式发送通知信息,提醒教师按时登录平台、及时完成考核、提交课程作业,从而完成特定的研修任务。另一方面,系统根据当前阶段教师参与和完成任务情况识别研修效果,由干预引擎自动生成警示等级,向研修个体提供相应的建议和资源。例如,学习风险报告可以帮助教师更加了解自身在现阶段的研修情况和可能出现的问题,以促进自我监控和反思。在研修活动持续开展的过程中,智能预警引擎对教师研修行为风险进行实时的循环诊断和干预,随着数据的不断增加以及干预策略的不断丰富,预警效果将越来越科学、及时和准确。
五、结 语
多模态数据为教师画像构建提供了基础,画像技术为研修路径的生成和优化提供了有力支撑,基于画像技术的研修路径推荐作为满足教师个性化研修需求、促进专业发展的关键,是当前教师教育领域的重要研究内容。在人工智能、大数据等新兴技术快速崛起背景下,本研究结合多模态数据采集分类与预处理、教师画像生成、研修路径推荐算法三个方面,构建了基于多模态数据和画像技术的教师研修路径智能推荐模型,并由此提出了个性化导研服务、资源关联推荐、群体研修路径发现、过程性研修评价和研修行为智能预警五种路径动态优化方案,为人工智能在教师专业发展中的应用、教师精准研修的有效开展提供了新思路。
参考文献
[1] ALEJANDRO O, MENENDEZ A, LE H E. Improving teaching quality through training:evidence from the caucasus[J]. Economics of education review, 2017,61:1-8.
[2] 教育部.教育部关于实施第二批人工智能助推教师队伍建设行动试点工作的通知[EB/OL].(2021-09-08)[2021-12-27]. http://www.moe.gov.cn/srcsite/A10/s7034/202109/t20210915_563278.html.
[3] 张瑾,张夷楠,叶海智,等.教师在线学习社区中会话主题发现及演化分析[J].远程教育杂志,2021,39(2):85-94.
[4] 王一岩,王杨春晓,郑永和.多模态学习分析:“多模态”驱动的智能教育研究新趋向[J].中国电化教育,2021(3):88-96.
[5] 张琪,武法提.学习分析中的生物数据表征——眼动与多模态技术应用前瞻[J].电化教育研究,2016,37(9):76-81,109.
[6] COOPER A. The inmates are running the asylum:why high -tech products drive us crazy and how to restore the sanity[M]. Indianapolis:SAMS, 2004.
[7] 方丹丹,王海涛,李颖,等.对外经济贸易大学 用大数据描绘“教师画像”[J].中国教育网络,2017(7):61-63.
[8] 胡小勇,林梓柔.精准教研视域下的教师画像研究[J].电化教育研究,2019,40(7):84-91.
[9] 王冬冬,张亨国,郑勤华,等.教师网络研修社区学习者模型构建研究[J].中国远程教育,2019(7):47-55.
[10] 薛杨,陈晓慧.混合式培训视角下的研修平台构建与应用研究[J].中国电化教育,2020(12):112-118,130.
[11] 朱靖,刘太如.区域中小学教师专业画像的设计与实践[J].中国教育信息化,2021(17):56-59.
[12] 黄晓斌,张明鑫.融合多源数据的企业竞争对手画像构建[J].现代情报,2020,40(11):13-21,33.
[13] 苏文帅,栾一飞.城市贫困群体画像与媒体话语建构:基于大数据的分析[J].传媒,2019(6):94-96.
[14] 赵雅慧,刘芳霖,罗琳.大数据背景下的用户画像研究综述:知识体系与研究展望[J].图书馆学研究,2019(24):13-24.
[15] 牟智佳.多模态学习分析:学习分析研究新生长点[J].电化教育研究,2020,41(5):27-32,51.
[16] ERADZE M, LAANPERE M. Lesson observation data in learning analytics datasets:observata[C]//12th European Conference on Technology Enhanced Learning. Tallinn:Springer International Publishing, 2017:504-508.
[17] ZHENG W L, LIU W, LU Y, et al. EmotionMeter:a multimodal framework for recognizing human emotions[J]. IEEE transactions on cybernetics, 2019, 49(3):1110-1122.
[18] DI MITRI D, SCHNEIDER J, SPECHT M, et al. From signals to knowledge:a conceptual model for multimodal learning analytics[J]. Journal of computer assisted learning,2018,34(4):338-349.
[19] GIANNAKO M N, SHARMA K, PAPPAS I O, et al. Multimodal data as a means to understand the learning experience[J]. International journal of information management,2019,48:108-119.
[20] YIN Z, ZHAO M, WANG Y, et al. Recognition of emotions using multimodal physiological signals and an ensemble deep learning model[J]. Computer methods & programs in biomedicine,2017,140:93-110.
[21] 彭红超,魏非,闫寒冰.多模态数据赋能教师画像:从简笔画走向全息画像[J].开放教育研究,2021,27(2):80-89.
[22] 刘璇,崔永鹏.非线性学习视域下教师智能研修系统设计与应用研究[J].中国电化教育,2021(9):97-103.
[23] 申云凤.基于多重智能算法的个性化学习路径推荐模型[J].中国电化教育,2019(11):66-72.
[24] RAJ N S, RENUMOL V G. A rule-based approach for adaptive content recommendation in a personalized learning environment:an experimental analysis[C]// 2019 IEEE Tenth International Conference on Technology for Education (T4E). Goa:IEEE Computer Society Conference Publishing Services,2019:138-141.
[25] SHI D, WANG T, XING H, et al. A learning path recommendation model based on a multidimensional knowledge graph framework for e-learning[J]. Knowledge-based systems,2020,195:105618.
[26] 朱天宇,黄振亚,陈恩红,等.基于认知诊断的个性化试题推荐方法[J].计算机学报,2017,40(1):176-191.
[27] IBRAHIM M E, YANG Y, NDZI D, et al. Ontology-based personalised course recommendation framework[J]. IEEE access,2018,7:5180-5199.
[28] 王永固,陈俊文,丁继红,等.数据驱动的教师网络研修社区数字画像构建与应用——基于“浙江名师网”的数据分析[J].远程教育杂志,2020,38(4):74-83.
[29] 赵辉,化柏林,何鸿魏.科技情报用户画像标签生成与推荐[J].情报学报,2020,39(11):1214-1222.
[30] 刘学太,李阳,巴志超,等.数据驱动环境下数据画像若干问题探析[J].情报理论与实践,2022,45(4):87-94.
[31] 陈丹,柳益君,罗烨,等.基于用户画像的图书馆个性化智慧服务模型框架构建[J].图书馆工作与研究,2019(6):72-78.
[32] 兰丽娜,石瑞生,勾学荣.基于学习行为模型的学习伙伴推荐方法研究[J].现代教育技术,2018,28(4):67-73.
[33] WONG L H, LOOI C K. Swarm intelligence:new techniques for adaptive systems to provide learning support[J]. Interactive learning environments,2012,20(1):19-40.
[34] 中华人民共和国中央人民政府. 中共中央 国务院关于全面深化新时代教师队伍建设改革的意见[EB/OL].(2018-01-03)[2021-12-27]. http://www.gov.cn/zhengce/2018-01/31/content_5262659.htm.
[35] 中华人民共和国中央人民政府.中共中央 国务院印发《深化新时代教育评价改革总体方案》[EB/OL].(2020-10-13)[2021-12-27]. http://www.gov.cn/zhengce/2020-10/13/content_5551032.htm.
文章引自:胡小勇,孙硕,穆肃.基于画像技术的教师研修路径智能推荐研究[J].电化教育研究,2024,45(2):106-112.