- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
教育编码器:
教育转录数据的开源注释系统
1222
GuanzhongPan,MeiTan,HyunjiNam,LucíaLanglois,
222
JamesMalamut,LilianaDeonizio,DorottyaDemszky
1CarnegieMellonUniversity,2StanfordUniversity
arthurp@,{mxtan,hjnam,lucilang,jmalamut,lilianas,ddemszky}@
摘要实践者的专业知识、语言特征及背景信息。这
遵循一个迭代校准过程,在此过程中研究人员
我们引入了教育编码器,一款专为支与实践者共同指定注释代码手册。除了概念性
持教育对话的语句级标注而设计的专业工因素外,还有多个实际因素使该过程变得相当
具。虽然自然语言处理和定性研究中通用
文本标注工具众多,但很少有专门解决编具有挑战性。
本码教育对话记录复杂性的需求——涉及多首先,没有专门构建的自适应工具用于通
译样化的师生和同伴互动。常见的挑战包括过迭代共设计和校准支持来标注教育成绩单。
定义复杂的教学特征代码本、支持开放式大多数现有的平台针对的是通用的自然语言处
中和类别式编码以及结合外部特征(如课程理标记任务,如命名实体识别(NER)或词性
的目的和指令的教学价值)来语境化语句。
2教育编码器被设计用于通过为研究人员和(POS)标注,并缺乏对标注教师和学生的话语
v领域专家提供一个平台来共同基于观察数动作以及它们所体现的潜在认知过程等高推断
5
8据定义复杂代码本来解决这些挑战,并且教学特征的支持(Nakayamaetal.,2018;Honni-
3它集成了类别式和开放式标注类型,同时balandMontani,2017;Perry,2021)。定性分析
5还包含了背景材料。此外,该工具还提供平台(ATLAS.tiScientificSoftwareDevelopment
0.了多个标注者响应的并排比较功能,允许GmbH,2023;Dhakal,2022)支持开放编码但缺
7与其他人的标注进行对比和校准以提高数乏对结构化、话语级别注释和实时协作校准分
1
0据可靠性。系统为开源,带有演示视频
52析的支持。因此,许多研究人员依赖于电子表
可用。
2格或临时解决方案,这些方案耗时构建,使用
:
v1介绍起来往往笨拙,并且与现代机器学习工作流程
您可能关注的文档
- 前景感知虚拟染色用于精确的 3D 细胞形态学分析-计算机科学-细胞形态-算法.pdf
- 因果基础模型: 从仪器属性中分离物理特性-计算机科学-结构化时间序列数据-机器学习.pdf
- 无数据神经网络在资源受限项目调度中的应用-计算机科学-无数据神经网络-组合优化.pdf
- 条件图神经网络在软组织变形和力预测中的应用-计算机科学-图神经网络-触觉反馈-虚拟现实.pdf
- 具有类别特定集成和贝叶斯超参数优化的双注 意力 U-Net++用于精确伤口和尺度标记分割-计算机科学-图像分割-深度学习-医学成像-贝叶斯优化.pdf
- 三支一扶模拟题库附完整答案详解【考点梳理】.docx
- 2025年三支一扶练习题含答案详解(考试直接用).docx
- 2025年三支一扶考前冲刺练习附参考答案详解【培优B卷】.docx
- 2025年三支一扶通关题库含完整答案详解(考点梳理).docx
- 三支一扶通关考试题库含答案详解(研优卷).docx
文档评论(0)