基于有指导的音乐实体关系抽取114.pptVIP

  • 1
  • 0
  • 约2.83千字
  • 约 23页
  • 2018-05-08 发布于湖北
  • 举报
基于有指导的音乐实体关系抽取114.ppt

* 为什么选择音乐领域? 通用域的难点 没有完善的关系类型体系 建立关系类型体系困难 关系类型太多 关系如何命名呢? 覆盖面要尽可能全 细化、准确… … 领域收缩:乐坛、电子产品、教育、体育等 研究方法可移植,也是某种意义上的通用域 gfh * 提纲 课题简介 主要研究内容 研究方法和实施方案 下一步工作 gfh * 主要研究内容 音乐实体关系抽取 特征提取 构建语料库 建立音乐实体关系类型体系 分类模型 训练 基于有指导的学习方法 gfh * 提纲 课题简介 主要研究内容 研究方法和实施方案 语料库建设 特征提取 模型训练 评测 下一步工作 gfh * 语料库建设 来源:新浪音乐新闻(2008.8-2009.3) 处理流程 新闻文本 断句 分词、 词性标注、 音乐实体 识别 句子 句子 句子 … 制定标 注规范、 人工标 注语料 音乐实体 关系抽取 语料库 随机筛选 10000句 作为待标 注语料 gfh * 音乐实体关系抽取技术介绍 训练过程 识别过程 训练数据 (2/3) 测试数据 (1/3) 特征提取 SVM训练/ MaxEnt训练 SVM模型/ MaxEnt模型 SVM分类/ MaxEnt分类 识别结果 语料库 随机筛选 实验数据 gfh * 训练过程-特征提取 输入:训练语料词法句法信息 输出:特征文件 例如:在/p 北京/ns 奥运会/j 开幕式/n 上/nd

文档评论(0)

1亿VIP精品文档

相关文档