- 27
- 0
- 约2.03万字
- 约 9页
- 2017-10-02 发布于山东
- 举报
文章编号:1003-0077 (2011)00-0000-00
基于CNN-BLSTM-CRF 模型的生物医学命名实体识别*
李丽双,郭元凯
(大连理工大学计算机科学与技术学院,辽宁 大连 116023)
摘要:命名实体识别是自然语言处理任务的重要步骤。近年来,不依赖人工特征的神经网络在新闻等通用
领域命名实体识别方面表现了很好的性能。然而在生物医学领域,许多实验表明基于领域知识的人工特征
对于神经网络模型的结果影响很大。因此,如何在不依赖人工特征的情况下获得较好的生物医学命名实体
识别性能是有待解决的问题。本文提出一种基于CNN-BLSTM-CRF 的神经网络模型。首先利用卷积神经网
络(CNN )训练出单词的具有形态特征的字符级向量,并从大规模背景语料训练得到具有语义特征信息的
词向量,然后将二者进行组合作为输入,再构建适合生物医学命名实体识别的BLSTM-CRF 深层神经网络
模型。实验结果表明,不依赖任何人工特征,本文方法在Biocreative II GM 和JNLPBA2004 生物医学语料
上都达到了目前最好的结果,F-值分别为89.09%和74.40% 。
关键词:生物医学命名实体识别;词向量;LSTM; CNN ;CRF
您可能关注的文档
- 晨阳大厦晨阳商务中心多塔作业施工方案.doc
- 工程项目管理公司办公楼维修工程策划书.docx
- 掘进工作面运输顺槽供电设计.doc
- 山西翼城首旺煤业有限责任公司回采工作面供电设计.doc
- 西华县产业聚集区公共租赁住房1#楼框架二次结构施工方案.doc
- 智能小车蓝牙控制技术设计方案.doc
- 电工技师论文-关于XK5-9_90-KBT矿用防爆蓄电池式电机车在短距离循环车场中的改造和应用.doc
- 《计算机网络管理》课程论文--安徽工程大学学生宿舍网优化方案设计.doc
- 对师德建设的一点探讨和研究.doc
- 商务英语课程设计-高速铁路建设对江西区域经济发展的影响探究.doc
- 2026年智慧健康管理系统创新报告.docx
- 河北衡水市武强中学2025-2026学年高二下学期4月期中物理试题(含解析).docx
- 2026年人工智能行业智能老年防走失定位器创新报告.docx
- 2026年低空经济飞行器量子技术应用创新报告.docx
- 2026年农业智能农业智能育种创新报告.docx
- 河北省保定市莲池区保定市第一中学2025-2026学年高二下学期期中考试生物试题(含解析).docx
- 2026年智慧城市电子站牌充电创新报告.docx
- 河北省邯郸市平恩中学等校2025-2026学年八年级期中考试英语试题(含解析).docx
- 2026年供应链创新技术应用报告.docx
- 2026年体育智能赛事管理系统支付系统创新报告.docx
最近下载
- 12 海外用户玩微信PPT_HSK5标准教程上.pptx VIP
- 2024年四川省成都市武侯区中考二模考试物理试题(含答案).pdf VIP
- 2025~2026学年北京市西城外国语学校七年级下学期期中数学试卷【附答案】.pdf VIP
- 中国近视前期管理专家共识总结PPT.pptx VIP
- 医院运营助理培训.pptx VIP
- 2024湘教版七年级下册地理全册知识点提纲(背诵版).pdf VIP
- 2026届八省八校T8联考高三年级阶段练习英语试题(含答案解析).pdf VIP
- 11 闹钟的危害PPT_HSK5标准教程上.pptx VIP
- 普通高中信息技术学业水平合格性考试真题.doc VIP
- 延 安大学文学院中国现代文学课件 第十九章.ppt VIP
原创力文档

文档评论(0)