- 14
- 0
- 约3.61千字
- 约 9页
- 2018-08-29 发布于福建
- 举报
基于单字提示特征中文命名实体识别快速算法
基于单字提示特征中文命名实体识别快速算法
摘要:近年来条件随机场(CRF)模型在自然语言处理中的应用越来越广泛。标准的线性链(Linear-chain)模型一般采用L-BFGS参数估计方法,收敛速度慢。本文在分析模型复杂度的基础上提出了一种改进的快速CRP算法。该算法通过引入小规模单字特征降低特征的规模,并通过在推理过程中引入任务相关的人工知识压缩Viterbi和Baum-Welch格搜索空间,提高了训练的速度。在中文863命名实体识别评测语料和SIGHAN06语料集上进行的实验表明,该算法在不影响中文命名实体识别精度的同时,有效地降低了模型的训练代价。
关键词:计算机应用;中文信息处理;中文命名实体识别;条件随机场;自然语言处理;机器学习
中图分类号:TP391.1
文献标识码:A
1 引言
命名实体识别是确定文档中的人名、地名和机构名等名词短语的过程。它是信息抽取、问答系统、机器翻译、文档摘要、跨语言检索等自然语言处理应用的关键技术之一。与其他语言相比,中文缺乏词间分隔与大小写等语法特征,其他语言中常用的表层局部环境信息往往不足以完成中文命名实体识别的任务。因而中文命名实体识别更为困难。
在早期基于规则的中文命名实体识别系统中,特征融合自由,各种方面的信息以规则的形式引入。众所周知,规则系统的缺点是工程量大,移植困难,
您可能关注的文档
- 基于协作学习理论二外教学研究.doc
- 基于协作学习研究型网络课程设计与开发.doc
- 基于协作机制变电站土建施工与电气安装思路分析.doc
- 基于协作微课资源共享平台关键技术研究.doc
- 基于协作知识建构模式网络课程设计.doc
- 基于协作知识建构专业英语网络课程设计理念.doc
- 基于协作网络协议异常检测算法.doc
- 基于协同Agent个性化智能服务系统研究与设计.doc
- 基于协同价值创造国有资本投资公司兼并重组研究.doc
- 基于协同决策多航站楼停机位实时分配算法.doc
- 4.4 控制系统的设计与实施(教学设计)高中通用技术苏教版2019必修2.docx
- 2026届衡水市第十三中学高三第一次质量调研(一模)数学试题.doc
- 3.1.1关系数据结构及关系代数教学设计-浙教版高中信息技术选修三.docx
- 高考化学二轮复习 阿伏伽德罗常数.docx
- 运筹学期末复习完全手册(直接使用版).docx
- 人工肝治疗中的家属支持与护理.pptx
- 人工肝治疗后的康复护理.pptx
- 4 自由落体运动(表格式教学设计)高中物理人教版2019必修第一册.docx
- 第05讲 充分条件、必要条件、充要条件(八大题型)新高一数学(苏教版2019必修第一册).docx
- 29 古代诗歌文本比较鉴赏题(比较形象、语言、表达技巧、情感态度)高考语文二轮复习专题.docx
最近下载
- 心脏起搏器植入指征(2025版).pptx
- 2025年中考数学第三次模拟考试数学(盐城卷)含答案或解析.pdf VIP
- (2024版)肥胖患者长期体重管理及药物临床应用指南.docx VIP
- 一种改善带壳溏心蛋蛋黄绿变的实验方法.pdf VIP
- [城市轨道交通概论(第2版)][赵矿英]电子教案.ppt VIP
- 河北图集 12D9 室外电缆工程.docx
- 盐城市2023年中考:《数学》考试真题与参考答案.docx VIP
- 2026年武汉四调试卷及答案历史.doc VIP
- YD-T 1092-2004通信电缆-无线通信用502泡沫 聚乙烯绝缘皱纹铜管外导体射频同轴电缆.pdf VIP
- YD-T 1319-2013 通信电缆 无线通信用50Ω泡沫聚烯烃绝缘编织外导体射频同轴电缆.pdf VIP
原创力文档

文档评论(0)