- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于模型组合训练机制的特定领域名词性实体识别
郭宏蕾 郭志立
IBM中国研究中心 北京 100085
E-mail:丈guohl.guozhilil@
摘 要:本文提出了一个模型组合训练机制,用于建立特定领域名词性实体识别模型.该组合训练机制采用基
于文本片段的语料库自动构建机制,从Web的搜索结果中挖掘所需要的领域数据,并充分利用已有的一般领域
名词性实体识别模型、标注语料库及自动新建的小规模的特定领域名词性实体标注语料库,极大地降低了训练成
本,为特定领域名词性实体识别模型的建立提供了一个简单易用的训练方法.
关键词:信息抽取,特定领域,名词性实体识别,语料库构造
ACombinationTrainingFrameworkforDomain-specific
NominalEntityRecognition
GuoHongLeiand GuoZhiLi
IBMChinaResearchLab,Beijing100085
E-mail:lguohl.guozhilil@
Abstract:Inthispaper,wepresentacombinationtrainingframeworkforbuildingadomain-specificnominalentiyt
recognitionmodel.Toreducethehugecostindomain-specificcorpuscollectionandtagging,thiscombinationtraining
rfameworkleveragestheexistingnominalentiyttaggedcorpusandnominalentiytrecognitionmodelbuiltingeneral
domain.Meanwhile,aweb-basedautomaticcorpusconstructionmechanismisappliedtocollectthedomain-specific
datarfomthesearchresultsontheweb.Experimentalresultsshowthatthiscombinationtrainingrfameworkcan
significantlyreducethetrainingcostinbuildingadomain-specificnominalentiytrecognitionmodel.Itprovides,an
ease-to-usewayforbuildingadomain-specificnominalentiytrecognitionmodelwithlesstimeandefforts.
Keywords:Informationextractionspecificdomain,nominalentiytrecognition,corpusbuilding
1 引言
名词性实体识别主要关注识别表述人、地点、组织的名词短语,是实体识别和跟踪应用
中的一个基本任务。机器学习方法因其易于训练和调整的特点在信息抽取、命名实体和名词
性实体识别研究领域倍受青睐。然而,当基于机器学习方法的名词性实体识别系统用于不同
.一七12-
于原训练领域的新领域时,其性能通常会有所下降。近年来,一些研究人员己开始研究自适
应的基于机器学习的特定领域实体识别系统1l〔(21
本文提出了一个构建特定领域名词性实体识别模型的组合训练机制,充分利用已有的一
般领域名词性实体识别模型,并采用基于文本片段的语料库自动收集方法,从Web上收集相关
领域名词性实体语料,极大地降低了特定领域名词性实体识别模型的训练成本。
2 面向特定领域名词性实体识别的组合训练机制
本文提出的特定领域名词性实体识别模型的组合训练机制包括两个部分:1)特定领域语
料库的自动收集和标注;2)模型组合训练 (见图1)o
图I特定领域名词性实体识别模型的组合训练机制
1)特定领域名词性实体标注语料库的自动构建
名词性实体标注语料库是特定领域名词性实体识别模型训练中的主要瓶颈。为了
您可能关注的文档
- CRRT间歇期肾功能恢复的预测.pdf
- CT在诊断腹部淋巴瘤中的应用进展.pdf
- 科技论文写作规范和技巧89984.ppt
- 可内化的人源抗Met基因工程抗体Fab的亲和力成熟与特性分析.pdf
- DCS和PLC在烟气脱硫中的应用探讨.pdf
- D-InSAR技术在长时间地面沉降中的应用研究.pdf
- EB病毒潜伏膜蛋白1基因C末端30bp缺失与非霍奇金淋巴瘤的关系.pdf
- 空间_雕塑_的心理学观照_胡潇.pdf
- 昆明市家兔艾美球虫卵囊的研究.pdf
- 扩增未知序列DNA片段的PCR技术研究进展.pdf
- 抑郁症与应激及中医肾的关系简说.pdf
- 易错PCR法定向进化D_海因酶的初步研究.pdf
- 基于企业社会责任理论的危机管理策略研究.pdf
- 荧光寿命测定的现代方法与应用33721.pdf
- 荧光原位杂交技术及其在植物染色体基因定位中的应用.pdf
- 基于三维重建的金属断口分析方法的研究Researchonthe.pdf
- 用RAPD技术检测野生鲫鱼的四个金鱼代表品种的基因组DNA多态性DetectionoftheGenomicDNAPoly.pdf
- 御金道:4月16日现货白银行情分析与支撑阻力.pdf
- 运动训练对大鼠出血性脑损伤BDNF基因及其蛋白表达的影响.pdf
- 载有荧光量子点的纳米磁性微粒的合成方法及其应用前景_贾秋凌.pdf
最近下载
- 特种作业与特种设备作业人员培训课件.pptx VIP
- 22G101 三维彩色立体图集.docx VIP
- DK-金检机说明书(20110823HJ)-2.doc VIP
- SHT 3178-2015- 加油站用埋地钢-玻璃纤维增强塑料双层油罐工程技术规范.pdf VIP
- 特种设备典型事故案例.ppt VIP
- 2025-2026学年鲁科版(五四学制)(三起)(2024)英语四年级上册教学计划及进度表.pdf VIP
- 机器人行业深度报告:行星滚柱丝杠——高精技术集成之作,人形机器人线性关节 -2024-.pdf VIP
- JEDEC JESD47L(中英文对照版).pdf VIP
- 9 天上有颗南仁东星 课件(共28张PPT) 2025-2026统编版八年级语文上册.pptx VIP
- 科普版英语五年级上册单词默写表.docx VIP
文档评论(0)