- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
现代图书情报技术 版权所有欢迎下载引用
请注明引用地址基于条件随机场模型的复杂时间信息抽取研究 现代图书情报技术
总第 期 年 第 期
基于条件随机场模型的复杂时间信息抽取
研究
逯万辉 马建霞
中国科学院国家科学图书馆兰州分馆 兰州
中国科学院研究生院 北京
摘要 针对网络信息的时序性和多态性提出基于条件随机场模型的复杂时间信息抽取研究模型并通过实验
验证该模型的可行性选取词特征和词词性特征进行对比研究结果表明加入词性特征后召回率有明显提高
而准确率提升不明显并对这种现象进行分析
关键词 复杂时间信息抽取条件随机场特征选择
分类号
引言
互联网的快速发展使网络上的文本图像等多媒体信息成几何级增长并且随着时间的不断演化各种信息
也在逐渐地更新和进化如何快速高效地利用这些信息成为目前众多研究者关注的问题于是出现了时序文摘
话题检测与跟踪 舆情监控等研究而有关时序特性的识别和抽取又是这些研究中
的基础工作 时间表达式的识别与归一化处理是时序信息抽取应用的支撑是时序语义标注的基础 同时
时间信息作为一个事件的重要组成部分是信息抽取研究中一个比较重要的领域 有研究表明时间信息在文本
信息中所占的比重仅次于专有名词 作为文本语义理解语块分析等信息抽取中一项关键的技术解决时间信
息的抽取对机器翻译和人工智能领域的推进具有重大研究意义是一项重要的基础性的工作 因此本文通过
将时间信息进行分类比较基于统计方法和基于规则方法在时间信息抽取中的特点采用条件随机场模型对复杂
时间信息的抽取进行重点研究
收稿日期
收修改稿日期
本文系中国科学院西部之光联合学者项目基于计算情报方法的甘肃省战略新兴产业竞争发展研究 的研究成果之一
知识组织与知识管理
样性属性多样性无规则等特点基于规则的方法很
研究背景 难处理大规模复杂语料因此基于统计的方法的优势
比较明显本文采用基于模型的方法进行复杂时
时间信息抽取研究现状
间信息的抽取研究 将通过时间信息的分类研究引出
有关时间信息抽取的研究最早可追溯到 年
复杂时间信息的定义从而为实验研究提供理论基础
的 会议上该会议首次在命名实体识别中加入
时间信息的分类
了对时间评测的要求但是 只对绝对时间进行
从宏观上来分时间信息可分为显性时间信息和
了定义而且将绝对时间分为日期 时间段时间三
隐性时间信息 显性时间信息如 年 月 今
类 之后关于时间信息抽取的研究并没有随着
年夏天 等这一类时间信息可以很容易地被识别出
会议的停办而停止在其替代会议 评测中
来而隐性时
文档评论(0)