- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于前后文词形特征的生物医学文献句子边界识别 - 四川大学
第 27 卷 第 1 期 小 型 微 型 计 算 机 系 统 V o l27 N o. 1
2006 年 1 月 M IN I- M ICRO SYST EM S Jan. 2006
基于前后文词形特征的生物医学文献句子边界识别
1 2 1 1 1
于中华 , 张 容 , 唐常杰 , 左 , 张天庆
1( 四川大学 计算机学院, 四川 成都, 610065)
2( 四川大学 网络教育学院, 四川 成都, 610065)
: @ . . .
E m ail yuzhonghua cs scu edu cn
摘 要: 针对生物医学文献的特点及信息抽取的特殊要求, 提出了基于前后文词形特征和有教师学习的句子边界识别算法. 与
针对一般英语书面语设计的句子边界识别算法不同, 本文提出的算法不使用特殊的辅助词表和语法层面的特征信息, 只使用前
后文单词的词形信息作为句子边界识别和消歧的依据. 利用这些特征设计了最大信息熵识别器和支持向量机识别器, 并在
M edline 摘要上进行了实验, 达到了超过 99% 的正确率. 实验结果表明, 最大信息熵法和支持向量机法在句子边界消歧问题上
具有相近的性能, 同时还表明, 对生物医学文献句子边界识别, 只使用词法层面的特征, 不使用辅助词表和词性等语法层面的信
息, 仍可达到其它算法在一般英语书面语上利用辅助词表和词性信息所达到的性能.
关 键 词: 自然语言处理; 生物信息抽取; 句子边界识别; 机器学习
( )
中图分类号: T P 391 文献标识码: A 文 章 编 号: 2006
Sen tence Boundary D etection in B iom ed ica l Texts Using Con text M orpholog ica l Fea tures
1 2 1 1 1
, , , ,
YU Zhong hua ZHAN G Rong TAN G Chang jie ZUO J ie ZHAN G T ian qing
1(Comp u ter S cience S chool, S ichuan U niversity , Cheng d u 610065, Ch ina)
2( , , 610065, )
N etw ork E d ucation S chool S ichuan U niversity Cheng d u Ch ina
:
Abstract A sentence boundary detection algo rithm is p ropo sed fo r info rm ation extraction from biom edical texts acco rding to
characteristics of the texts and special requirem ents of info rm ation extraction. T he algo rit
您可能关注的文档
- 基于界壳理论的乡村旅游安全保障体系研究 - 农学学报.pdf
- 基于抗震性能目标的超限高层建筑结构抗震分析.pdf
- 基于景观活力评价的严寒城市公共空间设计研究 - 西部人居环境学刊.pdf
- 基于空间计量经济学模型的城市公共服务价值估计 - siqi zheng @ mit.pdf
- 基于可追溯体系的我国出口水产品供应链质量安全信息 - 安徽农业科学.pdf
- 基于拉曼组合放大的长距离光纤传输系统 - 物理学报.pdf
- 基于零售商服务质量提高的供应链双渠道协调机制 - 科技与管理.pdf
- 基于磷脂质类数据的早期卵巢癌特征提取研究 - 传感技术学报.pdf
- 基于流记录偏好度的多分类器融合流量识别模型traffic classification .pdf
- 基于流量特征的动态最小干扰流量工程选路算法 - journal of .pdf
- 基于钱学森综合集成思想的情报学理论研究论要 - 钱学森图书馆 - 上海 .pdf
- 基于情报研究流程缺陷分析的“理想化情报研究流程模型冶构建.pdf
- 基于全面预算管理的建设项目成本控制研究.pdf
- 基于全生命周期的汽车绿色回收体系研究! - 西南大学期刊社.pdf
- 基于全生命周期的数控机床轴承数据模型研究 - 中国机械工程.pdf
- 基于全生命周期的企业应急演练效果评估体系研究 - 工业技术创新.pdf
- 基于全生命周期理论的农业科学数据资源利用效果 - 中国科技资源导刊.pdf
- 基于全寿命周期成本的配电网蓄电池储能系统的优化配置 - 电网技术.pdf
- 基于全生命周期理论的严寒地区建筑低碳发展潜力初探 - 资源科学.pdf
- 基于全寿命周期成本理论的变电站经济性评价模型 - 机电工程.pdf
原创力文档


文档评论(0)