基于上下文环境与句法分析蛋白质关系抽取.docVIP

  • 3
  • 0
  • 约1.32千字
  • 约 13页
  • 2017-08-06 发布于河南
  • 举报

基于上下文环境与句法分析蛋白质关系抽取.doc

基于上下文环境与句法分析蛋白质关系抽取

基于上下文环境和句法分析的蛋白质关系抽取 摘要:针对蛋白质交互作用关系(ppi)抽取方法中特征利用的片面性问题,提出了一种从上下文环境和句法结构中抽取特征的方法。该方法抽取词法特征、位置特征、距离特征、依存句法特征和深层句法特征等丰富特征构成特征集,并且使用支持向量机(svm)分类器进行ppi抽取。方法在5个公开的ppi语料上进行了评估。实验结果表明,丰富特征有效地利用了更为全面的信息,避免丢失重要特征的危险,得到了较好的ppi抽取性能。即在aimed语料上的实验取得了59.2%的f值和85.6%的曲线下面积(auc)值。 关键词:信息抽取;自然语言处理;蛋白质关系抽取;特征;支持向量机  tein interaction extraction based on contextual and syntactic features  wang jian*, ji ming.hui, lin hong.fei, yang zhi.hao school of computer science and technology, dalian university of technology, dalian liaoning 116024, china abstract: considering one-sidedness of features used in many

文档评论(0)

1亿VIP精品文档

相关文档