最新工学博士学位论文 汉语句法歧义消解的统计方法研究 Research on.pptVIP

  • 2
  • 0
  • 约5.04千字
  • 约 26页
  • 2017-12-20 发布于湖北
  • 举报

最新工学博士学位论文 汉语句法歧义消解的统计方法研究 Research on.ppt

最新工学博士学位论文 汉语句法歧义消解的统计方法研究 Research on.ppt

系统概述 系统目标 基于内容的网络信息压缩及摘要自动生成系统(以下简称“系统”)的目标是结合计算语言学与人工智能的技术,开发一个基于内容的信息压缩系统,使之能高效、准确、精练地抽取出网络中的各种文本信息的主要内容,生成摘要,从而极大地加快计算机或人工获取与处理信息的速度。系统通过将语义、结构、统计方法等多知识源与当前的汉语自然语言处理的研究成果进行融合,并采用这一方法来开发一个汉语文本信息压缩与摘要自动生成系统,以基本达到实用化的商业系统对摘要的质量要求。 * 主要研究内容 知识库建设 开发适合于文本信息压缩系统的语义词典,通过人工总结,从大规模语料库中建立起信息压缩用知识库,手工建立文摘语料库。 统计语言模型的建立 建立一个语义量化模型,用以快速确定文本段落或语句的信息量以及各语言单元之间的语义关联度,为信息压缩提供重要线索。 基于内容的压缩算法研究 获取文章中心语义,确定语言单元之间的逻辑关系, 确立统计语言模型为基本文本单元进行加权的方法, 综合分析所得的多个知识源来决定组成不同类型文档的摘要候选单元。 采用文档分类模块来识别文档所属类别。 信息提取 针对不同类型文章的文摘组成方式有可能不同的特征,从文档的摘要基本单元候选中进一步确定文摘句的组成,从而提高文摘句间的内在逻辑连贯性。 摘要生成技术 在信息提取算法获得的文摘句基础上,结合人名识别与指代消解技术以

文档评论(0)

1亿VIP精品文档

相关文档