文献自动标引解决方案概述.doc

1 文献自动标引解决方案 2 1.1 方案概述 2 1.2 模块组成 2 1.2.1 文献自动标引模块 2 文本分类 2 主题词标引 3 自动文摘 4 1.3 性能指标 4 1.3.1 准确率和速度 4 1.3.2 扩展性与通用性 5 1.4 效果演示 5 2 智能词语技术 6 2.1 方案概述 6 2.2 模块组成 6 2.2.1 新词语识别 6 2.2.2 词语分类聚类 6 2.2.3 智能分词系统 7 2.3 效果演示 8 3 行业知识门户 8 3.1 方案概述 8 4 联系方式 9 文献自动标引解决方案 方案概述 基于自主研发的中文信息处理技术,以文本内容语义计算、文本内容自动标引为核心,“文献自动标引解决方案”集成文本分类、主题词标引和自动文摘三个子模块,将文献内容以精练准确的形式,如类目、主题词、摘要自动标引出来。 模块组成 文献自动标引模块 应用国际领先的文本挖掘、自然语言处理等核心技术,以自主研发的中文信息处理技术为基础,提供对海量数据进行智能自动分类、主题词自动标引、自动文摘等实用功能。以其为基础可方便地开发应用系统,快速地实现智能信息挖掘,有效地进行知识管理与检索。 文本分类 “基于关键短语的立体文本分类模型”: A、立足于影响文本分类最底层、最根本的因素:文本表示中的特征项,利用表义完整的关键短语,提高特征项的完整独立程度,有效克服了传统分类算法

文档评论(0)

1亿VIP精品文档

相关文档