数图新服务研发关键技术.pptVIP

  • 1
  • 0
  • 约1.78千字
  • 约 30页
  • 2019-05-01 发布于湖北
  • 举报
* 数图新服务研发关键技术 技术与产品中心 北京万方数据股份有限公司 为啥要讲点技术? 关键技术领域 主要内容 文本数据库系统 自动标引、自动分类 交互式检索 以用户为中心的知识揭示 知识脉络分析 论文相似性检测(copy detection) 集群与分布式服务 相关技术规范与标准 文本数据库 文本数据库 存储对象: 文献等文本内容:期刊论文、学位论文、会议论文、专利…… 特点: 文本数据特有的结构关系:重复、层级 删改少,增加、检索操作(对应CRUD四个计算机操作) 海量数据的处理能力 B*树索引结构与算法 WFIRC 存储 XML格式 支持文本、数值、日期、货币等数据类型 索引 全文索引:权重、分词策略 整字段索引 稀疏值索引 检索表达式 CQL 检索结果自动聚类 检索结果文献的学科、期刊、时间等分布情况 秒级响应 WFIRC在知识服务平台的应用特色 多指标综合排序 相关度 标题、关键词、摘要、其他 文献质量 被引次数、核心刊、浏览次数、下载次数 文献新旧程度 论文发表时间 根据经验在知识服务平台推荐使用的三种排序方式 新论文优先 相关度优先 经典论文优先 WFIRC在知识服务平台的应用特色 检索结果聚类 查全查准的特色考虑 “和服”问题的处理 主要内容 文本数据库系统 自动标引、自动分类 交互式检索 以用户为中心的知识揭示 知识脉络分析 论文相似性检测(copy

文档评论(0)

1亿VIP精品文档

相关文档