- 6
- 0
- 约3.05千字
- 约 20页
- 2019-05-22 发布于江苏
- 举报
开源智能-XPress 开源智能软件平台XPress 项目汇报 谢欣 2003年12月31日 目录 项目概述 系统 匹配算法 展望 项目概述 名称:“开源智能软件平台” ,Xpress 功能:对FTP资源分类整合,并附加从web上自动提取的的相关信息,为用户提供具有高可用性的WEB形式资源浏览、检索与下载服务。 特点:自动 商业经理:刘菲菲,软工 开发经理:谌贻容,语言所 档案经理:石武光,语言所 项目组长:谢 欣,网络 项目概述:商业计划回顾 本项目以宽带网络服务提供商为服务对象 协助其以低廉的价格对现有下载服务进行大规模扩充,快速提高其商业竞争力为目标。 2003年10月23日录音回放: 系统介绍 实际使用 :7001/XPress 系统结构图 系统重点一:web信息提取 信息提取简介 基于模板(我们的选择) 基于Ontology 基于规则 基于语法 系统重点二:FTP搜索 利用天网文件搜索的技术 爬虫 多线程并行抓取 每个站点一个线程 系统重点三:匹配算法 对每个FTP文件匹配所有的软件资源,找出匹配值最大的一项,当匹配值大于某个预定的权值时,我们就认为匹配成功 不是百分之百正确 为什么不用MD5 在现实实施中不可能 文件大小往往不同 增加匹配成功度:语言版本,版本号 算法的假设前提,对于同种资源,从web上得到的软件和FTP上的文件 在名称上具有一定的相似度 文件大
原创力文档

文档评论(0)