网络搜索引擎原理Introduction技术方案.ppt

* /coolbaby/archive/2005/09/22/486990.aspx /html/sousuoyinqingjishuyuxinwen/2004/1201/1357.html /zhanghefu/archive/2007/03/25/1540495.aspx * 网络搜索引擎原理 信息与通信工程工程学院 陈光 源于信息检索(Information Retrieval) 解决网络海量非结构化 超文本数据的高效检索问题 核心矛盾: 数据全面性/可用性 vs. 效率/性能 网络搜索——概念 信息集合 (结构化/半结构化/非结构化) 需求集合 匹配 选择 结构化数据 如 Oracle、Lotus Notes 以及符合 ODBC 标准的内容,具有表、字段等结构化特性 半结构化数据 XML等,具有非统一的标记 非结构化数据 通常指自由文本,以及诸如语音和视频的富媒体内容 结构化、半结构化、非结构化数据 Unstructured (text) vs. structured (database) 结构化、非结构化数据 Information Retrieval Information Retrieval (IR) is finding material (usually documents) of an unstructured nature (usually text) t

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档