[计算机资料]李德毅院士:云计算.ppt

[计算机资料]李德毅院士:云计算.ppt

网络计算:蜘蛛在网页上爬行 Spider是基于Web的程序, 它通过请求站点上的 HTML 文档访问某一站点, 不断从一个站点移到另一个站点, 自动建立索引,加入到网页数据库中。 Spider 进入某个超文本时, 利用HTML 语言的标记结构来搜索信 息及获取指向其他超文本的 URL 地址,无需用户干预, 实现网络上的自动爬行和搜索。 Spider 每遇到一个新文档, 都要搜索它上面的链接。搜索策略以深度优先搜索为例, 它沿着一条选中 的链接向下搜寻, 顺着一级级链接查询到不再含链 接的Web 页面, 再沿原路返回出发点, 选择下一个 链接继续搜索,遍历 Web 空间。 网络计算:蜘蛛在网页上爬行 Spider 将每次搜索的结果( 文档名称、URL、 概述、链接等信息) 存放在 网页数据库中,所显示的结果就是从这 些数据库中调出来的。 像MetaCrawler 这样的Meta 搜索网站, 使用机器人去浏览其他机器人的搜索结 果, 将几个搜索站点的查询结果重新 组合起来形成新的列表。 大众参与的计算(Wikipedia) 维基百科利用大众来集体创作百科条目,是通过社会评注形成群体智能的典型应用。 在维基模式中,任何用户都可以对自己感兴趣的条目进行编辑。 编辑是完全自由的,用户可参与到任意的条目中贡献任何的看法。 尽管每个人在条目编辑中可能会出现错误,甚至恶意篡改,但是在大众参与的情

文档评论(0)

1亿VIP精品文档

相关文档