* * * * * * * * Implementation issues Web信息采集当前研究方向 基于整个Web的信息采集(Universal Web Crawling) 增量式Web信息采集 (Incremental Web Crawling ) 基于主题的Web信息采集(Focused Web Crawling ) 基于用户个性化的Web信息采集(Customized Web Crawling ) 基于Agent的信息采集(Agent Based Web Crawling ) 迁移的信息采集(Relocatable Web Crawling ) 基于元搜索的信息采集(Metasearch Web Crawling) 实际的采集器往往是几种采集技术的结合 * Chapter 10: Link Analysis Road map * Introduction Social network analysis PageRank HITS Summary PageRank * Sergey Brin 和 Lawrence Page于1998年提出PageRank算法 Google 采用的一种链接分析方法 仅通过权威性对网页排序,这样可以有校防止人为加工的页面欺骗搜索引擎。即由Web间的超链关系发现重要页面 应用于整个网络而不是围绕一个query结果主页的局部临近主页 PageR
您可能关注的文档
最近下载
- 海上深水港口码头工程施工组织设计.docx VIP
- 2026年入团积极分子培训结业考试题库及答案(共100题).docx VIP
- 2025届福建省厦门市思明区小学二年级上学期期中语文试题.docx
- 国家奖励办登记备案地社会力量设立科学技术奖项清单.doc VIP
- 北京理工大学超星尔雅学习通“会计学”《会计信息系统》网课试题附带答案.docx VIP
- 2023中国铁建股份有限公司所属单位笔试备考题库及答案解析.docx VIP
- 2026 年广西普通高等教育专升本考试(含高职升本)新大纲 医药卫生大类 专业基础综合课合卷 第 8 套模拟考试试卷(含答案解析).pdf VIP
- 第七章建设工程监理质量控制.pptx VIP
- 人教版数学五年级下册全册课件(2025年4月修订).ppt
- 道路改造工程施工方案.().doc VIP
原创力文档

文档评论(0)