支持云计算产品RIA模式页面数据抓取的模型与策略研究.pdfVIP

  • 2
  • 0
  • 约 71页
  • 2015-10-20 发布于安徽
  • 举报

支持云计算产品RIA模式页面数据抓取的模型与策略研究.pdf

支持IliA的云计算产品信息抓取系统研究 上,增加了用于存储和处理抓取规则的功能,重写了抓取算法,改善了调度 方法,实现了脚本解析、DOM操作和用户事件触发等机制。和传统网络爬虫 及现有支持Ajax抓取的系统不同,本模型和策略既不是一个通用的网络爬 虫,也不是一个针对个别网站的专用抓取系统,通过特定的事件触发和RIA 页面模型遍历算法,本模型和策略可以通过解析抓取规则,实现对用户可定 制产品参数的产品RIA页面进行抓取。本模型和策略与传统网络爬虫的主要 区别在于能对RIA页面中的脚本进行解析,并根据脚本执行结果操作页面 的区别在于,通过对抓取的目标页面重新建模,并采用不同的抓取算法和脚 本支持方法,实现模拟用户对RIA页面助用户事件的触发。 本文对支持从云计算产品RIA页面中抓取数据的抓取模型和策略的研 究,对于利用云计算产品信息,为企业和用户提供云计算决策支持有重要意 义,同时对获取可定制化产品的信息,对相关产品和行业进行分析也具有一 定的应用价值。 关键词: RIA云计算产品抓取 II 万方数据 支持RIA的云计算产品信息抓取系统研究 RESEARCHONCRA、轧INGMODELAND

文档评论(0)

1亿VIP精品文档

相关文档