网站更新及信息共享技术ppt - 中国农业信息网商务版---承办计划与内容.ppt

网站更新及信息共享技术ppt - 中国农业信息网商务版---承办计划与内容.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网站更新及信息共享技术ppt - 中国农业信息网商务版---承办计划与内容

网站更新及信息共享技术 背景 21世纪进入互联网信息时代,互联网存在大量有价值的信息。各类农业信息网站数量已经超过20000家,大量的农业信息网站有大量有价值的农业信息,往往由于网站受关注程度的不同,信息资源的传播并不理想。 有价值信息资源的采集和整理工作,是各个网站切实遇到的问题,这些收集和整理工作需要大量的人力和时间。由于地方农业信息网站的内容匮乏,更新的及时性问题,造成网站难以吸引眼球,网站的访问人群日益减少。 信息资源的重复建设,有价值的信息资源共享困难。 如何解决这些问题????? 网站更新的历史沿革 网站更新的历史沿革 最早期的网站采用的是静态网页的形式,更新网站内容需要专门的技术人员编制HTML页面并通过FTP等文件传输手段发送到WEB服务上,而且由于增加一条新闻,往往要改2-3个页面。经常出现更新错误。 随着技术发展,出现了ASP,JSP,PHP技术,动态更新网站内容。 由于搜索引擎的快速发展,网站被发现的需求尤为强烈,而ASP,JSP,PHP等动态页面被搜索引擎发现需要耗费的时间长,所以又推出了静态网页生成技术,便于搜索引擎快速收录。 网站需要定期的“改头换面”,增加用户的新鲜感,所以后来又出现了网站样式自主拍板,拖拽式拍板的网页框架定义技术。 这些技术的发展使得网站的应用日益广发,但是网站的核心内容永远不会改变,那就是“内容”。如何及时高效的完成网站信息资源的更新是一个重要的问题。 目前网站内容更新的方式 目前网站多数为动态网站,更多的采用的是人工更新的方式,人工更新有如下几个方面: 利用搜索引擎搜索相关信息,然后copy到网站上。 更多的是到几个固定的网站下载这些网站精品栏目的信息资源并更新到自己的网站上。 使用框架型信息采集工具,利用IFrame方式嵌套其他网站的栏目。 自有原创信息资源的添加。 报刊、杂志等其他媒体形式内容的录入。 原有更新方式存在的问题 人工更新需要占用大量人力和时间。 人工更新的及时性难以保证。 人工更新的效率低下。 iFrame方式由于嵌套别人的东西,页面风格与本站格格不入,而且下级页面会脱离本站。 框架型和非框架型信息采集的区别 框架型信息采集技术是针对于页面的采集,采集的过程中可以去掉一些脚本类编码。我们可以认为框架型信息采集技术就是将别人网站的整个页面抓了过来。 非框架型信息采集技术是针对于内容的采集,过程中去掉了网页所有的标签语言,信息内容的资源存储到本地数据库,保持和本网站的风格统一。 框架型信息采集技术优缺点 框架型信息采集技术是基于页面的信息采集 优点 操作简单,只需要知道目标网站目标栏目的URL地址就可以完成采集工作。 缺点 采集内容不可更改 展现风格难以定义 只能作为信息查看,无法做后续的数据加工整理 难以控制采集到的内容是否发布 非框架型信息采集技术优缺点 非框架型信息采集技术是针对于内容的信息采集 优点 采集的信息资源为具体内容,和手工添加基本相同。 采集的内容可以限制是否发布,并进行编辑。 采集的内容可以作为基础数据进行加工处理。 可以按本网站自己的风格展现信息资源。 缺点 采集任务的编写负责,需要具备一定的专业知识。 非结构型信息采集工具介绍 系统主要功能特点 目标网站目标栏目的自动采集 发布网站发布栏目的自动更新 采集信息资源的自动排版 支持同时采集多个目标网站多个目标栏目 支持同样的信息资源发布到多个发布网站 支持多个目标网站目标栏目采集到的信息发布到一个网站的一个栏目 强大的日志管理、统计功能。 解决非结构性信息采集技术难题 庄络网站栏目订阅发布系统为了解决非结构性信息采集技术需要专业技术人员进行操作的问题,专门开发了服务版,降低对使用用户的技术水平要求。 “服务版”系统的主要组成部分 庄络网站栏目订阅发布系统由3个子系统构成: 服务版特点 服务版的主要特点如下: 中心服务器负责采集和发布数据 独立的客户中心便于客户管理自己订阅的网站栏目 简单的接收系统便于用户定义网站内容发布。 用户完成基本配置后,无须人工干预即可完成网站信息更新。 由中心采集服务器端负责采集任务的编写和采集内容的分发,降低对客户技术水平的要求。 系统工作原理 管理子系统 管理子系统是系统的核心功能,主要有如下几个功能: 采集管理----采集管理主要实现将目标网站的目标栏目的信息资源抓取到本地。 订阅管理----订阅管理是将采集的信息资源公布,以便用户选择订阅这些栏目的信息资源 发布管理----发布管理是将公布的信息资源按照发布规则自动的发送到接收端。 客户管理----客户管理除了维护客户信息外,最主要的是确定用户网站的栏目和发布的信息资源之间的关系。 用户管理----定义了操作该系统的不同使用者的不同权限。 个人设置----维护个人信息资料。 公告管理----发布对外的

文档评论(0)

3471161553 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档