河南省政府门户网站内容格式规范(V1.0).docVIP

河南省政府门户网站内容格式规范(V1.0).doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
河南省政府门户网站内容格式规范(V1.0).doc

河南省政府门户网站内容格式规范(V1.0) 一、 制定背景 河南省政府门户网站的内容主要来源于省政府各部门和各省辖市政府。省政府门户网站整合各级子网站内容的手段主要是网上抓取、信息报送和网站链接等方式,其中网上抓取是省政府门户网站从各级子网站获取内容的主要方式之一。 网上抓取所面临的问题是,各级政府网站及省政府部门网站缺乏统一的内容格式,网站内容的变动缺少统一格式的索引,不利于采集工具自动抓取和分析,部分属性缺少或不易准确提取。为了更准确地采集和分析下属子网站的信息,需要规范网站的页面内容格式。各级政府网站及省政府部门网站按照统一要求经过规范化修改后,省政府门户网站可以通过内容整合系统准确地实现网上信息自动抓取。 二、 名词解释 网站内容整合:本规范所指的网站内容整合,仅限于对省政府门户网站发布的基本网页内容的抓取,不包含对各类网上办事、网上申报、数据查询等应用服务系统中数据内容的整合。 RSS标准:RSS(“Rich Site Summary”或“Really Simple Syndication”的首字母缩写)中文称作“简易信息聚合”,是站点用来和其他站点之间共享内容的一种简易方式,是一种用来分发和汇集网页内容的XML格式。 全网检索:省政府门户网站提供的全文检索功能,指系统能够检索省内各级政府网站及省政府部门网站的所有内容,并将各网站检索内容的结果统一合并处理后返回给查询用户。这样,用户得到的检索结果是全省各级政府网站及省政府部门网站检索结果的集合。 三、 制定目标   本规范围绕信息采集和网页分析功能,在保持现有网站建设模式、不增加信息通道的前提下,使符合规范的网站发布的网页内容可被省政府门户网站内容整合系统自动识别、采集,并实现网页属性信息和内容字段信息的自动引用,最大限度减少人工介入。 本规范配合省政府门户网站内容整合系统,实现以下目标: 及时发现并收集网站的信息变更情况,准确分析网页属性信息,准确定位内容信息,实现省政府门户网站与子网站之间内容的自动同步,实现政府网站群全网检索、RSS订阅等附加功能。 为了实现上述目标,本规范制定的规范条款包括四个方面,具体含义和作用说明如下: (一)内容字段信息规范:明确每一类信息内容必须包含的字段,以及各字段所定义的各项内容的书写规范,确保内容完整和格式统一。 (二)页面属性及内容字段标注规范:对信息内容按规定的字段进行标注,通过制定统一的格式规范,可以实现网页属性信息的准确提取,能将各字段下的信息准确定位到省政府门户网站对应网页页面的对应区域,并为分类检索打下基础。 (三)内容变更索引文件发布规范:用于标记网站单位时间内信息变更情况,通过对索引文件的分析,可以使内容整合系统程序判断哪些内容需要抓取,并获得这些内容的链接地址。 (四)检索系统规范:用于实现政府网站群联合检索,使各网站实现一套统一的检索接口,并返回统一格式要求的检索结果页面。 四、适用对象 本规范适用于河南省行政区域内各省辖市政府门户网站、省政府各部门网站发布的基本信息内容,河南省政府门户网站内容整合系统将全面支持本标准,实现对符合标准的政府网站的数据准确采集。 具体类别及内容界定如下: 政府领导:本级政府或本部门领导姓名、职务、分管工作、简历等; 政府机构:本部门机构名称、工作职能、办公地址、公开电话、网站网址等; 内设机构:本部门内设机构名称、职责、联系方式等; 法规文件:本级政府或本系统有关法律、法规、规章、规范性文件; 政务动态:本级政府或本系统的重要动态信息; 公告公示:本级政府或本部门公开发布的公告或公示信息; 人事任免:本级政府发布的人事任免信息; 办事指南:本级政府或本部门的行政许可审批项目、政务大厅及其他办事服务项目的办理指南; 网上服务:本级政府或本部门提供的网上服务系统信息; 主页信息: 本级政府或本部门提供的网站的主页(包括栏目主页)信息,给出网站名称、URL、地区、栏目等属性; 其他网页信息: 本级政府或本部门网站内不属于上列的其他内容页面信息,需要标注标题、日期、正文、来源、地区、网站、栏目等信息。 五、制定原理和原则 (一) 规范制定原理 本规范结合了RSS标准的基本规则和河南省政府门户网站信息内容的特性。实现本规范的基本方法是,在网页html中嵌入特定意义的标识信息,用于标注各项有意义的内容,嵌入的标识信息采用html的meta和特殊注释语句置标,在实现属性标注功能的同时,不影响网页的显示效果。 构成网页的html文件逻辑上可以分为内容(Content)和页面展示(Style)两部分。内容部分包括网页的标题、日期、正文、来源等数据元素,决定了网页所包含的信息;页面展示部分包括每个元素的位置、字体、大小、颜色等,决定了网页在浏览器中的显示效果。html文件能够将内

文档评论(0)

magui + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档