- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
总局政府网站信息采集接口标准规范.doc
附件6
总局政府网站信息采集接口标准规范
一、基本情况
按照总局有关工作要求,各省级局政府网站公开的信息需要在总局政府网站相应栏目及时发布。为简化信息报送流程,降低报送工作量,有效缩短信息发布时间,总局政府网站通过数据接口方式实现指定栏目信息的自动采集。如已抓取信息需要修改,或接口发生变化,请及时通知总局信息中心进行调整。
以下具体事宜请及时联系总局信息中心郭媛媛(010
二、信息采集工作过程
第一步:各省级局提供上报采集栏目地址,填写下表后发送至guoyy@。
采集栏目名称 医疗器械召回-地方 单位名称 栏目名称 栏目地址 “采集栏目名称”是总局定义的目标采集栏目,不需填写;“单位名称”请填写全称,如:浙江省食品药品监督管理局;“栏目名称”请填写省级局网站发布医疗器械召回信息的栏目名称;“栏目地址”请填写省级局网站对应栏目列表接口地址,如下所示:http://XXXX/QueryArtList?searchK=CL0004pageIndex=2pageSize=15startDate=2015-01-03endDate=2015-01-05
参数:
searchK: //栏目ID
pageIndex: //页码
pageSize: //每页记录数
startDate://开始日期,返回发布日期在此日期后的文章(包括该日期)
endDate://结束日期,返回发布日期在此日期前的文章(包括该日期)
注:栏目地址变更时,请及时通知总局政府网站运维部门。
第二步:按照列表返回JSON数据。
链接地址中的JSON格式
类型:json数组
[
{
id:数据记录唯一id(省级局系统自动生成)
siteName:站点名称如:浙江省食品药品监督管理局
title://文章标题
publishData://发布时间
code://文章详情地址
count: //不包括分页信息的文章总数,即指定栏目下,指定时间内的所有文章总数
},{
}
]
Json返回串例子:
{content:[{id:901604,title:浙江省药品GMP认证公告(2015第111号),count:10,publishData:2015-09-10,code:/directory/web/WS01/CL0005/901604.html,siteName:浙江省食品药品监督管理局},{id:901605,title:浙江省药品GMP认证公告(2015第110号),count:10,publishData:2015-09-08,code:/directory/web/WS01/CL0005/901605.html,siteName:浙江省食品药品监督管理局}]}
如果查询不出,或者其他错误请返回
{content:[]}
第三步:总局根据栏目列表到省级局网站采集信息分析入库待发布。
三、网页内容标识规范
(一)标识符
标识符 用途 应用页面 title辽宁省食品药品监督管理局关于收回药品GMP证书的通知辽食药监安发〔2016〕86号/title 文章标题标签,HTML通用标签 文章正文页 meta name=subsite content=国家食品药品监督管理总局/ 站点名称标签 文章正文页 meta name=author content=admin/ 文章作者标签 文章正文页 meta name=pubdate content=2016-08-31 00:00:01/ 发布时间标签 文章正文页 meta name=ContentStart/meta name=ContentEnd/ 文章正文起始结束标签 文章正文页 meta name=pageSize content=0/ 文章页数 文章正文页 注:标识符大小写和格式请和文档中保持一致。
(二)文章正文
如下图所示:
红色圈定区域为正文部分,页面源代码如下表,红色字体部分为上图红色圈定区域的代码,绿色字体为正文中添加的标签识别项,总局抓取系统将根据标签识别正文内容范围,案例网站地址为辽宁省局。/WS01/CL0885/163977.html。
HTMLHEADtitle辽宁省食品药品监督管理局关于收回药品GMP证书的通知辽食药监安发〔2016〕86号/title
meta name=subsite content=国家食品药品监督管理总局/
meta name=channel content=省局GMP认证16/
meta name=author content=admin/
meta name=pubdate content=2016-08-31 00:00:01/
meta name=pageSize content=0/
meta name=language
文档评论(0)