- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抓取网页数据工具json提取示例
使用过最新版火车采集器V9的朋友应该都发现V9新增了json提取的功能,但是许多使用抓取网页数据工具的朋友在操作此功能的时候都会觉得有点弄不明白,这里特意为大家整理了json提取的教程示例,感兴趣的朋友可以仔细研究一下。
首先大家需要明白JSON 是有两种结构,简单的说json就是javascript中的对象和数组,所以这两种结构就是对象和数组两种,通过这两种结构可以表示各种复杂的结构。下面具体说明一下
1、对象:对象在js中表示为“{}”括起来的内容,数据结构为 {key:value,key:value,...}的键值对的结构,在面向对象的语言中,key为对象的属性,value为属性值,所以很容易理解,取值方法为对象key 获取属性值value,这个属性值的类型可以是数字、字符串、数组、对象几种。
2、数组:数组在js中是中括号“[]”括起来的内容,数据结构为[java,javascript,vb,...],取值方式和所有语言中一样,使用索引获取,字段值的类型可以是 数字、字符串、数组、对象几种。
经过对象、数组2种结构就可以组合成复杂的数据结构了。如下:
{ name: 中国, province: [{ name: 黑龙江, cities: { city: [哈尔滨, 大庆] } }, { name: 广东, cities: { city: [广州, 深圳, 珠海] } }, { name: 台湾, cities: { city: [台北, 高雄] } }, { name: 新疆, cities: { city: [乌鲁木齐] } }] }
我们可以借助工具 HYPERLINK /codeformat/json \o /codeformat/json /codeformat/json 测试是否是JSON,格式化后如图:
下面举例说明JSON提取的2种方式:
1、JSON数据源:URL网址
如我们需要对JSON网址 HYPERLINK /dealer/LoadDealerPrice.ashx?_callback=LoadDealerPricetype=1seriesid=3170city=340100 \o /dealer/LoadDealerPrice.ashx?_callback=LoadDealerPricetype=1seriesid=3170city=340100 /dealer/LoadDealerPrice.ashx?_callback=LoadDealerPricetype=1seriesid=3170city=340100 做采集
分析得出:此URL的整个源代码是个完整的JSON。 ???以JSON数据源选择 URL网址然后勾选循环匹配,就可以采集到整个JSON里的数据。
如图:
2、JSON数据源:JSON文本: 另外一种情况,网址里的源码不全是JSON,而只是一部分代码是JSON形式,此时我们需要提取出这段JSON文本,然后再格式化。例如网址 HYPERLINK /config/series/3170.html \o /config/series/3170.html /config/series/3170.html
所以我们需要通过多页的形式,来获取本页地址里这部分JSON代码,然后再设置JSON表达式。
如图
按照上面的步骤,两种JSON提取就完成了,广大用户朋友们是不是觉得简单又好用,所以抓取网页数据工具首选火车采集器V9,功能全面且易用,新手朋友们多多联系,一定能快速上手,如还有疑问或其他问题请随时联系官方客服为您解答哦!
您可能关注的文档
最近下载
- ICD-10消化系统疾病分类解析.pptx VIP
- 13G322-1~4钢筋混凝土过梁(2013年合订本).docx VIP
- 高考数学模拟卷.pdf VIP
- 数学人教版六年级下册《图形的认识与测量(一)》教学设计.doc VIP
- 钢结构工程施工质量控制ppt培训.pptx VIP
- 常州星河灯具报价清单.xls VIP
- 截止阀安装使用说明书-ArmstrongInternational.PDF VIP
- 人教版小学英语PEP五年级上册英译汉课文翻译(三起点).docx VIP
- 小升初暑假讲义17 《西游记》1 (教师版).doc VIP
- 2025年党员领导干部学习《党政机关厉行节约反对浪费条例》研讨会交流发言1.docx VIP
文档评论(0)