- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
批量下载数据库的方法
批量下载维普的方法
声明:以下的方法可能并不适用于所有的维普,如果不能下载,不要骂人!
1.首先你需要安装这个工具
URL捕获工具urlsnooper
作用:捕获要下载文件的实际地址
下载地址:/download/tool/urlsnooper.zip或者去迅雷里面搜索
然后运行,点击sniffer network,如图:
2.登录维普,输入你的检索关键词
比如说“美女”,然后随便下载一篇,如图
3.看看Urlsnooper都抓下什么内容了,看看,找到这个没有:
3/cstj/sear.dll?downcurpaper?pszno=13261flag=0type=2dzsj=1csid={4a465fb4-1ae6-483a-9141-57b261e3a456}
这个就是该篇的下载地址,不过还不是实际的地址,维普稍微做了一下处理
把这个地址拷贝到浏览器,看看怎么样:
获得地址如下:
succ13/DownPaper.dll?DownCurPaperCD=2007JY01Info=GIHKGDHDACAIHKHKHHHFBKHOAEBPAJAAACAGADGKFILE=000/01SpdfFileName=历史上真有美女貂蝉吗.pdf
是不是得到上面这个地址,注意http前面多出一个succ,由于增加了这个,就不能下载,所以我们只要把这个succ去掉,然后,就可以下载了,试试是不是?
13/DownPaper.dll?DownCurPaperCD=2007JY01Info=GIHKGDHDACAIHKHKHHHFBKHOAEBPAJAAACAGADGKFILE=000/01SpdfFileName=历史上真有美女貂蝉吗.pdf
注意:以你实际捕获的地址为准,如果直接用我这个地址,是不行的,因为我发现csid={4a465fb4-1ae6-483a-9141-57b261e3a456}这个参数,每次登录都不一样,而且有时间限制。
4.如何实现批量下载呢?(有点麻烦)
看看第3步,注意到这个没有pszno=13261,这个是文章的序号,你的任务就是找到你要下载文章的序号,然后,通过构造这个序号,我们就可以实现批量下载了。如果你找的文章序号是连续的,那就好办了。一般同一期杂志期刊的文章号是连续的。
下面的方法是把该篇文章后面的9篇文章一起下载下来:
(1)利用迅雷生成批量下载任务
(2)不过你会发现,被下载下来的都是sear.dll,其实这是个文本文件,你用记事本打开看看,是不是就是我们刚才看到的地址。每一个文件就是一篇文章的下载地址:
(3)我们把这些dll文件合并在一起,就可以得到批量下载列表:
你还需要一个文件合并工具:
文本文件合并工具FileJoin
作用:合并文本文件
下载地址:/down/FileJoin.exe
合并到一个文件里面比如:F:\DOWN.TXT,如小
这是,合并后的情况,如下,不过这个还不能直接导入下载,因为里面含有succ而且是连在一起的,没有分行,下载软件不能识别,所以还要稍微处理一下。
(4)生成最终下载列表:
把合并的文件(F:\DOWN.txt)用WORD打开,用换行符替换掉succ,如下:
注意用“人工换行符”,这里刚好巧妙的利用了这个succ,哈哈
处理完毕,保存。现在这个down.Txt就是批量下载列表了,可以直接导入软件下载,结果如下
?成功!
注意:
生成下载列表以后,最好马上下载,因为下次再打开时,这个csid={4a465fb4-1ae6-483a-9141-57b261e3a456}参数可能就失效了
关于pszno=13261文章序号的问题,我们常常要找的文章它的序号是不联系的。如果是这样的话,你要自己去找,对于有点维普入口我们可以通过urlsnooper直接获得文章的序号。对于有的入口就不行了
您可能关注的文档
最近下载
- 2022年新疆农业大学招聘事业编制人员考试真题及答案.docx VIP
- 广告创意学(湖南大学)中国大学MOOC 慕课 章节测验 期末考试客观题答案.docx VIP
- 中小学《探索三角形的面积计算公式》教学设计教育教学资料整理.docx VIP
- 武汉大学308护理综合历年部分考研真题汇编.pdf VIP
- 2023年新疆农业大学招聘事业编制工作人员31人笔试题库及答案解析.docx VIP
- 高三化学一轮复习 铁及其化合物 学案.doc VIP
- 个体工商户登记(备案)申请书.doc VIP
- 2024年新疆农业大学招聘事业编制人员考试真题.docx VIP
- 工业领域视觉大模型落地实践.pdf VIP
- TNAHIEM 121-2024 创伤中心建设与设备配置规范.docx VIP
文档评论(0)