- 8
- 0
- 约5.93千字
- 约 8页
- 2018-08-01 发布于江苏
- 举报
根据词语采集问问,soso,腾讯空间,新浪微博等地程序
根据词语采集问问,soso,腾讯空间,新浪微博等的程序
采集文章不采集超级链接,采集问问的时候不采集百度百科和soso百科,比如 HYPERLINK /z/Search.e?sp=S%E4%BA%BA%E6%B0%91%E6%90%9C%E7%B4%A2%E6%98%AF%E4%BB%80%E4%B9%88ch=w.search.sb /z/Search.e?sp=S%E4%BA%BA%E6%B0%91%E6%90%9C%E7%B4%A2%E6%98%AF%E4%BB%80%E4%B9%88ch=w.search.sb 第一条是soso百科的内容,不采集。
举例说明:
导入到程序内10万关键词,如以下词语,
20级血精灵术士任务
27399一卡通充值q币
天津副教授
日本 拒绝 道歉赔偿
超级工厂病毒
地陷 频发
广西假疫苗
雪铁龙c zero
查根楼
火狐手机
恐怖分子手册
一淘网
刘德华父母
齐秦私生子
英超直播
人民搜索网
每个些词语分别使用soso,问问,腾讯空间搜索,新浪微博,搜狗搜索等(使用的搜索可以增加或减少,比如可能增加新浪爱问,阿里生意经等),以“2010年psp3000”价格这个词语为例。
SOSO-有10个结果页随意采集一个页面的内容,如采集第一个结果的内容,/z/q210253756.htm?
HYPERLINK /q?sc=webbs=20%BC%B6%
原创力文档

文档评论(0)