- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
动易CMS2006采集管理教程
采集管理
采集系统可以直接深入到站点及其网页的所有内容,将网页中的有效数据采集出来(而不仅是网页或链接),并保持数据之间的逻辑关系。对一个新闻站点,它可以将每个新闻的标题、正文等信息单独采集出来,分别作为字段存储在系统中。
采集项目管理
单击左侧管理导航的“采集管理”,出现采集的管理项目:
·文章采集:用于采集设置好的采集项目。
·项目管理:用于建立、管理和复制采集项目。
·过滤管理:用于过滤采集中的标题和正文的字符。
·历史记录:已采集的记录历史,避免重复采集。
·导入|导出:用于共享迁移采集项目。
·定时设置 | 启动定时:用于设置定时采集
·区域采集管理:就是采集网站页面的某个固定区域,并将采集得来的区域代码保存为内联页提供给模板调用,刷新区域采集就可时时更新。
文章采集
1.单击后台左侧管理导航的“采集管理”-“文章采集”,出现“采集系统项目管理”界面:
参数说明:
·选择:选择您要采集的项目,可多选用于批量采集操作。
·状态:如果采集项目没有通过审核,则选择框的颜色为灰暗并不可选,其状态栏显示×。您要必须在“项目管理中”连续通过“采样测试”-“设置属性”这两步,才能通过审核。通过审核的采集项目状态栏显示√。
·上次采集:显示最新的采集日期。
黑色:表示上一次采集的时间。如:2005-5-8 14:45:44。
红色:表示当天采集的时间。如:2005-5-10 11:31:32(如果过了当天时间则会变成黑色)。
·文章采集选项:系统提供了三种采集的样式,包括
-不录入数据库,只测试采集功能是否正常
-采集过程中预览文章内容
-不采集本系统中已经存在相同标题的文章(网站文章超过2万篇以上,请慎用此项)
这几个是多选选项,您可以选择您自己想要的方式,如果都不选择那就是直接把采集的文章写入到数据库中。
·采集模式:提供“稳定采集”、“快速采集”、“链接采集”和“断点采集”四种模式。
-稳定采集:是针对一台服务器有多个动易系统时建议选此项,每采集一篇文章让服务器休息3秒。这样当一台服务器多个动易系统同时采集的时候服务器不受采集影响。
-快速采集:是针对用户拥有一台独立的服务器或配置非常好的服务器使用的采集模式。快速采集将发挥采集的最快速度,采集的效率最高。
-链接采集:就是只采集对方网站的链接,不采集正文。
-断点采集:就是为了采集过程中突然中断提供的一种采集模式,当您上一次采集的时候突然中断后,在您再一次打开采集的时候,断点采集按钮就从灰色不可用转变成为可用按钮,您只要单击按钮就可以从上一次采集断开那一点开始继续采集。减少系统再次检测的时间。
·历史记录:采集项目具有采集统计功能,显示该项目采集成功数和失败数,点击成功失败可看到具体的历史记录信息,并提供采集统计功能。
·采集选项:提供“测试采集”和“正文预览”两项,分别是来测试建立项目成功后是否有效。
·每页项目数:您可以下拉选择每页显示的页数,用于批量采集,比如一次采集20个项目或更多。
·开始采集:勾选了相应采集项目前的选择框,再单击本功能按钮,系统开始进行项目采集与测试。
项目管理
单击后台左侧管理导航的“采集管理”-“项目管理”,出现“采集系统项目管理”界面:
参数说明:
·管理导航:系统提供采集管理导航操作。
-管理首页:链接到采集系统项目管理首页。
-添加新项目:单击本功能链接添加新的采集项目。
·“操作”列功能链接说明:
-编辑:修改您指定的采集项目。
-测试:测试您的采集项目是否正确,如果显示采集的正文页证明成功,否则会提示您第几步错误。
-属性:设置您采集到的文章,放在那个频道中,那个栏目中,相对应的属性设置。
-复制:如果所采集网站的模板相同,可利用本功能复制多个项目,以提高采集效率。
如果导入采集项目后,就需要审核,是否是正确的采集项目,您必须点要审核项目的,
!采集项目只有通过测试和属性这连续两项后方可通过审核。测试:保证采集项目正确;属性:制定采集后的储存位置。
·操作按钮:系统提供将已选定的项目“批量删除”或“批量设置”二个操作按钮。
-批量删除:选择您要删除的采集项目(可多选),选择后单击“批量删除”按钮即可删除选定的采集项目。
-批量设置:选择您要设置的采集项目(可多选),选择后单击“批量设置”按钮,则可批量修改项目属性。
具体项目属性设置请参阅后章“项目管理”的“属性设置”。
采集的步骤
下面请认真阅读采集步骤说明,建立您要采集的项目。单击顶部的“添加新项目”功能链接,开始添加新的采集项目。
基本设置
“添加新项目--基本设置”的界面参数说明:
1.基本设置:
·管理导航:如果是编辑项目,可任意点击所属的项目链接。
·添加项目名称:填写自定义项目名称。
·网站名称:填写自定义网
您可能关注的文档
- 出口外贸操作的流程总结.docx
- 出口收汇核销的流程相关知识.doc
- 出口货物报关单扩大数据项应用的说明.doc
- 出口退税操作的流程.doc
- 出口退税和会计处理精要.doc
- 出口退税的操作细则.doc
- 出口销售证明要求和模板.doc
- 出料加工贸易进出口货物通关制度1.doc
- 出租屋暂住人员的管理作业程序.doc
- 出租车及专车之争成文.docx
- 2025年天津市冷链物流基地配套道路建设可行性研究报告.docx
- 2025年天津市母婴护理会所专业化服务升级路径可行性研究报告.docx
- 2025年成都市私立医院医美抗衰中心创建可行性研究报告.docx
- 2025年成都市淡化海水在城市道路清洗领域的应用可行性研究报告.docx
- 2025年上海市环卫厨余垃圾生物处理技术应用可行性研究报告.docx
- 2025年天津市花西子针对户外运动妆容的可行性.docx
- 2025年上海市生物发电于秸秆炭化还田协同发电的可行性研究.docx
- 2025年天津市物造纸在可降解农用地膜领域的应用可行性研究报告.docx
- 2025年天津市无人值守充电站智能运维可行性研究报告.docx
- 2025年天津市竹荪种植连作障碍防治技术可行性研究报告.docx
文档评论(0)