- 3
- 0
- 约1.14千字
- 约 5页
- 2015-07-27 发布于安徽
- 举报
优秀毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!
互联网视听节目监管系统建设的思索
目簏箍 日羰‰ 终端终骊 铃’而终端 铃’ffii终端 铃’丽终端
服务器 服务器
图1某个视音频节目监管系统结构图
2.1研发适应互联网音视频节目监管工作的搜索引擎
目前的互联网音视频节目监控系统中的搜索引擎主要由爬虫系统、分析系统、索引系统、查询系统组
成,功能主要是对互联网上视听节目信息进行发现、解析、存储、索引、查询,甚至直接下载,最后用户
根据搜索引擎的搜索结果,在系统中方便的对互联网上的视音频节目进行监控。为了适应互联网音视频节
目的飞速发展,互联网音视频节目监控系统的搜索引擎应根据网络音视频网站的发展规律,并能适应统一
监管工作需要。具体来说应该具有如下几个特点。
(1)能够快速抓取大量音视频网站信息的爬虫系统。
互联网视听节目监管系统中爬虫的作用是为搜索引擎抓取大量的数据,其抓取的对象为互联网上的传
播视听节目的网页。爬虫程序的抓取方法都是顺着网页的链接关系进行爬行的。
由于现在视听网站的内容不断的在变化,因此爬虫也需不断的更新其抓取网页的内容,这就需要网络
爬虫按照一定的周期去扫描网站,查看哪些页面是需要更新的页面,哪些页面是新增页面,哪些页面是已
经过期的死链接。一般来说,在系统中网络爬虫在更新视听网站内容的得到的属性和上次抓取的属性相比
较,如果一样则不用更新。
近年来,爬虫获取信息的途径和效率以及智能语音图像分析技术比之前大为进步。互联网视听节目监
管系统要求系统中的爬虫尽可能多、尽可能快地给索引部分输送音视频网页,为系统的搜索引擎提供强大
的数据支持。
有些违规节目出现在各种论坛中,大多是网友自主上传,其中很多会采用回复可见和用户注册登入后
才可见的方式来提高点击率。互联网专家指出,深层网页中可访问信息容量是表层网页的几百倍,是互联
网上最大,发展最快的新型信息资源。因此对深层网页的搜索是一个非常重要的环节,在爬虫技术上有专
Web爬虫体系,爬行中会有一个独特的表单填写过程来模拟用户完成注册或是其他涉及表单的
门的Deep
动作。但是,网站的登入方式也在改进,最常见的是利用验证码的方式来防范恶意注册登入。我们在设计
监管系统的时候,要求系统能将这一类网站自动识别归类,提供给工作人员,由人工协助完成登入过程。
368
2012.4.2012中国数字广播电视与网络发展年会
您可能关注的文档
- 关于我国肉羊产业生产结构若干问题探讨.pdf
- 关于牙膏磨料现行标准探讨.pdf
- 关于一种铸钢件表面荧光磁粉探伤缺陷控制.pdf
- 关于语言经济学几个基本命题.pdf
- 关于预应力筋锚固区荷载传递试验--预应力锚固区安全探讨之二.pdf
- 关于粘合剂对牙膏膏体流变性能影响初探.pdf
- 关于长输管线信息管理系统建设探讨.pdf
- 关于招标投标过程中评分办法探索.pdf
- 关于浙江发展涡流纺技术调研与分析.pdf
- 关于直接利用工业熔渣显热异地生产岩棉有关问题探讨.pdf
- 2025年江西废旧轮胎资源化综合利用项目可行性研究报告.docx
- 2025年中国氢氟烯烃(HFOS)行业市场占有率及投资前景预测分析报告.docx
- 新高考历史课时05 两宋与辽夏金元的政治发展-高考历史一轮复习小题多维练(新高考版)(解析版).pdf
- 伤科骨愈汤联合交锁髓内钉内固定治疗胫腓骨骨折和肺部并发症的临床影响.docx
- 2025年中国除氟剂行业发展研究报告.docx
- 新高考历史课时24 欧洲的思想解放运动(解析版)-高考历史一轮复习小题多维练(新高考版).pdf
- 新高考历史课时03 从魏晋南北朝到五代十国的政权更迭-高考历史一轮复习小题多维练(新高考版)(原卷版).pdf
- 出世与人世之间的持守——《诗词五首》整合教学设计.docx
- 湖北科技学院《中国现当代文学性别文化专题研究》2023-2024学年第一学期期末试卷.doc
- 湖南省澧县2024-2025学年物理八上期末学业水平测试试题含解析.doc
原创力文档

文档评论(0)