- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Web的中文新闻视频内容分析
庞宗强1封化民2邱鹗1宋国森1
’(燕山人学信息J:程学院,秦皇岛,066004)
2(北京电子科技学院信息安全与保密重点实验宅,北京100070)
摘要:本文提出了一种借助互联网信息对中文新闻视频进行内容分析的方法.其基本思想是:
首先对新闻视频进行故事单元分割,抽取故事单元的新闻脚本,然后从新闻脚本中提取新闻故
事的关键词,并通过模糊计算词语的相关度和词语与事件的相关度对搜索关键词进行优化,最
后利用搜索引擎从互联网上获得与新闻事件相关的网页,经过对网页的分析获得了新闻视频的
语义.为了能有效地从具有ASR(AutomaticSpeech
RecognitiOn)识别错误的视频脚本中提
取搜索关键词,本文提出了一种基于模糊思想的搜索关键词的提取方法。通过对TRECVID2005
内中文新闻视频一CCTV4一NEWS进行的实验表明该方法是有效的.
关键词:视频分割网页结构分析文本过滤模糊计算
1.引言
视频内容语义结构分析和视频内容检索是日前国际国内多媒体研究领域最为活跃和快
速发展的课题。微软rfl国研究院的祁甲等人综合视频、音频、义字埘新闻视频进行分析,?
提出了智能选择捅放器(intelligenthighlightplayer)和基于HTML的视频浏览器
(HTML.basedvideo
browser)[6]。然而,一般的ASR都有识别错误(尤其是人名和地名
等专有名’问),其结果也没有格式特征(例如标题、段落和标点符号‘等)。如果能克服脚奉
的这些缺点,将会大大提岛视频的分析质鼍。文[8]通过比较词的声爵相似度,将相关恻页
巾的关键词替换掉脚今lfl错误的关键词。随着恻络技术的发展.新闻网站的出现,视频中
的新闻故事通常会在刚上找到相同或相似的新闻嘲页。而新闻刚页的义本没有视频脚本中
的那些缺点。史有意义的是,新闻义本网页保存了大罩的额外信息,例如,已经被人们准
确的分类,有自己的标题,甚至还有相关链接、相关图片等。如果将网页和视频很好的联
系起来,网页信息将很好的帮助我们分析新闻视频。文[2]借助网络划新闻脚本进行扩展。
建立了针对BBC广播的海晕新闻系统(RichNews
system)。
我们多媒体实验室在新闻视频的结构分析和新闻嗍页分析方面做了大量的工作[1]
[3][4]。本文针对中文新闻视频,在对丰见频进行故事分割[3]的基础上,对于新闻视频脚
本中存在大帚语音识别错误的情况,利用模糊理论,提出了一种有效提取搜索关键词的方
法,并利用搜索引擎获得十|J关叫页.然后利用坐标树模利[4]抽取刚页的主体信息,最后埘
信息进行分析过滤,获得新闻视频的语义,克服,视频脚本的缺点。
奉义按照如F方式纠织,笫2节将新闻视频分割为故事单元,井获得新闻故事n勺脚奉。
资助项fl:嘲家自然科学摹会
联系作者:庞宗强.E·mail:zq—pang@besti.edu.cn
285
第3节从故事脚本中抽取关键词,并通过模糊计算词语之间地相关性对关键词进行优化,生
成搜索关键词。第4节利用搜索关键词搜索新闻故事的相关例页。第5节提取网页的主题内
容,并对其进行分析过滤。第6节是实验及结果分析,最后给出结论和未来工作展望。’
新闻故事单元脚本的提取
2.1新闻视频的故事单元分割
新闻视频的语义分析,一般需要将视频分割为故事单元,然后再分析每个故事的语义。
本文采用双层混合模型对新闻视频进行故事单元分割。整个分割过程在两个层次上进行,
底层(镜头层):利用决策树算法进行镜头的分类;高层(故事层):利用HMM(隐式马尔
可夫模型)进行新闻故事的分割。具体细节请参考文[1]。
2.2新闻故事的脚本提取
新闻故事单元分割后,对应每个故事单元,提取对应的脚本如图l。
故事3
稻黝
掷本3…….
图l视频故事脚本
您可能关注的文档
最近下载
- DL_T 267-2023 油浸式全密封卷铁心配电变压器使用技术条件.pdf VIP
- 一种新型的化纤打包机.pdf VIP
- 山东黄金集团招聘考试题库.pdf
- 贵州省黔西南州2024-2025学年七年级下学期期末语文试题(含答案).pdf VIP
- 环形混凝土电杆标准.pdf VIP
- 专项施工方案.docx VIP
- NB∕T 47018.4-2022 承压设备用焊接材料订货技术条件 第4部分:埋弧焊钢焊丝和焊剂.pdf
- 山西博大集团寿阳京鲁煤业有限责任公司兼并重组整合矿井地质报告.doc
- 贵州省黔西南州2024-2025学年七年级下学期期末考试语文试题(含答案).docx VIP
- 烟气脱硫废水处理系统培训课件.pptx VIP
文档评论(0)