WWW图像义信息提取方法研究.pdfVIP

  • 4
  • 0
  • 约4.75万字
  • 约 47页
  • 2015-10-03 发布于贵州
  • 举报
WWW图像义信息提取方法研究

Www图像语义信息提取方法研究 摘要 针对Ff益增长的网络图像,本文研究了基于HTML文档的WWW图像语义信息 提取方法,在语义层次上实现了对图像的自动标注和分析。本项研究对基于内容 和语义的www图像检索具有重要意义。 HTML文档作为WWW图像的外部信息源和载体,蕴涵了丰富的描述图像内容 的文本信息。HTML文档中的图像名、图像注释、图像周围文本、图像URL、图像 所在网页URL及标题、图像超链接网页URL及标题等在一定程度上反映了图像的 关键内容和语义。为了从这些与图像相关的文本中提取图像的语义信息,本文根 据图像的视觉属性和语义属性提出了一种图像语义表征模型,并建立了相应的语 义词典,包括图像主题词分类词典、图像主体词分类词典、图像主体属性词典和 用来翻译汉语拼音、英文单词或缩写词的图像主题词对照词典。 根据图像的相关文本和语义词典提取图像语义信息的基本过程分为三步:(1) 利用图像主题词翻译词典,将图像相关文本中出现的汉语拼音、英文单词或缩写 词翻译成中文主题词;(2)将图像相关文本自动分词和词性标注;(3)利用图像语义 词典,采用基于规则与基于统计相结合的方法,从图像相关文本的分词标注字符 串中提取反映图像语义信息的主

文档评论(0)

1亿VIP精品文档

相关文档