网络图像检索提问式特征研究.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络图像检索提问式特征研究

网络图像检索提问式特征研究   [摘要]为了解中文网络检索情境下图像检索需求表达方面的行为规律,设计用户图像搜索实验来采集网络图像检索过程中的提问式进行小规模实证研究,一方面获得图像检索提问式的构造和语言语法方面的一般特征;另一方面通过对高效图像检索过程中提问式的专门分析,揭示高效图像提问式的个性特征。最后结合研究结果讨论提出图像检索需求表达规律和图像检索策略。   [关键词]图像检索检索需求提问式 用户   [分类号]G354   1 引言   读图时代,网络图像资源海量递增,图像检索需求空前旺盛。为了更好地开展网络图像检索服务,对用户图像检索需求表达行为以及与检索系统交互行为的研究已成为必要,而图像检索提问式则是一个恰当的研究切入点。当前有一些围绕图像检索提问式的实证研究,在图像检索提问式的一般语言特征、提问要素组成以及修饰行为等方面得出了一些有价值的结论,参见笔者前期的相关研究。但是,对基于中文的图像检索提问式的特征还了解甚少,国内还没有开展相关研究。基于此,为了解真实情境中的图像检索需求表达和演进,本文设计了网络图像检索的受控用户实验来采集用户进行图像搜索任务时的检索提问式及其变化序列,围绕图像检索中提问式特征进行小规模实证研究。   本次用户实验于2010年4月进行,随机选择了某大学的若干个大学生为起点,通过他们发展各自的同学或老乡,最终征集了30名日常生活中有网络图像搜索体验的大学生被试,其专业分布广泛,男女皆有,基本符合实验要求。笔者基于某大学的网络实验室环境,布置了三个不同类型的网络图像检索任务,要求被试尽快而准确地完成任务,不限定每个搜索任务时间,搜索过程利用屏幕录像专家全程录制成视频。实验开始前,对被试进行了10分钟的关于视频软件使用的培训;我们帮助并确保每个被试正确设置了相应技术参数和保存路径;清空IE浏览器的历史记录和收藏夹,以避免受前一位搜索者行为的影响;实验结束后,对被试进行了问卷调查和访谈。在数据分析阶段,人工对视频样本逐个进行内容分析,按时间点序列采集其中所有提问式,共采集被试在完成不同图像搜索任务过程中的图像提问式648个,作为提问式分析的样本。很多被试在构造图像提问式时,利用了图像搜索引擎提供的相关搜索或输入提示词功能;这些智能化输入词汇,正是由一个汇集用户群体智慧的图像搜索的历史词汇的语义网络所提供,能够反映真实用户群体的提问式构造特征。因此,无论是被试自行构造,还是在搜索引擎系统引导下生成图像提问式,都成为用户图像提问式构造的研究样本。   2 图像检索提问式的构造特征   借鉴赖茂生、屈鹏等人“网络用户搜索中语言使用行为的实验研究”的相关研究思路,从三个方面考察图像检索提问式的构造:①构造依据,指选择哪些图像需求描述要素来表达图像检索需求;②构造目的,即检索提问式是否明确,考察用户的图像检索需求和检索目标的清晰程度;③构造途径,指提问式是通过何种方式生成的,如自行构造、高级搜索生成、相关搜索生成等不同途径。   2.1 提问式构造的依据   根据Jrgensen和Cunningham等对图像描述要素的划分,本研究考察6类基本要素在图像提问式构造中的运用情况,即:图像元数据(metadata)、图像内容(content)、图像风格形式(genre/style)、视觉特征、图像抽象概念、情感。其中,图像元数据参照艺术品描述类目CDWA(categories for the description of works of art)的核心元素,重点考察其中4个子项,即大小、技术、主题、来源;图像内容分为对象、情节、关系、地点、时间5个子项;视觉特征分为颜色、形状、纹理3个子项。   实验中,6类基本要素在图像提问式中的出现频率分布情况统计。648个提问式中统计到的要素出现频次为1092次,平均每个提问式中包含约1.7个要素(169.5%),这表明用户在构造图像检索提问式时,倾向于组合多个要素来表达,例如:“夜晚的月亮”,包括时间和内容两个描述要素;“矢量图运动排球”中包括技术、事件情节和对象三个要素。具体地,43%的提问式基于单一要素;57%的提问式包含2个以上的图像描述要素。   就要素分布而言,图像内容要素在图像需求表达时占绝对优势地位,平均每个提问式中至少包含1个图像内容要素(108.0%),亦即用户在表达图像需求时一定会涉及图像所包含的对象、事件情节、地点等要素;24.4%的图像提问式中会包含图像元数据;17.9%的提问式中会包含有抽象概念;13.9%的图像查询请求会针对图像形式/类型提出具体要求;用户更多地就高层语义开始检索提问,图像低层特征运用并不多。各种要素子类出现的频率分布。   首先,用户在描述图像检索需求时,优先选择的要素依次是对象、事件情节、抽

文档评论(0)

fangsheke66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档