网络信息资源的特点及其利用.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
在竞争情报中的应用 充分获取、开发和利用竞争对手和客户的信息 挖掘 Web日志纪录来发现用户访问 Web页面的模式 Web挖掘在反竞争情报子系统中的应用 构建智能网络竞争情报系统 在网络广告分析的应用 要想长期大量的拥有广告主的投资,利用数据挖掘技术为广告主提供细致周到的服务至关重要。 对于自建网站的企业、商家更可以利用数据挖掘技术灵活改变行销和生产策略 为网站提供服务创造了条件。 网络信息资源的形式评价 美观性 条理性 查检性 快捷性 稳定性 低耗性 易用性 网站评价要求 体现内容质量第一 要有科学性 注意客观评价与主观评价相结合 各指标之间互相补充 具有动态变化特征 网络信息的评价模式 排行榜模式 动态监测 市场调查 专家评估 定性与定量相结合 实例:WWW.alexa.com WWW.alexa.com创建于1996年4月,现在已经成长为最著名的网站评价Web站点 Alexa通过数百万Alexa工具栏用户分析网站的使用度来计算流量等级 这些信息经过匿名提交、详细审查、计算、储存最后提供在Alexa的服务中。 网络信息挖掘 Web mining 网络信息挖掘的含义 网络信息挖掘就是利用数据挖掘技术 自动地从网络文档以及服务信息中发现和抽取知识的过程。 从概念及相关因素的延伸比较上找出用户需要的深层次的信息 网络信息挖掘的类型 网络内容挖掘(Web content mining) 网络结构挖掘(Web structure mining) 网络用法挖掘(Web usage mining) Web挖掘的分类 Web 挖掘 Web结构挖掘 Web内容挖掘 Web使用记录 挖掘 Web页内容 挖掘 搜索结果挖掘 一般模式追踪 个人使用 模式追踪 网络结构挖掘 从网页等的结构和链接关系中发现知识。 由于网页文档之间的互连,Web能够提供除文档内容之外的链接信息 可对页面进行排序,发现重要的页面。 可用于网页归类,并且由此获得有关不同网页间相似度及关联度的信息。 网页链接挖掘分析的意义 链接是Web网页的普遍现象 只有通过与其他的网页及其本身内容的链接,网页才能相互交换信息,扩大使用价值。 网页的不同链接体现了不同的信息功能,具有不同的特征和规律。 网页链接挖掘分析的意义 分析和评价网页的质量 指导网络资源的组织建设 应用于网络资源检索和利用 有利于分析和掌握学科发展状况 有利于开发和应用智能超文本链接 Web链接机制分析的局限性 Web链接分析范围更广 链接载体类型多,包括文本、声音、图像、动画等; 链接的动态性强,网页变化大、常常处于不断的变化当中。 Web有些链接是为其它目的而创建的 网络信息的结构挖掘的应用 指导网页采集 帮助结果排序 检索结果聚类 查找相关网页 消除重复网页 识别社区 帮助资源自动分类 确定Web影响因子 基于链接挖掘的超文本优化 网站内链接的结构优化 网站外链接的结构优化 超文本链接的动态优化 超文本链接的数量优化 核心网站 核心网站是指某一网站所发表的有关专业信息量在其所发布的所有信息中占有极大的比例,而且有较高的学术及实用价值 从中可以反映该学科、专业主题领域的最高研究水平、最新研究成果和发展动态,而且具有较高的相对稳定性和专业人士访问率。 确定核心网站 将所有链接到样本网站的网址汇总统计,将这一组数据作为测定核心网站的依据。 将样本网站之间相互链接的次数作为网站被链接的次数。 将其他网站指向样本网站的数量作为网站被链接的频次。 计算网站的Web—IF 根据所获得数据从高到低进行排序,将出现频次最高的一组网站确定为核心网站。 网络信息的内容挖掘 从网上信息的数据内容或与之相连的信息数据库的内容中发现有关的知识 可以分为对文本文档挖掘和对多媒体文档的挖掘。 网络信息信息的多样性决定了内容挖掘任务的多样性,根据处理对象的不同而异。 Web内容的挖掘是对Web中包含的文本、图像、视频等数据元素进行挖掘。 文本挖掘 目前网上大多数的信息表现形式为文本 文本挖掘是从非结构化的文本中发现潜在的知识。 处理的对象主要是大量的、无结构的文本数据。 目的是从不同格式文本中发现有用知识。 文本挖掘的方法 文本的特征表示 文本特征抽取法 文本总结 文本分类 文本聚类 关联分析法 多媒体挖掘 把数据挖掘的基本理论和方法与对多媒体特性的分析结合起来 利用多媒体的时间、空间、视觉特性、视听对象、运动特性 挖掘出有价值的隐含的信息线索和知识 网络使用记录的挖掘 从 Web的访问记录中抽取具有意义的模式。 个性化的使用记录的追踪。 通过分析使用记录来了解用户访问模式和倾向,以改进站点的组织结构; 个性化的使用记录追踪分析个别用户的偏好,目的是根据不同用户的访

您可能关注的文档

文档评论(0)

benzei244572 + 关注
实名认证
内容提供者

建筑工程师持证人

没啥好说的额

领域认证该用户于2024年10月16日上传了建筑工程师

1亿VIP精品文档

相关文档