微博短文本预处理及学习研究综述.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
57 11 20 13 6 第 卷第 期 年 月 微博短文本预处理及学习研究综述* ■ 王连喜 [ ] , 摘 要 认 为 因短文本具有特征稀疏性和 高度 冗余性 微博短文本的预处理及 学 习方法研究 已经成 为微 , 。 , 博信息挖掘及应用 的关键 并在许 多方 面有着非常重要和广泛的应用 重点分析微博短 文本 的特性 并对微博 , 、 、 短文本的预处理和 学习方法及其应用现状进行 归纳和总结 包括短 文本特征表 示 短 文本特征拓展 与选择 短 、 。 , 文本分类与聚类学习 热点事件发 现及 自动 文摘等 最后 指 出相关研究 的局 限性 并对 未来的发展方 向进行 展望 。 [ ] 关键词 微博短文本 预处理 短文本 学习 热点事件发现 自动文摘 [ ]G354 TP393 分类号 , 1 引 言 出短文本内容之间的内在联系 从而帮助用户发现隐 藏在微博数据中的潜在规律或解决生活中的现实问 , 微博是近年兴起的一种信息交流媒体 相比于传 , 、 、 、 题 例如热点事件发现 意见领袖识别 网络内容监测 , , 统社会媒体 其发展态势相当之强劲 已逐渐成为人们 消极网络舆情检测等。 [1 - 2] 生活中不可缺少的一部分 。中国互联网络信息中 本文通过对近几年出现在国内外重要期刊和会议 (CNNIC) , 20 12 12 , 心 发布的数据显示 截至 年 月底 我 、 , 上的微博短文本研究成果进行连续跟踪 学习和梳理 3. 09 , 国微博用户数已达到 亿 网民中的微博用户比例 深入分析和归纳微博短文本预处理和学习及应用的研 54 . 7 % , 1 。 达到 用户每日发布博文数量已远超过 亿条 , 究现状 并对微博短文本研究目前存在的问题进行总 , 可见 微博平台上集聚着非常庞大的用户群体和海量 结,

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档