巴川-数据科学在竞技世界的应用.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据科学在竞技世界的应用 ——多模态数据分析及应用 竞技世界 / 巴川 巴川 l竞技世界首席数据科学家 ; l北航软院兼职硕导 ; l西安交大研究生院授课专家 ; lCCF TF数据科学SIG主席 ; l中国教育创新校企联盟专家委员会副主任 ; l中国国际 “互联网+” 创新创业大赛专家评 委 ;CCF科技创业秀等多个双创大赛评委 ; l曾就职于中国搜索、搜狐畅游等互联网公司 从事数据挖掘、人工智能、知识图谱 ,风控体 系、推荐系统、数据可视化相关工作 ; l多个技术峰会演讲嘉宾及出品人。 l多所高校兼职教师及创新创业导师。 1.多模态数据介绍 2.文本数据的分析及应用 3.多模态数据分析及应用 4.能力复用与思考 多模态数据介绍 浅谈多模态数据——跨越感知界限的数据探索 ➸ 多模态数据的定义 指包含多种感知模式 (如图像、文本、声音等)的数据集合 在多模态数据中,不同感知模式之间存在交互和关联,提供了丰富的信息来源 例如: 一张照片可以同时包含图像和文本的信息,通过分析图像中的视觉特征以及图像上的文字描述 一段视频可以同时包含图像、声音和文本等多种感知模式 ➸ 多模态数据的研究意义 1. 改善任务效果与性能 整合和融合不同感知模式的信息,可以提供更多的数据维度来支持机器学习、计算机视觉、自然语言处理等任务,并提高其性能 2. 拓宽数据研究的边界 多模态数据的研究可以帮助克服单一模态数据的局限性,突破传统的边界,引入更复杂、多样的数据特征和信息 3. 提供更全面且准确的信息 通过同时利用文本、图像、声音等多种模态,可以获取更丰富的上下文信息,从而改善对数据的理解和处理,挖掘出更精准、有价值的信息 文本数据的分析与应用 文本数据分析的背景——基于电竞业务的文本分析 ➸ 电竞业务说明 电竞赛事在各大直播短视频媒体平台上进行多渠道分发,KOL赛 事转播,需要及时了解用户在共振场地 (直播间、短视频、社群) 中的问题反馈,需对文本内容进行分析 ➸ 文本数据分析 对文本数据进行处理、挖掘和分析的过程 旨在从海量文本中提取有用信息、发在潜在模式和规律 通过文本数据分析,可以从文本中获取有关主题、情感和实体等 方面的信息 文本数据分析的应用——关键词提取 应用案例 :共振项 目中弹幕关键词的词云展示 专有词加入到分词列表 分词 过滤停用词及特殊字符等 提取关键词 词频统计 绘制词云图 文本数据分析的应用——主题检测 应用案例 :抖音直播间内活跃用户的话题检测 冠军杯用户之间的距离存在特性 :数据较为分散 DBSCAN作为基于密度的算法 ,可以找到样本点的全部密集区域 分词 同义词替换 去除停用词 相似度计算 TF-IDF向量化 聚类 可视化 数据解读 ➤ 结果说明 : 1、除明星战队以外 ,核心用户对黑马战队 (山西清徐学栋等 )的关注度也较高 ,因此 ,除了为明星战 队及选手投入主要营运资源以外 ,次级资源的投入可重点向黑马战队 (如海南四海 )及选手倾斜 ; 2、核心用户更多会在 “春天”、 “顺子”牌局出现时参与讨论 ,可针对此类牌局探索话题引导和活动 设计 (如 :加入竞猜题 目等 ),从而提高用户讨论度和活动参与率 ; 3、核心用户偏爱参与门槛低的运营活动 ,并且此类活动能够有效激发用户的评论欲望 ,所以后续的活 动设计需将参与门槛作为重点考虑因素。 文本数据分析的应用——信息摘要生成 应用案例 :热门短视频下用户评论的信息提取 ➤ 数据说明     本视频是对S5公开赛4强争夺战出结果后 ,在JJ斗地主官号发的视频内容 天津决战风云VS北京源莱慧 ,实力战队的较量 ➤ 基于TextRand算法 分词 去除

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档