- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘 要
社交媒体的迅猛发展为用户提供了更为丰富的表达观点的方式,例如写评论、发表
情等,这些文本数据混杂着关注、点赞、转发等行为数据,对现有的观点挖掘方法提出
了挑战。考虑到社交媒体数据具有以下特性:(1)用户持有多粒度的观点;(2)用户感
兴趣的主题更大程度上影响用户的观点;(3)社交网络结构上有联系的用户之间可能共
享相同的观点;(4)用户的观点可能随时间变化,本文围绕基于结构和内容的层次观点
挖掘展开研究。论文的主要工作包括如下:
1)考虑到微博文本观点的多粒度特性,我们提出了基于概率图模型的层次观点挖
掘方法(HierarchicalOpinionPhase,HOP)。与传统的层次主题模型不同,HOP 假设对
于某一主题只持有支持或者反对立场,这样HOP 模型在根节点只有两个分支。同时为
了更好地表示观点,我们引入了短语(Phrase)的概念。为了进一步提高层次观点挖掘
的准确性,我们引入了哈希标签和情感词字典作为先验。HOP 模型在我们爬取的两个
分别关于“英国脱欧”和“美国大选”热点主题的微博数据集上实验,结果表明,HOP
能够准确地挖掘出层次观点,在文本级别的立场分类上也能取得了不错的性能。
2)考虑到用户的观点可能来源于文本的表达,也可能来源于其所在的好友群体,
我们提出了一种基于结构和内容的动态观点神经网络模型(Neural Opinion Dynamics,
NOD)。该模型将每个用户建模为一个递归神经网络(RNN),用以模拟用户的时序行
为,每个RNN 的输入为用户的微博文本,用户邻居的微博文本以及每条微博的主题,由
一个注意力机制概括这些特征,这一注意力机制反映了“用户对感兴趣的话题会投入更
多关注度”这一现象。模型在爬取的微博数据流上进行实验,每个时间段的数据被用于
预测下一个时间段的立场,结果表明,NOD 模型能够准确地预测用户关于某一主题的
立场。
关键词: 层次观点挖掘,概率图,神经网络,社交网络,动态模型
I
Abstract
TheadventofsocialmediaplatformssuchasTweethasprovideduserswithunprecedented
methodstoshowtheirpreferences. Alargeportionofusersmanifestthemselvesinchronolog-
ical behaviors, scilicet in following, commenting on or forwarding others’ texts. This poses
several new challenges to existing approaches in the field of opinion mining. Firstly, users’
opinions exhibit a hierarchical structure. Secondly, users are not necessarily influenced by all
thesurroundingcontexts,theytendtoignorethosemicroblogscontainingtopicsfallingoutside
of their interests. Thirdly, users gather together through social interactions instead of explicit
texts. Fourthly and lastly, users may update their opinions over time. These characteristics in-
spireustoexploreaunifiedarchitecturetotakeintoaccountmiscellaneousdataandusermodes
forclassifyinguser-leveltopic-dependentstances.
Since opinions expressed in text exhibit a hierarchical tree structure, we develop the Hi-
erarchical Opinion Phrase (HOP)
您可能关注的文档
- 基于脑电(EEG)的帕金森疾病早期诊断的研究.pdf
- 基于脑连接的丘脑功能分区研究.pdf
- 基于平台无关强化学习的自适应流媒体传输研究.pdf
- 基于区块链的供应链信任机制研究.pdf
- 基于区块链的身份认证系统的设计与实现.pdf
- 基于全景立体视觉的交通危险预警系统设计及算法研究.pdf
- 基于热像仪的手势识别研究.pdf
- 基于软件职责和结构的分层架构模式识别及重构.pdf
- 基于弱监督学习的癌症病理图像分割.pdf
- 基于砂型3D打印技术的铸造工艺设计方法研究.pdf
- 2025至2030中国移动治疗台行业发展研究与产业战略规划分析评估报告.docx
- 2025至2030链激酶行业细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030爆炸物探测扫描仪行业市场占有率及有效策略与实施路径评估报告.docx
- 2025至2030四川省智能制造行业细分市场及应用领域与趋势展望研究报告.docx
- 2026届高三二轮复习试题政治大单元突破练1生产资料所有制与分配制度含解析.docx
- 2026届高三二轮复习试题政治大单元突破练16哲学基本思想与辩证唯物论含解析.docx
- 2026届高三二轮复习试题政治大单元突破练2社会主义市场经济体制含解析.docx
- 浙江省衢州市五校联盟2025-2026学年高二上学期期中联考技术试题-高中信息技术含解析.docx
- 浙江省金丽衢十二校2026届高三上学期11月联考政治试题含解析.docx
- 2026届高三二轮复习试题政治大单元突破练7领导力量:中国共产党的领导含解析.docx
原创力文档


文档评论(0)