- 10
- 0
- 约1.04万字
- 约 19页
- 2018-08-31 发布于福建
- 举报
基于隐含狄列克雷分配分类特征扩展微博广告过滤方法
基于隐含狄列克雷分配分类特征扩展微博广告过滤方法
摘要:传统的微博广告过滤方法忽略了微博广告文本的数据稀疏性、语义信息和广告背景领域特征等因素的影响。针对这些问题,提出一种基于隐含狄列克雷分配(LDA)分类特征扩展的广告过滤方法。首先,将微博分为正常微博和广告型微博,并分别构建LDA主题模型预测短文本对应的主题分布,将主题中的词作为特征扩展的基础;其次,在特征扩展时结合文本类别信息提取背景领域特征,以降低其对文本分类的影响;最后,将扩展后的特征向量作为分类器的输入,根据支持向量机(SVM)的分类结果过滤广告。实验结果表明,与现有的仅基于短文本分类的过滤方法相比,其准确率平均提升4个百分点。因此,该方法能有效扩展文本特征,并降低背景领域特征的影响,更适用于数据量较大的微博广告过滤。
关键词:广告过滤;隐含狄列克雷分配;短文本分类;支持向量机;特征扩展
中图分类号:TP181
文献标志码:A
0引言
当前,微博作为一种新的传播载体,允许任何人用电脑、手机等方式在任何时间发布任何言论,且这些言论能迅速传播给互联网所能触及的任何人[1]。微博这种实时且传播迅速的特点,使其蕴含了巨大的商业价值,越来越多的微博用户通过自己的账户发布商品等广告信息。逐渐增多的微博广告不仅影响用户体验,还对微博平台上的舆情分析等研究产生不利影响。该现象依靠现有的微博平台提供的
您可能关注的文档
- 基于银杏叶模板聚合物仿生表面制备与浸润性研究.doc
- 基于银行内部控制对操作风险防范影响分析.doc
- 基于银行特征货币政策银行风险承担研究.doc
- 基于银行自助渠道银电联网系统设计与实现.doc
- 基于银行特殊性股权结构与公司价值关系研究.doc
- 基于银行视角客户存款安全问题简析.doc
- 基于链式中介模型新生代员工人际公平与敬业度分析.doc
- 基于银行计算机储蓄系统设计与实现.doc
- 基于链接Web网页分类.doc
- 基于链接结构理论句群结构类型分析.doc
- 互换性与测量技术 第2版 课件 2.4 大尺寸孔轴公差与配合.pptx
- 互换性与测量技术 第2版 课件 7.1 尺寸链的基本概念.pptx
- 互换性与测量技术 第2版 课件 7.4 用极值法计算尺寸链-实例.pptx
- 体育产业概论 课件 第1--7章 导论、体育产业资源 ---体育旅游业.pptx
- 体育旅游(第二版)课件 第二章 体育旅游资源.pptx
- 体育旅游(第二版)课件 第三章 体育旅游者.pptx
- 体育产业概论 课件全套 曹可强 第1--14章 导论、体育产业资源 ---体育产业政策.pptx
- 互换性与测量技术 第2版 课件 1.5 标准更新说明.pptx
- 体育旅游(第二版)课件 第四章 体育旅游市场.pptx
- 体育旅游(第二版)课件 第五章 体育旅游目的地.pptx
最近下载
- 2026中考语文必读名著《钢铁是怎样炼成的》中考真题训练(含答案).docx VIP
- 2023年江苏省淮安市中考道德与法治试题.pdf VIP
- 宣贯培训(2026年)《DLT 1245—2024水轮机调节系统并网运行技术导则》.pptx VIP
- 航空航天密封设计与密封件选用手册.docx VIP
- 2026人工智能与产业发展深度研究报告.docx
- 沉浸式数字艺术展览在提升公众审美体验中的应用研究_2026年2月.docx VIP
- 2026宁夏高校教师资格考试应知应会知识手册——高等教育学(200填空+65判断完整版).docx VIP
- 2025年上海教师招聘考试试题题库(附答案).docx
- 高压开关柜检修作业指导书.doc VIP
- 川崎病诊断和急性期治疗专家共识.pptx VIP
原创力文档

文档评论(0)