第四章初步业务活动——文本分析
目录
CONTENT
第一节文本分析基础
第二节实战演练——初步业务活动之舆情分析
第一节
文本分析基础
一、大数据技术下的文本分析方法
概述
⚫数字经济浪潮,导致社会生产的方方面面受到影响,人类社会产生的数据总量在不断增加。非结构化数据占据了人类
数据总量的大部分,而且比重不断上升。
⚫作为非结构化数据的重要组成部分,文本数据的类型丰富多样(如社交网络类文本、上市公司披露类文本、媒体报道
类文本),对财税审领域具有较高的信息价值,因而文本分析(TextualAnalysis)技术异军突起,形成一个新的分
析技术。
⚫文本分析技术主要有主题分析、词典法、词袋法、监督学习、无监督学习与自然语言处理等六大类。从主题分析到自
然语言处理,文本分析技术的自动化程度逐渐提高,使用的算法逻辑也逐渐复杂。
一、大数据技术下的文本分析方法
(一)主题分析
1.主题分析法的概念
主题分析(Thematicanalysis)是一种专家方法,需要有经验的人员基于自身经验和理解,对研究数据进行挖掘。主题分析一般与扎根理论方法相
结合,基于专家自身经验和对世界的理解产生对数
您可能关注的文档
- 大数据审计分析 课件 第八章 智能内部控制审查-图像技术.pdf
- 大数据审计分析 课件 第二章 大数据审计分析的技术与工具.pdf
- 大数据审计分析 课件 第九章 员工舞弊识别-机器学习.pdf
- 大数据审计分析 课件 第六章 风险应对之收入实质性程序-社会网络分析.pdf
- 大数据审计分析 课件 第七章 风险应对之应收账款实质性程序-自动化技术.pdf
- 大数据审计分析 课件 第三章 大数据审计数据分析基础.pdf
- 大数据审计分析 课件 第五章 风险评估-聚类分析.pdf
- 大数据审计分析 课件 第一章 大数据审计分析概述.pdf
- 2026年教资真题试卷及答案.doc
- 2026年揭阳初二数学试卷及答案.doc
原创力文档

文档评论(0)