大数据审计分析 课件 第四章 初步业务活动-文本分析.pdf

大数据审计分析 课件 第四章 初步业务活动-文本分析.pdf

第四章初步业务活动——文本分析

目录

CONTENT

第一节文本分析基础

第二节实战演练——初步业务活动之舆情分析

第一节

文本分析基础

一、大数据技术下的文本分析方法

概述

⚫数字经济浪潮,导致社会生产的方方面面受到影响,人类社会产生的数据总量在不断增加。非结构化数据占据了人类

数据总量的大部分,而且比重不断上升。

⚫作为非结构化数据的重要组成部分,文本数据的类型丰富多样(如社交网络类文本、上市公司披露类文本、媒体报道

类文本),对财税审领域具有较高的信息价值,因而文本分析(TextualAnalysis)技术异军突起,形成一个新的分

析技术。

⚫文本分析技术主要有主题分析、词典法、词袋法、监督学习、无监督学习与自然语言处理等六大类。从主题分析到自

然语言处理,文本分析技术的自动化程度逐渐提高,使用的算法逻辑也逐渐复杂。

一、大数据技术下的文本分析方法

(一)主题分析

1.主题分析法的概念

主题分析(Thematicanalysis)是一种专家方法,需要有经验的人员基于自身经验和理解,对研究数据进行挖掘。主题分析一般与扎根理论方法相

结合,基于专家自身经验和对世界的理解产生对数

文档评论(0)

1亿VIP精品文档

相关文档