- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
非结构化文本数据发展现状及其在
城市金融研究所
非结构化文本数据发展现状及其在
研 商业银行的应用模式探索
究 要点
报 目前,部分行业已经开始关注非结构化文本数据
所带来的商业价值,然而,非结构化数据分析
果转化却出现与非结构化数据的规模和增长速度
告 相背离的现象,文本挖掘商业化过程中存在的问
题主要源自应用场景的缺乏、文本数据分析的复
杂程度、文本数据监管不力以及对文本数据重视
程度不高。
2016年第124期
随着金融行业的IT投资规模逐渐增大,对文本数
2016.12.22 据的分析挖掘和应用需求也不断增加。目前,根
据金融行业的文本数据特点主要衍生出金融文本
资讯类服务和基于文本数据的金融信息挖掘与决
执笔:宋丹 冯乾 策两种数据应用模式,其中以证券行业应用最为
广泛。
dan.song@
文本数据的挖掘与应用目前在商业银行处于萌芽
qian.feng@
阶段,主要应用场景包括意见挖掘、舆情分析、
客户画像、客户经理服务效率提升和个性化内容
推荐等等,商业银行发展文本数据的挖掘和应用
还要注重文本数据的收集和治理、强化软硬件资
源、文本数据与结构化数据的融合、自身禀赋挖
掘与对外协作以及数据安全等问题。
重要声明:本报告中的原始数据来源于官方统计机构和市场研究机构已公开的资料,但不保证所载信息的准确性和完整
性。本报告不代表研究人员所在机构的观点和意见,不构成对阅读者的任何投资建议。本报告 (含标识和宣传语)的版
权为中国工商银行城市金融研究所所有,仅供内部参阅,未经作者书面许可,任何机构和个人不得以任何形式翻版、复
制、刊登、上网、引用或向其他人分发。
非结构化文本数据发展现状及其在商业银行的应用模式探索
非结构化文本数据发展现状及其在商业银行的
应用模式探索
一、非结构化文本数据应用发展现状及难点
(一)非结构化数据应用发展现状
随着互联网、多媒体、传感器和社交网络的应用,每时每刻都有大量的数
据产生,有资料表明2015年全球数据总量达到8.6ZB,并且以年复合增长率50%
的速度增长。数据增长的同时,数据的使用和分析市场迅猛扩张,据易观数据
统计,2015年我国大数据市场规模115.9亿元,比2014年增长38% (见图1)。
数据来源:易观国际
图1 我国大数据市场规模(2011-2015)
大数据主要包含了结构化数据、半结构化数据和非结构化数据,其中非结
构化数据占据了数据总量的80%。非结构化数据是指其字
文档评论(0)