- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
基于符号表示的时间序列分类综述--第1页
基于符号表示的时间序列分类综述
武天鸿;翁小清;单中南
【期刊名称】《《河北省科学院学报》》
【年(卷),期】2019(036)003
【总页数】10页(P11-20)
【关键词】时间序列;符号表示方法;符号序列分类
【作者】武天鸿;翁小清;单中南
【作者单位】河北经贸大学信息技术学院河北石家庄050061
【正文语种】中文
【中图分类】TP391.4
0引言
时间序列通常是指按时间顺序排列而成的一组数据,任何有序的实值型数据都可以
当作时间序列处理[1]。时间序列分类是数据挖掘的基本任务之一,是指根据训练
集中对象所构建的分类模型判别被分类对象所属的类别[2]。时间序列分类已经被
广泛应用于模式识别、医疗诊断、工业控制、异常检测等生活的各个方面,时间序
列数据维度高,分类难度大。
时间序列符号表示是指在保持和反映时间序列数据基本特征的前提下,将高维多噪
声的连续实值型数据表示成低维直观的符号序列数据。时间序列符号表示方法不仅
具有简单、高效和离散化的优点,还可以有效消除噪声,使时间序列具有较强的可
基于符号表示的时间序列分类综述--第1页
基于符号表示的时间序列分类综述--第2页
读性,允许研究人员利用来自文本处理、信息检索和生物信息学等领域的算法。基
于符号表示的时间序列分类方法具有更高的分类性能和效率。
本文从基于趋势、基于聚类或进化计算、基于文本、基于频率域等方面,对符号时
间序列分类的研究进行了比较归类,并简要介绍了其在实际中的应用。
1基于趋势的符号表示方法
Lin等[3~4]提出的符号聚合近似表示方法SAX(SymbolicAggregate
approXimation)是一种经典的时间序列符号表示方法。SAX首先利用PAA方法
将规范化后的时间序列(均值为0,标准差为1)分段求均值,且假设PAA值服从高
斯分布,根据高斯曲线下的分段点将PAA值离散映射到相应符号空间。SAX方法
虽然简单高效,能够较好地体现时间序列的整体趋势,但是仅用分段的均值并不能
很好的描述时间序列的局部特征,无法区分具有相同均值不同趋势的时间序列,完
全不同的时间序列可能会得到相似的符号表示,且该方法只适于服从高斯分布的时
序数据。SAX的MINDIST距离度量认为字母表中相邻两个字母间的距离是0,这
种处理方式会造成不同字符串之间的距离误判为0,且下界距离的紧性较差,容易
产生误报。针对SAX存在的缺陷,很多学者对其进行了改进。在距离度量方面,
Fuad等[5]对查找表进行改进,考虑了相邻字母之间的距离,提出了UMD距离
(TheUpdatedMinimumDistance),在下界紧性(TightnessofLowerBound)
和分类性能方面,UMD都好于SAX的MINDIST距离。Bai等[6]提出的rSAX
(RandomShiftingbasedSAX)表示方法,通过随机小距离移动几次分段点,得
到一组合适的分段点,使得彼此接近的点以更高的概率映射到相同符号,与SAX
相比,rSAX具有更好的下界紧性。在局部特征描述方面,Lkhagva等[7]使用每
个分段的均值、最大值和最小值,提出了ESAX(ExtendedSAX),分类效果好于
SAX,但字符串长度增加为SAX的三倍,维数约简性能稍有下降。Malinowski
等[8]提出的符号表示方法1d-SAX,将每个分段(segment)的线性回归(主要是均
基于符号表示的时间序列分类综述--第2页
您可能关注的文档
- 大学生环保知识竞赛试题及答案.pdf
- 大别山红色教育培训v篇.pdf
- 塑料模具设计试卷(含答案).pdf
- 基于差分进化和粗糙集理论的多目标优化算法的研究.pdf
- 基于“超星网络教学平台+翻转课堂”的高职教学改革研究.pdf
- 基于PLC的停车场管理系统设计毕业设计论文.pdf
- 培养学生自主学习能力的策略研究 吴 川_图文.pdf
- 社会主义核心价值观与中国式现代化的价值引领 .pdf
- 2025届高考作文写作热点素材:春节申遗成功 .pdf
- 2025届高考政治一轮复习:统编版必修二《经济与社会》主观题(含答案) .pdf
- 11篇教师参加2022版新《义务教育英语课程标准》专家教授解读培训学习心得体会研读收获教研交流发言9 .pdf
- 我国“互联网+农业”的发展现状、趋势及发展对策研究13000字【论文】 .pdf
- 全国职业院校技能大赛高职组(区块链技术应用赛项)备赛试题库(含答案) .docx
- 双语新闻阅读与练习 (含答案)--高考英语备考专题复习 .pdf
- 集团公司采购预算变更控制管理制度 .docx
- 浙江S电气股份有限公司绩效管理探究【数据论文】6300字 .docx
- 2024年市管理局所属事业单位公开商调工作人员考试题及答案 .pdf
- 执业助理医师(临床)考试备考重点题及答案 .pdf
- Unit5SchoolthingsLet’sstart!Let’sread!(课件)新交际英语(级上册.pptx
- 中考英语考点复习七年级(下)Units1~3(教材知识梳理课件练习)《三步冲刺中考英语》之第1步重课本理考点(人教版).pptx
文档评论(0)