- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
期货交易数据关联剖析
期货交易数据关联剖析
摘 要:针对数据挖掘技术在期货交易数据中的应用,通过关联规则分析期货价格和客户行为. 首先预处理原始期货交易数据并提取符合挖掘目标的数据,再通过改进的Apriori算法挖掘预处理后的数据. 根据用户给定的最小支持度和最小置信度对挖掘结果生成强关联规则,并以文本形式显示. 根据简单的规则说明,用户可以很好地理解规则的含义.
关键词:数据挖掘;Apriori算法; 期货价格;客户行为;关联规则
中图分类号:TP311.13;F830.9
文献标志码:A
Association analysis on forward business data
JI Jia
(Info. Eng. College, Shanghai Maritime Univ., Shanghai 200135, China )
Abstract: Aiming at the application of data mining technology on forward business data, the forward prices and customers’ behaviors are analyzed based on association rules. The original forward business data is preprocessed to get the data agreed with the goal of mining task. And the preprocessed data is mined by the improved Apriori algorithm. The strong association rules are generated through minimum support percent and confident percent given by users and showed in the form of text, which can be well understood by users with the help of some short instructions.
Key words: data mining; Apriori algorithm; forward price; customers’ behavior; association rule
0 引 言
数据挖掘(Data Mining,DM)指从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程.[1]
数据挖掘的应用非常广泛,常见的应用案例多发生在零售业、制造业、金融保险业、通讯及医疗服务业.世界最大的汽车销售网站美国AutoT公司、世界著名的金融信息服务公司Reuteres以及世界最大的啤酒进出口商之一Bass Export都曾利用数据挖掘成功解决相关领域的问题.
在已有的文献中,对数据挖掘在证券业、银行业中的应用已有相关报道,但这些研究和应用主要集中于客户关系管理[2],很少涉及交易市场本身.而且一般以决策树、聚类的方法进行挖掘,对于期货交易数据的挖掘研究或成功案例目前很少.[3]期货交易作为现代投资手段在当今世界经济中的地位和作用日益增强,而其市场行为较之股票、债券而言具有更大的投机性,借助数据挖掘技术,可以发现一些隐含的、非统计学方法能够获得的信息.
本文运用数据挖掘技术中的关联规则方法[4]对期货的价格和客户行为进行分析,是对数据挖掘技术在期货领域上应用的一个尝试,研究的结论可以为期货公司客户行为的分析和预测带来新的启发,为期货公司提升客户满意度、获取竞争优势提供一定的帮助.
1 数据预处理
数据预处理[5]是数据挖掘的重要一环.因为要挖掘的数据来自多数据源,通常存在以下问题:(1)杂乱性,数据缺乏统一定义,往往不能直接使用;(2)重复性,对同一个客观事物在数据库中存在两个或两个以上完全相同的表达方法;(3)不完整性,数据记录中可能会出现数据属性值的丢失或不确定情况,还可能缺少必须的数据而造成数据不完整.
期货价格方面,用户给出的每个价格表共有7个属性列:时间、开盘价、最高价、最低价、收盘价、成交量、持仓量.除了时间列以外,其他6个属性列的值都是数值型的.每天的交易都有记录,没有空缺值,也没有重复值.尽管如此,这些原始数据并不能直接用于挖掘.
首先,每个期货品种的每个型号对应一张价格表,不同期货品种的价格表跨越的时间段不同.例如,类型为03号品种铜的价格表(Cu
您可能关注的文档
- 有限切开复位单臂外固定架外固定治疗胫骨骨折临床剖析.doc
- 有限内固定结合外固定支架治疗桡骨远端粉碎性骨折临床剖析.doc
- 有限合伙企业内部治理问题剖析.doc
- 有限理性下竞争性联盟成员合作创新博弈剖析.doc
- 有限合伙制度剖析.doc
- 朋友圈微商消费行为及心理剖析.doc
- 服务业产业内贸易理论剖析.doc
- 有髯鸢尾杂交结实性剖析及优异杂交组合筛选.doc
- 服务业分行业全要素生产率测算及剖析.doc
- 服务业经营成本控制剖析――以酒店为例.doc
- 中国国家标准 GB 14287.5-2025电气火灾监控系统 第5部分:测量热解粒子式电气火灾监控探测器.pdf
- 《GB/T 42706.4-2025电子元器件 半导体器件长期贮存 第4部分:贮存》.pdf
- GB/T 42706.4-2025电子元器件 半导体器件长期贮存 第4部分:贮存.pdf
- 中国国家标准 GB/T 42706.4-2025电子元器件 半导体器件长期贮存 第4部分:贮存.pdf
- 中国国家标准 GB/T 19436.2-2025机械电气安全 电敏保护设备 第2部分:使用有源光电保护装置(AOPDs)设备的特殊要求.pdf
- 《GB/T 19436.2-2025机械电气安全 电敏保护设备 第2部分:使用有源光电保护装置(AOPDs)设备的特殊要求》.pdf
- 《GB 27898.4-2025固定消防给水设备 第4部分:消防气体顶压给水设备》.pdf
- GB 27898.4-2025固定消防给水设备 第4部分:消防气体顶压给水设备.pdf
- GB/T 31270.1-2025化学农药环境安全评价试验准则 第1部分:土壤代谢试验.pdf
- 中国国家标准 GB/T 31270.1-2025化学农药环境安全评价试验准则 第1部分:土壤代谢试验.pdf
原创力文档


文档评论(0)