- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
中航信大数据思考与实
践
Companynumber:【0089WT-8898YT-W8CCB-BUUT-202108】
中航信大数据思考与实践
【赛迪网讯】我来自中国民航信息集团公司(以下简称中国航信)。中国航信的前
身创建于80年代,30年来,一直为中国民航业提供信息化服务。中国航信正式组建于
2002年10月,属国资委管理的中央企业,现有员工近4000人,总部在北京。2000年
10月,中国民航计算机信息中心联合当时所有国内航空公司发起成立中国民航信息网络
股份有限公司,于2001年2月在香港联交所主板挂牌上市交易。2008年7月,中国民
航信息集团公司以中国民航信息网络股份有限公司为主体,完成主营业务和资产重组并
在香港成功整体上市。
目前,中国航信是航空旅游行业领先的信息技术及商务服务提供商,主要业务是航
空客运业务处理、航空旅游电子分销、机场旅客处理、航空货运数据处理、航空财务结
算清算、IT外包服务、互联网旅游分销平台。包括淘宝、携程、艺龙在内,它们销售客
票的原始数据都由中国航信提供。航信的电子客票服务,可以让乘客方便地通过网络购
买机票、网上值机,拿着第二代身份证就可以登机。
我曾经看到过这样一个报道:美国某机场通过视频监控发现一个旅客把前面旅客的
劳力士手表给偷了。随着服务细化以及航信客户--航空公司的要求越来越高、越来越
细,中国航信也会逐步将图像、声音、视频加入到数据库当中,增加数据库的多样性。
目前,航信只是把图片放到了数据库中,视频还没有放到其中。
中国航信目前运行着超过2000台硬件设备,每秒钟事务处理能力是11000TNX/S,
每天为100万旅客提供订票离港服务,每天交易量10亿元。中航信目前存储的数据大
部分为结构化数据,拥有超过2PB的存储系统,每年结构化数据增长量为35%。中国航
信拥有3个正在运行的数据中心,还有两个在建数据中心,分别是在顺义的30000平米
数据中心以及浙江在嘉兴的15000平米数据中心。未来,会根据客户需求以及市场驱动
等因素,来决定在结构化或非结构化数据的投资。
目前,中航信最紧迫是要满足航空公司的实时票价计算需求。实时票价,就是航空
公司能够在在某一时刻,根据历史数据、当下的需求,来自动决定机票售价,既可以让
航空公司的利润最高,又能够让消费者能够接受。这个动态票价点需要在几秒内计算出
来,需要结构化大数据、并行计算等技术来进行支撑。中航信现采用的传统teradata
关系数据库,不能支持实时计算。
航信成立之后的前20年,中国航信都是采用传统的主机系统,设备都是IBM的
UNIX。目前,中国航信正在从传统的主机模式向开放平台进行转移,目前,酒店业务、
货运业务、电子客票、机场离岗等等都在逐步地向开放平台进行迁移。
在开放平台上,中国航信主要应用是的Oracle或者MySQL,数据架构之间相互比较
独立、烟囱式的,每个系统之间数据没有物理上的联系。而逻辑上的些微联系也是根据
业务需求,进行的数据交换。这些数据在物理上是统一存储,我们在3年前实现了在开
放平台上的虚拟化存储技术,把所有的磁盘、所有的应用系统、主机都集成到我们的虚
拟化云平台上,可以根据需要在几分钟内就部署一套系统,这在两年前就完全实现了。
中国航信在2002年投资一亿部署Teradata的数据仓库。这是一个关系型数据库,
它能存储大量数据,但缺点是反应速度慢,没法实时地为航空公司提供服务,不能在规
定时间内计算出票价,这个需求对于航空公司、客票代理、购票人都是非常有用的。过
长的等待时间会让该功能失去功用了,因此Teradata系统不能用于实时的计算,都是
按天为单位来运算的。在2000年时,觉得Teradata的存储容量很大,可以存储1~2年
的数据,但我们现在存储半年数据就满了,且管理成本、运维成本、扩容成本都是千万
级的,也非常昂贵。
根据预测,2020年的中国航空旅客运输量将达到亿人次左右,年复合增长率为%,
并将成为全球第一的航空旅行大国。航空客运销售代理市场的规模将达到360亿元左
右,成长空间巨大。可以预见,支撑这一巨大规模的IT系统也将是及
文档评论(0)