ClickHouse官方中文文档.pdfVIP

  1. 1、本文档共642页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
什么是ClickHouse ? ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS) 。 在传统的行式数据库系统中 ,数据按如下 序存储 : row watchID JavaEnable title GoodEvent EventTime #0 89354350662 1 投资者关系 1 2016 05 18 05:19:20 #1 90329509958 0 联系我们 1 2016 05 18 08:10:20 #2 89953706054 1 任务 1 2016 05 18 07:38:00 #N … … … … … 处于同一行中的数据总是被物理的存储在一起 。 常见的行式数据库系统有 : MySQL 、Postgres和MS SQL Server 。 在列式数据库系统中 ,数据按如下的 序存储 : row: #0 #1 #2 #N watchID: 89354350662 90329509958 89953706054 … J avaEnable: 1 0 1 … title: 投资者关系 联系我们 任务 … GoodEvent: 1 1 1 … EventTime: 2016 05 18 05:19:20 2016 05 18 08:10:20 2016 05 18 07:38:00 … 该示例中只展示了数据在列式数据库中数据的排列方式 。 对于存储而言 ,列式数据库总是将同一列的数据存储在一起 ,不同列的数据也总是分开存储 。 常见的列式数据库有 : Vertica 、 Paraccel (Actian Matrix ,Amazon Redshift) 、 Sybase IQ 、 Exasol 、 Infobright 、 InfiniDB 、 MonetDB (VectorWise , Actian Vector) 、 LucidDB 、 SAP HANA 、 Google Dremel 、 Google PowerDrill 、 Druid 、 kdb+ 。 不同的数据存储方式适用不同的业务场景 ,数据访问的场景包括 :进行了何种查询 、多久查询一次以及各类查询的比例 ; 每 种查询读取多少数据————行 、列和字节 ;读取数据和写入数据之间的关系 ;使用的数据集大小以及如何使用本地的数据 集 ;是否使用事务,以及它们是如何进行隔离的 ;数据的复制机制与数据的完整性要求 ;每种类型的查询要求的延迟与吞吐量 等等 。 系统负载越高 ,依据使用场景进行定制化就越重要 ,并且定制将会变的越精细 。没有一个系统能够同时适用所有明显不同的业 务场景 。如果系统适用于广泛的场景 ,在 负载高的情况下 ,要兼顾所有的场景 ,那么将不得不做出选择 。是要平衡还是要效 率? OLAP场景的关键特征 大多数是读请求 数据总是以相 当大的批( 1000 rows)进行写入 不修改已添加的数据 每次查询都从数据库中读取大量的行 ,但是同时又仅需要少量的列 宽表 ,即每个表 包含着大量的列 较少的查询(通常每台服务器每秒数百个查询或更少) 对于简单查询 ,允许延迟大约50毫秒 列中的数据相对较小 : 数字和短字符串(例如 ,每个URL 60个字节) 处理单个查询时需要高吞吐量 (每个服务器每秒高达数十亿行) 事务不是必须的 对数据一致性要求低 每一个查询除

您可能关注的文档

文档评论(0)

+ 关注
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档