cassandra cql解析

最新推荐文章于 2022-07-20 00:44:40 发布

方丈的寺院

最新推荐文章于 2022-07-20 00:44:40 发布

阅读量5.9k

点赞数 1

分类专栏： NoSql-Cassandra cassandra 详解文章标签： cassandra 大数据 cql clustering or

本文链接：https://blog.csdn.net/FS1360472174/article/details/72860299

版权

本文详细介绍了Cassandra的CQL查询，强调了由于其分布式特性和数据分布方式，CQL在范围查询、IN操作及OR条件上的限制。Cassandra的分区键基于哈希，不支持范围查询，而聚集键支持排序和范围查询。同时，文章讨论了CQL中的问题，如不支持OR操作和模糊查询，并指出在没有明确分区键的情况下进行查询可能导致低效。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

摘要

CQL相比较于SQL有很多的限制，原因在于cassandra是为大数据存储设计的，而它的部署模式又都是基于分区方式的，不像mongo还有复制集这个小规模的数据库集群设计，当数据量大的时候再进行分片。为了提供检索效率，所以在CQL语法上做了限制，避免低效的查询语句。cassandra的数据是根据partition key做hash计算后分布到各个节点的，扫描各个节点的效率是很低的。所以cassandra query检索的一个基本原则就是尽可能的查找少的节点。

CQ L

概览

关系型数据库是行的集合，Cassandra是分区的集合，如果没有clustering key的话，每个分区就是单行，一个分区包含多行的话就叫做宽行(wide-row)。cassandra 根据partition key的hash value来决定数据存储在哪个节点，这个相当于是hash索引，所以不能进行范围查询。然后在每个分区根据clustering key来排序，
这个不是基于hash的，所以可以根据范围来查询。以下表为例，node为partition key,(date,number)是clustering key.

CREATE KEYSPACE test WITH REPLICATION = {
    'class': 'SimpleStrategy',
    'replication_factor': 1
};

CREATE TABLE log(
    node text,
    date text,
    name text,
    number int,
    Primary Key(node,date,number)
);

在关系型数据库中数据是这么存储的