理解Kylin中Cube、Cuboid、Cube Segment

  • Cube和Cuboid和Cube Segment

    • Cuboid在kylin中指定在某一种维度组合下所有计算的数据;

    • Cube(Data Cube),即数据立方体,是一种常用于数据分析与索引的基数;它可以对原始数据建立多维度索引。简单来说,一个Cube就是许多按维度聚合的物化视图的集合;

    • Cube Segment是指针对源数据中的某一个片段,计算出来的Cube数据。通常数据仓库中的数据会随着时间的增长而增长,而Cube Segment也是按时间顺序来构建的。注意的是,在增量构建中,相邻两个Segment的时间是连续的;

    • 了解维度和度量,就可以将数据模型上的所有字段进行分类:他们要么是维度,要么是度量,没有第三种字段。根据定义的维度和度量就可以构建Cube了。

    • 对于一个给定的数据模型,我们可以对其上所有的维度进行组合,对于N个维度来说,组合可能性共有2的N次方种。即一个N维的cube,是由1个N维子立方体、N个(N-1)维子立方体、N*(N-1)/2个(N-2)维立方体…N个1维子立方体和1个0维子立方体构成。其实就是排列组合。

    • 对于每一种维度的组合,将度量做聚合运算,然后将运算的结果保存为一个物化视图,成为cuboid。所有的维度组合的cuboid作为一个整理,被称为Cube。

  • 举个例子,假设有维度A、B、C,那么2的3次方共8种。

    • 0 维度 0Dÿ

已标记关键词 清除标记
©️2020 CSDN 皮肤主题: 编程工作室 设计师:CSDN官方博客 返回首页
实付 9.90元
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值