GBase的列存是基于什么做的,是否支持行列混存
warning:
这篇文章距离上次修改已过1628天,其中的内容可能已经有所变动。
GBase是原生态的列存,各列独立存储,列存储的基本单位是DC(DataCell),以DC为单位进行IO(Read 、Write)以及压缩等,每个DC有对应的SmartIndex,可用于查询中的部分算子计算优化。
支持行列混合存储,可以为指定多个列建立行存储数据(这部分数据和列存是冗余存储的)。一般行存储数据用于查询投影列为很多列且命中数据非常离散的场景(这种场景行存IO比较有优势),缺陷是存储空间会增加很多。