现在的位置: 首页 > 综合 > 正文

水平分割、垂直分割和库表散列概念说明

2018年09月29日 ⁄ 综合 ⁄ 共 670字 ⁄ 字号 评论关闭

一、水平分割

根据一列或多列数据的值把数据行放到多个独立的表中,即按记录进行分割,不同的记录可以分开保存,每个子表的列数相同;

水平分区将表分为多个表,每个表包含的列数相同,但是行数更少。例如,可以将一个包含十亿行的表水平分区成12个表,没个小表表示特定年份内一个月的数据。任何需要特定

月份数据的查询只需要引用相应月份的表。

使用场景:表很大,分割后可以降低查询时需要读的数据和索引的页数,同时降低索引的层数,提高查询速度;表中的数据本来就有独立性,例如表中分别记录不同地区的数据或

不同时期的数据,特别是一些数据常用,一些数据不常用;需要把数据放到多个介质上。

缺点:水平分割给应用复杂度增加,通常查询时要查询多个表名,查询所有数据需要union操作,在很多数据库中,这种复杂性会超过它带来的缺点,因为只要索引关键字不大,

则在索引用于查询时,表中增加两到三倍数据量,查询时也就增加读一个索引层的磁盘次数。

二、垂直分割

在不破坏第三范式的基础上,把主码和一些列放在一个表,然后把主表也另外一些列放到另外的表,将原始表分成多个只包含较少列的表。垂直分割可以使得数据行变小,一个数

据页就能存放更多的数据,在查询时就会减少I/O次数(每次查询时读取的block就少)。可以达到最大化利用cache的目的。

使用场景:如果一个表中某些列常用,而另外一些列不常用,那么可以采用垂直分割。

缺点:需要冗余列管理,查询所有数据需要join操作。

三、库表散列

表散列与水平分割相似,但没有水平分割那样的明显分割界限,采用Hash算法把数据分散到各个分表中,使得IO更加均衡。

【上篇】
【下篇】

抱歉!评论已关闭.