云存储 – Bigtable

现在的位置: 首页 > 综合 > 正文

RSS

云存储 – Bigtable

2013年12月03日 ⁄ 综合 ⁄ 共 1801字 ⁄ 字号小中大 ⁄ 评论关闭

本文是对Bigtable: A Distributed Storage System for Structured Data这篇论文的学习总结。

什么是Bigtable

Bigtable是一个在大规模的Commodity机器上存储海量结构化数据的分布式存储系统。Google很多不同类型的产品都使用了Bigtable存储数据，包括了从离线的批量数据处理到实时为用户提供数据的产品。

Bigtable的Data Model

一个Bigtable是离散的、分布式的，持久化的、多纬度的、有序的Map: (row:String, column:String, timestamp:int64) -> String

Bigtable中每行有一个row key, 上图中为com.cnn.www。Bigtable所有的行根据词典顺序被排序，并且把整个表根据不同的key range进行切分成不同的更小的tablet。Tablet是进行distribution和load balancing的单元。

Bigtable中每个column key以"column family:qualifier"的形式定义。比如anchor:cnnsi.com这个column key中，anchor是column family, cnnsi.com是qualifier。Bigtable中的每个cell可以由统一数据的不同版本，并且不同的版本由时间戳标识。

在Bigtable中，access control是在column family这个层次做的。

Bigtable的实现

Bigtable的数据和日志文件是存在Google File System中的，而Bigtable的Master和Tablet服务器的实现则依赖于Google Chubby。Bigtable依赖于Chubby实现了：1）在任何时候只有一个Master节点；2）存储Bigtable数据的引导位置(bootstrap location)；3）发现Tablet服务器以及任一时刻Tablet服务器是否正常工作；4）存储Bigtable的schema信息；5）存储access control列表。

Tablet的位置是通过一个三层的类似B＋树这样的数据结构来存储的，如下图所示。Root Tablet实际上是Metadata Tablets列表中的第一个Metadata Tablet。