现在的位置: 首页 > 综合 > 正文

海量数据处理

2017年10月13日 ⁄ 综合 ⁄ 共 212字 ⁄ 字号 评论关闭

##海量数据处理
 
Hash映射+Hash统计+堆/快速/归并排序
双层桶划分
Bloom filter/Bitmap
Tire树/数据库/倒排索引
外排序
分布式处理(Hadoop)

###1.Hash
Hash算法,核心其实是利用分而治之的思想。    
         
先做Hash映射,缩小规模,在小规模数据里处理,之后采用堆排序、快排等排序方法。
Hash_map统计  
堆排序                   

【上篇】
【下篇】

抱歉!评论已关闭.