现在的位置: 首页 > 综合 > 正文

认识大数据分析

2013年01月25日 ⁄ 综合 ⁄ 共 1146字 ⁄ 字号 评论关闭

最近关注大数据,读了一些相关的书和文章,这里对自己在大数据概念上做一个总结。

1. 大数据是泡沫吗?泡不泡沫有什么关系?

大数据很热,热的让人都觉得有问题了。不过,大数据应该是有一定含金量的,否则,没人会炒作它,至于泡沫有多大,要真正了解大数据才知道。

泡不泡沫其实跟大数据没关系,大数据就在那,泡沫就只是别人的炒作。

泡沫破裂后,大数据可能会暂时被很多企业放在一边,但随着其价值的存在,必定会慢慢兴起,因为数据分析的动机一直都存在。

大数据改变是分析专家所使用的分析策略和工具,但不会从根本上改变分析的动机,以及从分析中可获取的价值。

2. 大数据的特点、价值在哪里?或者说谁有这个需求?或者说让谁知道他有这个需求?

大数据不仅是容量大、还有复杂性、速度及多样性等特征。

其价值威力,不是体现在“大”或“数据”,而是对其进行的分析和行动。

而且大数据不意味着控制所有数据,而是抽取重要的部分即可。如何确定哪些是重要的部分?

前期,可以收集一些样本数据,然后,分析确定,哪些是重要的数据。

其重要的价值体现:与其他数据结合后,所带来的业务价值。

3. 大数据与传统的数据分析 有什么区别?

分析策略和工具的不同,但其分析动机,及获取的价值,可能大部分都无分别。  两者都是整体数据和分析的一部分。

4. 哪些数据该被收集?目前常用的分析应用有哪些?(是不是新的商业搜索机会?从哪些小处、痛点找到需求?)

交易数据、网络行为数据、客户接触点等数据,都应当被收集,然后,进行分析。这些数据会将分析带到新的高度。

大数据分析相关的应用:

推荐商品

流失模型

响应模型

顾客分类

顾客搜索

在线广告分析

车载信息的应用:车险、交通管理、道路规划、辅助驾驶

LBS:基于位置的服务。时间与位置信息 的影响力

库存分析

欺诈分析

员工绩效分析

电力系统、电量分析

作弊分析

设备传感器数据 来进行故障诊断

游戏类数据分析:玩家分类、定位交易等

社交网络类的分析:电信业,从账号分析,转移到用户社交网络关联分析

金融行业顾客投诉原因分析,提示业务效率(其他行业也是可以的吧,如电信)

3. 大数据分析如何部署?企业如何采用正确的策略,流程和方法去实施大数据分析? 

1)关注新的并行能力、可扩展性。MMP数据库,云计算架构,MapReduce的并发的分析方式。

2)更新分析的流程,熟悉沙箱,传统分析数据集ADS,企业分析数据集EADS的架构和区别

3)各种高级工具与方法的使用。单点解决方案、R开源工具、用户界面数据可视化、模型的简单与复杂、模型组合等相关概念。

4)关注业务应用。报表与高级分析的区别。高级分析是研究“为什么发生”,“该怎么做”,提供方案;选取分析结果,不能忽视不利的结论,而选取有利的结论。

4. 大数据的问题不是技术问题,而是人、文化、流程或基础设施的问题

参考:

《驾驭大数据》

其他

抱歉!评论已关闭.