现在的位置: 首页 > 综合 > 正文

数据分析那些事

2018年04月16日 ⁄ 综合 ⁄ 共 766字 ⁄ 字号 评论关闭

了解数据、总体、样本的含义及随机抽样的一般方法;

掌握排列图、因果分析图的作图方法和应用;

掌握分层法、统计图表法的应用;

了解直方图的原理、作用、作图方法及应用;

数据表现形式:

数据列表(即图表)

趋势图述性分析:数据分时段走势、差距变化情况以及
相应的时间背景

比例的图形

按数据的性质一般可归纳为:
 定性数据。往往用于频数或频率分析。
 定量型数据。可以用数字量化的数值。

数据分析的方法是:确定问题确定分析目标,采用科学方法收集数据,考察数据时效性整理数据,统计分析,出具分析报告,提出建议

数据分析误区:

误区一: 展示元素不宜大于3个

误区二:时间序列数据最好使用折线图,而不宜使用柱状图等

误区三: 研究用数据最好不使用三维立体图

误区四:为避免图表的欺骗性,图线最好占据2/3  至3/4 的高度(调整Y 轴刻度)

当样本个数越多时,分析结果越接近总体的值,样本对总体的代表性就越好。

抽样方法:

随机抽样:

指总体中每一个个体都有同等可能的机会被抽到。这种抽样方法
事先不能考虑抽取哪一个样品,完全用偶然方法抽样,常用抽签
或利用随机数表来抽取样品以保证样品代表性。

当图书品种不多时,随机抽样是一种有效的
抽样方法;

 

分层抽样

分层抽样是先将总体按照研究内容密切有关的主要因素分类或分
层,然后在各层中按照随机原则抽取样本。分层抽样可以减少层
内差异,增加样本的代表性。

当到货产品较多时,分层抽样是一种有效的抽样方法;

系统抽样方法

从总体中每隔K个个体抽取一个个体的抽样方法,比值K是总体容
量N与样本容量n之比;

当出版商批量发货及产品特别多时,并且易作某种次序的整理时,
系统抽样比分层抽样好;

描述总体数据离散程度的参数为方差σ
2
,描述总体数据中心倾向的
数为均值μ。若利用样本参数近似描述总体状况时,可以利用样本
方差S
2
近似代替总体方差σ
2
,利用样本均值X近似代替总体均值p。

 

抱歉!评论已关闭.