1、描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。
2、描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
3、统计描述,就是用统计的方法对数据进行一定的汇总。
(相关资料图)
4、提到统计描述,不得不提统计推断,何谓统计推断呢,就是用概率论的方法对数据间的差异“是否有统计学意义”进行一定的推断。
5、描述统计中的数据可以分为分类型数据和数值型数据。
6、分类型数据是识别变量的类型,比如男女、地区、各种类别;数值型数据是表示数值的大小和多少,比如年龄中的18、19、20岁。
7、最明显的区分是,分类型数据不能使用加减法,而数值型数据可以。
8、两者在一定程度可以互相转换。
9、比如年龄,18岁是数值型数据,但它也可以转换成分类数据青少年。
10、扩展资料描述统计中数据的度量平均数是一种数据位置的度量,用以了解整体数据,这是小学就学到的内容。
11、可是平均数并不是一个权威的衡量指标,当我们提到全国平均工资的时候,我们都是被马云爸爸王健林爸爸平均的普通人。
12、平均数容易受到极值的影响,因为数据集并不能保证,各类运营数据经常受到扰动,比如薅羊毛党就会拉高营销活动的平均值。
13、一般而言,可以用调整平均数(trimmed mean)消除异常波动,在数据集中删除一定比例的极大值和极小值,比如5%,然后重新计算平均数。
14、2、中位数。
15、将所有数据按升序排列后,位于中间的数值即中位数。
16、当数据集是奇数,中位数是中间的数值,当数据集是偶数,中位数是中间两个数的平均值。
17、3、另外一种度量是众数,它是数据集出现频次最多的数据,当有多个众数时,称为多众数。
18、众数使用的频率低于前两者,更多用于分类数据。
19、4、数据分析师常将数据划分为四个部分,每一部分包含25%的数据集,划分的分割点叫做四分位数。
20、依次将数据升序排列,位于第25%位置的叫做第一四分位数Q1,位于第50%位置的叫做第二四分位数Q2,即中位数,位于第75%的叫做第三分位数Q3。
21、这三个点,能辅助衡量数据的分布状态。
22、参考资料来源:百度百科-描述统计。
本文分享完毕,希望对大家有所帮助。