深入浅出统计学

异常值总是要么极大,要么极小,四分位距将异常指统统铲除。
平均数:指出数据的中心。

image.png

百分位数:将数据一分为百。对于划分档次非常有用。
箱线图:能在同一张图上体现多个距和四分位数,是在这方面十分有用的一种方法。‘箱’显示出四分位数和四分位距的位置。‘线’则显示出上、下界。箱线图能在一张图上体现多批数据,因此非常有利于比较。

方差:量度数据分散性的一种方法,是数值与均值的距离的平方数的平均值。

image.png

标准差:度量与均值的距离,量度数据的分散性。,体现数值的变异度。

标准份分:利用均值和标准差,将一个数据集中的各个数值转化为更通用的分布形态,同时确保数据的基本形状不变。

概率空间:样本空间,是表示所有可能结果的一种简便表示法。可能发生的事件都是S的子集。

A与B为对立事件:P(A)=1-P(B)

B发生的条件下A发生的概率: P(A|B)=P(AB)/P(B)

image.png
image.png

什么时候使用贝叶斯定理?
答:在需要求出条件概率,且该条件概率与已知条件概率顺序相反时使用。(过滤垃圾邮件,医学实验上)

image.png
image.png
image.png
image.png
image.png
image.png
image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容