可视化库Seaborn(补充)

一、主题风格

风格:darkgrid、whitegrid、dark、white、ticks

执行下面函数的各种风格演示:

默认matplotlib风格:

dark风格:

white风格:

ticks风格:

darkgrid风格:

whitegrid风格:

set()函数表示默认风格:

despine()函数:

set_context函数:

二、颜色

默认颜色:

需要使用比当前默认颜色循环中设置的颜色更多时,最常用的方法是使用hls的颜色空间,这是RGB值的一个简单转换。

连续色板:

色彩随数据变换,比如数据越来越重要则颜色越来越深

三、单变量分析绘图

根据均值和协方差生成数据:

观测两个变量之间的分布关系最好用散点图:

数据量较大时,传入参数:kind="hex"

多个特征,根据两两特征作图:

四、回归分析绘图

加载数据集

regplot()和lmplot()都可以绘制回归关系,推荐regplot()

两个维度数据都是连续的:散点图 + 线性回归 + 95%置信区间:

一个维度数据是连续的,一个维度数据是离散的,连续轴抖动x_jitter参数:

lmplot的hue参数按cloumns分组,一图多组:

markers参数标示实例点,size参数控制图形大小:

lmplot的hue参数按cloumns分组,加col参数——列增加,加row参数——行增加:

lmplot的col参数分出来多组后,col_wrap参数控制图形显示排布;size参数设置图形大小,aspect参数设置图形横纵比:

lmplot的order参数,设置高阶拟合(lmplot默认order参数是一阶的):

五、分类

重叠是很常见的现象,但是重叠影响我观察数据的量了  

六、其他

IQR即统计学概念四分位距,第一/四分位与第三/四分位之间的距离

N = 1.5IQR 如果一个值>Q3+N或 < Q1-N,则为离群点

显示值的集中趋势可以用条形图:

点图:更好的描述变化差异

多层面板分类图factorplot:

seaborn.factorplot(x=None, y=None, hue=None, data=None, row=None, col=None, col_wrap=None, estimator=, ci=95, n_boot=1000, units=None, order=None, hue_order=None, row_order=None, col_order=None, kind='point', size=4, aspect=1, orient=None, color=None, palette=None, legend=True, legend_out=True, sharex=True, sharey=True, margin_titles=False, facet_kws=None, **kwargs)

七、FacetGrid

八、热度图

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容