函数中遇到的常见命令总结

本课索引

代码 说明
---导入pandas---
import pandas as pd 导入pandas包并将之简写为pd
---创建pandas中的DataFrame和Series---
pd.DataFrame() 创建 pandas DataFrame
pd.Series() 创建 pandas Series
---数据选择---
df.column_name 选取数据框的某一列,生成Series格式数据,df为数据框,column_name为列名
df['column_name'] 选取数据框的某一列,生成Series格式数据
df[['column_name']] 选取数据框的列,生成DataFrame格式数据
df.loc[ ] 使用行和列的标签索引选取数据
df.iloc[ ] 使用行和列的数值索引选取数据
---导入csv格式数据---
pd.read_csv() 在pandas中读取csv文本格式数据
---观察数据框---
df.head() 查看数据框df的前几行数据
df.tail() 查看数据框df的最后几行数据
df.info() 获取数据框df的信息
df.describe() 获取数据框df的各项统计值
df.index 查看数据框df的行索引
df.columns 查看数据框df的列名
df.shape 查看数据框df的形状,行数和列数
---Series数据的一些统计分析函数---
se.unique() 获取Series数据中的数值种类,一般用于分类数据,这里se为Series格式数据
se.value_counts() 统计Series数据中的数值种类及其对应的数据个数
se.mean() 计算Series数据的均值
se.std() 计算Series数据的标准差
se.median() 计算Series数据的中位数
se.max() 计算Series数据的最大值
se.min() 计算Series数据的最小值
se.count() 计算Series数据的个数
---pandas绘图函数---
df.plot(kind='scatter', x= , y= ) 绘制散点图
df.plot(kind='box') 绘制箱图
df.boxplot(by='column_name') 绘制箱图,并按 column_name 这一列的分类数值进行分组
groupby 数据的分组
数据的聚合
内置函数 count、mean、sum、max
自定义函数 agg:将一组数据聚合成标量的形式
自定义函数 apply:将多组数据聚合运算
def 函数名(参数):
函数体
return 函数命令 自定义函数
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 之前的文章一直在规避索引的建立去优化数据库,不是不想讲,而是这个太重要,必须抽出来讲。今天我们就来研究下数据库索引...
    JackFrost_fuzhu阅读 10,170评论 0 70
  • 从显微镜的视角来看我目前的职业状态,职业是高校实验室教师,职称是高级工程师,学历是硕士研究生,这样的条件在我们学院...
    刘敏层阅读 1,657评论 0 0
  • 一觉睡到自然醒。 洗漱完毕,带着小傻(小泰迪),我们便驱车出发。 首先得解决早饭问题啦。停好车,先生去买锅拉头(本...
    如如在阅读 2,806评论 0 0
  • 1. 道可道,非常道。 凡说出来的具体的道理,都是对的,但没有全对的,因为都是一个角度。而任何事物至少两面以上才成...
    虾米na阅读 1,846评论 0 0
  • 从北方来的老师说,从毕业到工作,再到快退休,学到的最深的一课便是学会如何勾兑。 [1] 自上而下 引用老师的话说:...
    奇葩二十二阅读 3,097评论 0 0