pandas新手入门教程六

📚接上文。
首先创建供测试用的数据集合。

dates = pd.date_range('20130101', periods=6)
df1 = df.reindex(index=dates[0:4], columns=list(df.columns) + ['E'])

df1.loc[dates[0]:dates[1], 'E'] = 1
df1.loc[dates[3]] = np.nan
df1

内容如下:


df1

删除miss值

df1.dropna可以这个函数方便的进行操作。how='any',只要行中有一个nan元素就整行删除。

df1.dropna(how='any')

输出


df1

how='all',只有整行都是nan元素才会整行删除。

df1.dropna(how='all')

输出


df1

填充nan值

可以通过df1.fillna方便的把是nan值的元素进行修改。

df1.fillna(value=5)

修改结果


df1

通过判断nan值,生成mask

pd.isna(df1)

输出

df1的mask
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Series 由数组和列表创建Series是一个浅拷贝(只拷贝引用地址,不拷贝对象本身)对象数值变化,数组也变 f...
    萌木盖阅读 4,260评论 0 0
  • 什么是pandas pandas是python的一个数据分析包,是基于NumPy的一种工具,该工具是为了解决数据分...
    开发者也阅读 7,210评论 0 27
  • 5.3汇总和计算描述性统计 pandas对象拥有一组常用的数学和统计方法。他们大部分都属于约简和汇总统计,用于从S...
    凌岸_ing阅读 5,682评论 0 1
  • 1.DataFrame对象 按照一定顺序排列多列数据,各列数据类型可以有所不同 DataFrame对象有两个索引数...
    杨大菲阅读 5,589评论 0 3
  • 第871天2017-08-19晴 昨天我们谈到了接纳与建立良好关系。今天我们就接着讨论“接纳”。接纳就是无条件...
    邓州老赵阅读 3,093评论 1 2