数据分析--Numpy--去重与重复

1.unique函数

通过unique函数可以找出数组中的唯一值并返回已经排序的结果

arr = np.array([1,1,1,2,2,3,3,])
res = np.unique(arr)
print(res)#[1 2 3]

2.tile函数

np.tile(A,reps)

主要有两个参数,参数’A’指定重复的数组,
参数’reps’指定重复的次数

arr1 = np.arange(5)
arr2 = np.tile(arr1,3)
print(arr2)#[0 1 2 3 4 0 1 2 3 4 0 1 2 3 4]

3.repeat函数

numpy.repeat(a, repeats, axis=None)

repeat 函数主要有三个参数,参数“a”是需要重复的数组元素,参数“repeats”是重复次数,参数“axis”指定沿着哪个轴进行重复,axis = 0 表示按行进行元素重复;axis =1 表示按列进行元素重复。

#def repeat(a,repeats,axis=None):
#axis=1表示按列进行元素重复
arr2 = np.random.randint(0,10,size=(3,3))
print('arr2:\n',arr2)
'''
arr2:
 [[5 0 0]
 [2 4 9]
 [7 8 1]]
'''
arr2_2_0 = np.repeat(arr2,2,axis=0)
print('按行进行重复',arr2_2_0)
'''
按行进行重复 [[5 0 0]
             [5 0 0]
             [2 4 9]
             [2 4 9]
             [7 8 1]
             [7 8 1]]
'''

repeat和tile两个函数的区别:两个函数都能够对数组进行“重复”区别在于:tile函数是将数组进行重复,repeat函数是对元素进行重复

Example:

arr2_tile = np.tile(arr2,3)
print(arr2_tile)
'''
[[5 0 0 5 0 0 5 0 0]
 [2 4 9 2 4 9 2 4 9]
 [7 8 1 7 8 1 7 8 1]]

repeat重复555000000
tile500500500
发现区别了吧
'''
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。