Python三维矩阵size操作

深度学习任务中,用于训练的数据需要大小一样,但现实使用的数据往往有大小的差异,有时大小一样的数据进行插值操作后大小也会不一样,根据任务需要确定合适的size后,把所有用于训练的数据切成相同size是模型开始训练前很重要的一步,由于训练的image,label,测试的image,label都需要进行相同的操作,因此我们把这个功能封装成一个函数,需要的时候调用就可以。

    def im_translation(self, image_size, imgs, labels, pixelx, pixely, pixel0, pixel1):
# =============================================================================
#         参数:
#         image_size:要裁剪的图像的大小
#         imgs,labels:图像数据和label数据
#         pixel:根据裁剪图像大小和ROI在图像中的位置,通过设置pixel大小使ROI在裁剪后图像的中间位置
#         pixel0:数据抖动在y轴方向的大小
#         pixel1:数据抖动在x轴方向的大小
#         功能:
#         1、通过enumerate()和zip()函数实现在一个for循环里面同时对imgs_slice和labels_slice的操作,因为使用的是随机抖动,图像和label的抖动
#         必须保证一致性,在一个for循环可以很好的达到这个目的。
#         2、函数对原始图像和要裁剪图像大小做了比较,对于原始图像大于和小于要裁剪图像的情况都做了考虑。
=============================================================================
        z, x, y = np.shape(imgs)
        image_sizeX = image_size[0]
        image_sizeY = image_size[1]       
        imgs_new = []
        labels_new = []
        shift = np.max([abs(pixelx), abs(pixely), np.max((abs(x - image_sizeX), abs(y - image_sizeY)))])
        judge = sum([x > (image_sizeX + abs(pixelx) * 2), y > (image_sizeY + abs(pixely) * 2)])         
        for i, (imgs_slice, labels_slice) in enumerate(zip(imgs, labels)):
            width = random.randint(-pixel0, pixel0)
            height = random.randint(-pixel1, pixel1)
            if judge == 2 :
                imgs_slice = imgs_slice[int((x-image_sizeX)/2+pixelx+width):int((x+image_sizeX)/2+pixelx+width), int((y-image_sizeY)/2+pixely+height):int((y+image_sizeY)/2+pixely+height)]
                labels_slice = labels_slice[int((x-image_sizeX)/2+pixelx+width):int((x+image_sizeX)/2+pixelx+width), int((y-image_sizeY)/2+pixely+height):int((y+image_sizeY)/2+pixely+height)]
                imgs_new.append(imgs_slice)
                labels_new.append(labels_slice)              
                
            else:
                image_new = np.min(imgs_slice)*np.ones([image_sizeX+shift*2, image_sizeY+shift*2], dtype = np.float16)   
                image_new[int((image_sizeX+shift*2-x)/2):int((image_sizeX+shift*2-x)/2)+x, int((image_sizeY+shift*2-y)/2):int((image_sizeY+shift*2-y)/2)+y] = imgs_slice
                x1, y1 = np.shape(image_new)
                imgs_slice = image_new[int((x1-image_sizeX)/2 + pixelx):int((x1+image_sizeX)/2 + pixelx), int((y1-image_sizeY)/2 + pixely):int((y1+image_sizeY)/2) + pixely]            
                imgs_new.append(imgs_slice)    


                label_new = np.min(labels_slice)*np.ones([image_sizeX+shift*2, image_sizeY+shift*2], dtype = np.float16)   
                label_new[int((image_sizeX+shift*2-x)/2):int((image_sizeX+shift*2-x)/2)+x, int((image_sizeY+shift*2-y)/2):int((image_sizeY+shift*2-y)/2)+y] = labels_slice
                x1, y1 = np.shape(image_new)
                labels_slice = label_new[int((x1-image_sizeX)/2 + pixelx):int((x1+image_sizeX)/2 + pixelx), int((y1-image_sizeY)/2 + pixely):int((y1+image_sizeY)/2) + pixely]            
                labels_new.append(labels_slice)                
                

        imgs_new = np.array(imgs_new, np.float32)
        labels_new = np.array(labels_new, np.uint8)
        return imgs_new, labels_new

对应模型预测阶段不需要对label进行操作,简化后如下:

def cutting(image_size, imgs, pixelx, pixely):
    # =============================================================================
    #     参数:
    #     image_size: 需要的图像大小
    #     imgs:需要裁剪的数据
    #     pixel:为了使ROI区域在中心所做的在y轴方向的调整
    #     shift:目的是防止因为pixelx, pixely的偏移造成的越界
    #     功能:
    #     先通过对每层图像的操作实现对图像裁剪
    # =============================================================================
    image_sizeX = image_size[0]
    image_sizeY = image_size[1]
    z, x, y = np.shape(imgs)
    shift = np.max([abs(pixelx), abs(pixely), np.max((abs(x - image_sizeX), abs(y - image_sizeY)))])
    judge = sum([x > (image_sizeX + abs(pixelx) * 2), y > (image_sizeY + abs(pixely) * 2)])
    imgs_new = []
#    image_std = imgs
    for i, image_std in enumerate(imgs):
        if judge == 2:
            image_std = image_std[int((x - image_sizeX) / 2 + pixelx):int((x + image_sizeX) / 2 + pixelx),
                        int((y - image_sizeY) / 2 + pixely):int((y + image_sizeY) / 2) + pixely]
            imgs_new.append(image_std)
        else:
            image_new = np.min(image_std) * np.ones([image_sizeX + shift * 2, image_sizeY + shift * 2], dtype=np.int32)
            image_new[int((image_sizeX + shift * 2 - x) / 2):int((image_sizeX + shift * 2 - x) / 2) + x,
            int((image_sizeY + shift * 2 - y) / 2):int((image_sizeY + shift * 2 - y) / 2) + y] = image_std
            x1, y1 = np.shape(image_new)
            image_std = image_new[int((x1 - image_sizeX) / 2 + pixelx):int((x1 + image_sizeX) / 2 + pixelx),
                        int((y1 - image_sizeY) / 2 + pixely):int((y1 + image_sizeY) / 2) + pixely]
            imgs_new.append(image_std)

    imgs_new = np.array(imgs_new, np.float32)
    return imgs_new

pixel参数在需要数据增强的时候可以用到,给pixel设置一个值可以实现所切区域在x,y轴的上下移动操作,可以使训练数据瞬间增加几倍。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容