synthetic data for text localisation in natural images

简单概括:

本文贡献:

1. 提出了一个针对文本检测和识别任务的数据扩增方法。该方法合成的图片相当真实,可以以假乱真,极大提高了准确率。其他任务可以借鉴。

2. 借鉴YOLO,提出了一个端对端的文本检测模型,可以看做EAST、wordsup、DeepDirect方法的雏形。

3. 为了提高性能,采用了cascade结构,把 2 的 结果作为proposal,用传统方法二次过滤,用神经网络二次回归。对发表论文、刷比赛库有启发。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容