ocr文字识别分为印刷体文字识别和手写体文字识别。文字识别方法的一般流程为识别出文字区域,对文字区域矩形分割成不同的字符,字符分类,识别出文字,后处理识别矫正,文字检测是文字识别过程中的一个非常重要的环节。
ocr文字识别特点
文字检测的主要目标是将图片中的文字区域位置检测出来,以便于进行后面的文字识别,只有找到了文本所在区域,才能对其内容进行识别,将文本行在水平方向解耦成slices进行检测,再将slices区域合并成文本框。
CTPN结构与FasterRCNN类似,但加入了RNN(LSTM层)用于序列的特征识别来提高检测精度,目前CTPN针对水平长行文本的检测是工业级的算法鲁棒,它可以从图片或者PDF中识别和提取其中的文字内容输出文本文档,方便验证用户信息或者直接进行内容编辑。