ocr文字识别

ocr文字识别分为印刷体文字识别和手写体文字识别。文字识别方法的一般流程为识别出文字区域，对文字区域矩形分割成不同的字符，字符分类，识别出文字，后处理识别矫正，文字检测是文字识别过程中的一个非常重要的环节。

ocr文字识别特点

文字检测的主要目标是将图片中的文字区域位置检测出来，以便于进行后面的文字识别，只有找到了文本所在区域，才能对其内容进行识别，将文本行在水平方向解耦成slices进行检测，再将slices区域合并成文本框。

CTPN结构与FasterRCNN类似，但加入了RNN(LSTM层)用于序列的特征识别来提高检测精度，目前CTPN针对水平长行文本的检测是工业级的算法鲁棒，它可以从图片或者PDF中识别和提取其中的文字内容输出文本文档，方便验证用户信息或者直接进行内容编辑。