专利出售信息
发明 一种任意方向自然场景文本识别方法
2人
G06V10/22 G06V30/148 G06V10/764 G06V10/82 G06K9/62 G06N3/04 G06N3/08
摘要:本发明涉及一种任意方向自然场景文本识别方法,属于数字图像处理领域,包括以下步骤:S1:首先使用高分辨分割网络HRNet作为基础框架提取文本的空间信息;S2:然后使用卷积长短时记忆ConvLSTM模型提取文本的时空序列信息;S3:通过设计字符注意机制使得模型的注意力在字符上,并使用可微分二值化函数进一步加大网络对前景的注意力,而削弱对背景区域的关注;S4:网络对每个像素点进行37分类,将分类结果按照从左到右的顺序转换成文本。本发明能识别任意方向的场景文本,同时对低分辨率和强噪声文本均有较强的鲁棒性。
发布人员
  • 11-08
  • 12-03

免责声明:以上消息未经人工确认,本平台不担保其真实性和有效性,交易前请仔细核实。