OCR检测篇 AI视觉在复杂场景下字符识别的全方位应用_软板装配

OCR检测篇 AI视觉在复杂场景下字符识别的全方位应用

2023-12-05 09:58:54软板装配

OCR （Optical Character Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检验测试暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。

衡量一个OCR系统性能好坏的主要指标有：拒识率、误识率、识别速度、用户界面的友好性，产品的稳定性，易用性及可行性等。

在工业领域，光学字符识别（OCR）是一项机器视觉任务，包括从图像中提取文本信息。

文本的位置是固定的。例如，个人身份证是按照正式规范制作的，每个数据字段的位置是已知的，经过良好校准的视觉系统能拍摄文本位置几乎恒定的图像。

文本位置不是固定的，但它与输入图像上的特征元素或特殊标记（光学标记）相关，要获取文本的位置，必须找到光学标记。这能够最终靠模板匹配或其他技术完成。

文本提取过程中的主要复杂情况可能是光线不均匀。某些技术（如光规范化或边缘锐化）有助于查找字符。

文本区域分割是将区域拆分为行和单个字符的过程，当文本文本行分开时，每行必须拆分为单独的字符，接下来，提取的字符将从图形表示形式转换为文本表示形式。

通过调用OCR模型库，使识别到的字符以文本形式与模型库进行比对，匹配数据最相似的模板，得出准确的字符信息。

在生活当中，随处可见与印刷字符有关的产品，比如：键盘上的字符，衣物上的标签字符，电器上的字符等等。

而这些产品的外观由于字符在印刷时产生的一些瑕疵，如字符拉丝、移位、多墨、缺失、漏印等字符印制不良就会引起客户对厂商的投诉。

厂商为客服这样的一个问题，就会在产品出厂前对其进行严格的检测。传统的检测方式是利用人工目检，目检虽然检测方式灵活，可对各种不同的错误都能进行不同的判定。但由于产品数量大，品种多，人力消耗量大，并且长时间的检测会让人产生眼疲劳或受主观情绪影响而混淆和误判，这样也将导致不良品流出造成客诉。

而利用机器视觉检测技术，它可根据不同的产品材料和缺陷情况及客户的真实需求，通过采用不一样的光源跟不同的照射角度，及不同像素的相机，使产品的缺陷图像跟背景图像区分开，然后利用缺陷图像的颜色、灰度、形状、大小等来识别缺陷，通过图片效果采用不一样的算法进行软件编写，并结合客户的真实需求来对软件进行开发。

对产品进行高精度、高效率、高稳定的实时检测、分析、计算，判断产品是不是合格，能有效的提高生产流水线的检测速度和精度，大幅度的提升产量和质量，降低人力成本，同时防止因为人眼疲劳而产生的误判。

矩视智能专注于机器视觉技术，利用深度学习技术，自主学习各类工业场景中不一样的字符，包含数字、字母、文字等其他特殊字符，实现复杂环境下字符的高精度识别，并且识别速度快、准确率高。

根据具体问题具体分析，提出各类机器视觉技术OCR字符识别方案，较低成本地解决各类字符检测的技术问题。

自动过滤背景等干扰因素，如光照不均、倾斜、模糊等情况，避免误识别，拥超强抗干扰能力。

字符在图片中发生旋转，开启旋转框即可对任意角度字符进行标注和识别，无需任何代码开发，便捷且灵活。

瓶装标签上的字符会因瓶身弯曲产生一定变形，时常会有褶皱的情况出现，传统算法对曲面字体识别能力比较差，会出现漏检、错检等问题。

云平台拥有上千种字符模板，可以匹配各种不同形态的字符，对于弯曲字符也能够最终靠“先标注后训练”的方式来进行识别，此外对于特殊字符也可以准确识别。

金属零部件表面会受到环境或油污等影响，导致打光后的字符也会以不同灰度值的形式呈现，传统OCR算法在设置阈值参数时难以选择。

针对钢印类字符设计底层神经网络专用架构，突破了传统识别技术的瓶颈，不需要选取阈值，仅需简单的标注训练就可直接进行字符的定位与识别。

相机布置方式：相机固定在支架上，在产品待测面的正前方拍照，注意保持工作距离固定。

光源安装的地方：放置在镜头和产品中间，从斜上方照射字符位置补光，可结合实际调整位置。如果室内的现场环境光能够完全满足成像要求，也可以取消此光源。

通过矩视智能低代码平台标注训练样本图片，可以自动生成深度学习模型，能有效识别产品上的字符。如需调整或增加识别内容，可以采集新的图片样本训练模型。

如遇到字符倾斜，发生选择等情况，可开启“旋转框”即可对任意字符进行标注和识别。

软包装是食品包装主要展现形式，它可以有很大效果预防食品受到外来因素的损害。不仅如此，软包装还需印刷生产日期、保质期等重要信息，这一些信息必然的联系着食品的销售。

为解决软包装生产的全部过程中存在的问题，北京矩视智能科技有限公司提出基于深度学习的软包装表面OCR识别解决方案。

矩视智能低代码平台-OCR字符检测功能，能够对工件或产品上刻印的字符进行确认、辨别、判定的检测，完美做到对食品生产线产品的生产日期记录和追溯。根据指定检测字符，对字符进行标注，若有角度倾斜字符，可使用“旋转框”功能，针对倾斜角度旋转标注。

1）识别褶皱表面。深度学习检测可以准确识别包装上的三期、产地、批号等信息，且对包装本身形态无要求，表面褶皱部分的文字也能够准确识别；

2）避免反光干扰。识别时可将文字与背景分割开，完美解决人工检测、传统视觉检验测试过程中因包装表面反光、颜色多样导致视觉疲劳、识别难度大等问题；

3）准确率更高。深度学习系统只需人工进行简单的标注训练，即可自动学习缺陷类型，不要专业人员参与。随着样本的增多，识别准确率可无限趋近100%；

4）开发时间短。深度学习是对传统算法的升级，解决了传统解决方案打光难、算法开发时间长等难题，大幅度节省了生产成本；

5）释放劳动力。深度学习视觉检测可以将工人们从枯燥无味的工作中解放出来，释放更多劳动力。

在矩视智能低代码平台上对上传图片的“三期数字”内容部分逐一对应标注，标注结束后，无需配置模型训练参数与服务器资源，一键训练进入深度学习阶段，精准判断图片中三期数字部分信息特征。

经过适当训练的神经网络可以很好地识别出变量环境，钢印深浅、有无干扰项、纸盒褶皱等，经过测试，系统会精准判断图片中字符位置等信息，并进行自动标注。

矩视智能机器视觉低代码平台是一个面向机器视觉应用的云端协同开发平台，始终秉承0成本、0代码、0门槛、0硬件的产品理念。

平台以AI技术为核心，在机器视觉应用开发环节，为开发者提供图像采集、图像标注、算法开发、算法封装和应用集成的一站式完整工具链。覆盖字符识别、缺陷检验测试、目标定位、尺寸测量、3D测量、视频开发等上百项通用功能，致力于成为全世界用户量最多，落地场景最广泛的机器视觉低代码平台。

上一篇:4张狙击手视力测企图十秒内可以悉数找到有当特种兵的潜质！

下一篇:三菱电机联手HERE科技开发车道危险报警系统