OCR识别

爱搭贝
更新于2025-05-12

1. 简介

1.1 字段简介

文字识别也叫 OCR(optical Character Recognition,光学字符识别)是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

简而言之,就是将图片上的字符信息转换为可编辑的文字内容。搭贝提供的「文字识别」字段支持通用文字、身份证、增值税发票、营业执照、驾驶证、行驶证、银行卡以及火车票的识别,只需简单配置,即可实现强大的文字转换处理。

1.2 应用场景

  • 银行身份认证场景中,只需提交身份证信息,OCR 就能自动识别出身份证上的姓名、性别、地址等信息并填报到系统中;
  • 在企业资质审核场景中,通过上传营业执照,OCR 将营业执照的注册号、企业名称等信息识别出并填报到系统中,再通过营业执照校验接口,自动完成企业资质校验。


2. 操作步骤

2.1 识别配置

1)首先,在表单中添加「文字识别」字段:

文字识别--添加@1x.png

注:

  • 文字识别字段支持在主表中添加,也支持在子表单中添加。
  • 当组件添加在明细表中时,可批量上传图片,进行批量识别,减少操作

2)添加好字段后选择需要识别的内容进行配置,搭贝支持以下内容的 OCR 识别:通用文字/身份证/增值税发票/营业执照/驾驶证/行驶证/银行卡/火车票。

文字识别--设置@1x.png

3)确认需要识别的内容后,根据内容设置识别规则。

文字识别--设置规则@1x.png

2.2 发票验真

发票在进行识别的时候支持验真,可判断发票的 真伪、是否 已作废、是否 已红冲

操作步骤:

1、在「文字识别 >> 字段属性」中开启 “启用发票验真”,在设置识别规则的时候把“发票状态”对应好表单的文本字段。

2、在上传发票之后,系统会把发票的状态回写到对应字段,即:正常、已作废、已红冲。

发票验真@1x.png

使用说明:

  • 系统使用的是华为的文字识别功能,会有一定的费用产生,所以使用此功能的用户需要购买验真次数,具体价格可联系搭贝服务人员。
  • 如果是识别图片里的发票,请一定保证一张图片中只有一个发票,并保证发票清晰。
  • 每份发票每天最多可查验5次。可查验最近5年内(国家税务总局)增值税发票管理系统开具的发票。
  • 税务局数据同步有时延,建议当天新开的发票在24小时后查询。


3. 注意事项

1)OCR 识别后不论是否储存原文件,都将消耗附件量。(附件量指的是附件流量,上传即消耗)

2)OCR 识别非 100% 精准,目前市面上的接口均无法保证 100% 识别,上传的内容越清晰越容易被识别。目前我们调用的是华为 OCR 识别接口,具体技术限制还可以参考华为官方文件。

3)付费版本免费提供200次识别,OCR次数消耗完之后,需额外购买,具体价格可在服务群中咨询服务人员。