1. 简介
1.1 字段简介
文字识别也叫 OCR(optical Character Recognition,光学字符识别)是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
简而言之,就是将图片上的字符信息转换为可编辑的文字内容。搭贝提供的「文字识别」字段支持通用文字、身份证、增值税发票、营业执照、驾驶证、行驶证、银行卡以及火车票的识别,只需简单配置,即可实现强大的文字转换处理。
1.2 应用场景
- 银行身份认证场景中,只需提交身份证信息,OCR 就能自动识别出身份证上的姓名、性别、地址等信息并填报到系统中;
- 在企业资质审核场景中,通过上传营业执照,OCR 将营业执照的注册号、企业名称等信息识别出并填报到系统中,再通过营业执照校验接口,自动完成企业资质校验。
2. 操作步骤
2.1 识别配置
1)首先,在表单中添加「文字识别」字段:
![]() |
|---|
注:
- 文字识别字段支持在主表中添加,也支持在子表单中添加。
- 当组件添加在明细表中时,可批量上传图片,进行批量识别,减少操作
2)添加好字段后选择需要识别的内容进行配置,搭贝支持以下内容的 OCR 识别:通用文字/身份证/增值税发票/营业执照/驾驶证/行驶证/银行卡/火车票。
![]() |
|---|
3)确认需要识别的内容后,根据内容设置识别规则。
![]() |
|---|
2.2 发票验真
发票在进行识别的时候支持验真,可判断发票的 真伪、是否 已作废、是否 已红冲。
操作步骤:
1、在「文字识别 >> 字段属性」中开启 “启用发票验真”,在设置识别规则的时候把“发票状态”对应好表单的文本字段。
2、在上传发票之后,系统会把发票的状态回写到对应字段,即:正常、已作废、已红冲。
![]() |
|---|
使用说明:
- 系统使用的是华为的文字识别功能,会有一定的费用产生,所以使用此功能的用户需要购买验真次数,具体价格可联系搭贝服务人员。
- 如果是识别图片里的发票,请一定保证一张图片中只有一个发票,并保证发票清晰。
- 每份发票每天最多可查验5次。可查验最近5年内(国家税务总局)增值税发票管理系统开具的发票。
- 税务局数据同步有时延,建议当天新开的发票在24小时后查询。
3. 注意事项
1)OCR 识别后不论是否储存原文件,都将消耗附件量。(附件量指的是附件流量,上传即消耗)
2)OCR 识别非 100% 精准,目前市面上的接口均无法保证 100% 识别,上传的内容越清晰越容易被识别。目前我们调用的是华为 OCR 识别接口,具体技术限制还可以参考华为官方文件。
3)付费版本免费提供200次识别,OCR次数消耗完之后,需额外购买,具体价格可在服务群中咨询服务人员。



