ocr识别文档,写入text如何分段

文字识别:将自然场景下图片上嘚文字内容通过定位和检测,智能识别为可编辑的文本信息

本文档主要针对需要集成文字识别 Android SDK 的开发工程师详细描述有道智云能力及集成过程。

如果您想快速体验服务建议您前往 或者在体验中心右下侧找到小程序二维码,扫描进行体验

如果您有与我们商务合作的需求,可以通过以下方式联系我们:

如果您对文档内容有任何疑问可以通过以下几种方式联系我们:

智云翻译技术交流QQ 1群: (已满)

智云翻譯技术交流QQ 2群: (已满)

智云翻译技术交流QQ 3群:

智云翻译技术交流QQ 4群:

智云技术交流QQ 1群: (已满)

智云语音技术交流QQ群:

本文档主要针对开发人员,接入测试前需要在后台创建API应用并绑定实例;如果您还没有,请按照 操作
平台向每个账户赠送50元的体验金,供用户集成前测试所用具体资费规则详见 。

文字识别 SDK是有道在线 接口服务进行封装支持在线文本识别。提供快速的接入方式;同时提供数据统计能力方便叻解用户使用情况。

开始集成SDK之前开发者需要登录 创建应用获取应用ID(或者通过运营人员获取应用ID),以便使用文字识别服务

<!-- 获取网絡信息状态,如当前的网络连接是否有效 -->

type:识别类型目前仅支持10012,表示按行识别

lanType:支持"zh-en"和"en"其中"zh-en"为中英识别,"en"参数表示只识别英文若為纯英文识别,"zh-en"的识别效果不如"en"请妥善选择

source:设置为app对应的名称(英文字符串)

注意:输入图片数据需要转换为Base64编码。

(2) 构造识别参数对潒

(3) 设置回调和开始识别

通过Imageecognizer设置上一步构造的参数对象,调用recognize方法传入图片base64编码的数据和回调接口开始查询

识别回调接口包含两个方法:onResult表示识别成功相关结果存储在result参数中,onError表示失败失败信息放在ErrorCode中。可参见

注意:整个识别是异步的,回调在子线程进行若涉及箌界面操作,请切回主线程

文字识别结果说明

对于中英在线 ,查询结果比较详细服务器返回数据如下所示:

服务器是按照区域,行芓的格式返回的,即一张图片,会识别出图片对应的 Result其上可能有多个有效区域 Region ,每个区域会包含一行或几行 Line 每个行又包含一个或多個字 Word ,每个区域和行或者字符都通过 boundingBox 字段返回坐标和大小

应用ID无效,注册账号登录后台创建应用和实例并完成绑定,可获得应用ID和应鼡密钥等信息
访问IP地址不在可访问IP列表
请求的接口与应用的平台类型不一致如有疑问请参考
因为时间戳无效导致签名校验失败
访问频率受限,请稍后访问
长请求过于频繁,请稍后访问
访问频率受限,请稍后访问
不支持的语音识别采样率
访问频率受限,请稍后访问
解密错误图片base64解密失败
不支持的语音识别 Language类型
访问频率受限(超过最大调用次数)
不支持的语音识别采样率
识别音频时长过长,最大支持30s
访问频率受限,請稍后访问

检查下是否对应的 so 是否放到当前工程目录下

检查下识别接口回调的错误信息,保证申请的应用ID是有效且提前绑定了

注册账號, 登录后台创建应用和实例并完成绑定 可获得应用ID和应用密钥等信息。

有道智云 Android SDK上线支持中英文在线文字识别
兼容多个包无法使用凊况

我要回帖

更多关于 ocr 的文章

 

随机推荐