# 高精度文字识别
版本 V1.0.0
# 1. 接口定义
# 1.1 接口
URL = “ http://ip:port/hex/ocrapi/hpgeneralocr ”
其中 ip 为部署机器的 ip 地址,port 为对应服务器的端口
# 1.2 描述
高精度文字识别基于业界领先的深度学习技术,为用户提供图片中文字识别服务。
# 1.3 HTTP请求格式
# 1.3.1 请求参数
属性 | 参数名称 | 必选 | 类型 | 参数描述 |
固 定 列 | image | 和url二选一 | String | 图像base64编码后的字符串,图像需是JPG、PNG、BMP其中之一的格式 |
| url | 和image二选一 | String | 图片url地址,url与image两者填一个即可,同时赋值时,则以url指定的图像作为输入 |
| session_id | 否 | String | 用户自定义的唯一会话id |
# 1.3.2 请求示例
Request:
{
"app_id": 填写对应的app_id,
"image": 填写Base64编码后的图片数据,
"session_id": 填写对应的session_id
}
2
3
4
5
6
# 1.3.3 返回参数
属性 | 参数 | 是否必然返回 | 类型 | 参数说明 |
固 定 列 | errorcode | 是 | Int32 | 错误码 |
errormsg | 是 | string | 错误码消息 | |
session_id | 否 | string | 相应请求的session标识符,可用于结果查询 | |
可 变 | itemstring | 是 | string | 识别出的字段名称对应的值,也就是字段item对应的字符串结果 |
itemconf | 是 | Float | 置信度 | |
itemcoord | 是 | Object | 文本行在旋转纠正之后的图像中的像素坐标,表示为(左上角x, 左上角y,宽width,高height) | |
coordpoint | 是 | Object | 文本行在原图中的四点坐标 | |
parag | 是 | Object | 识别出来的文本行段落信息,包括段落编号parag_no,以及字体大小word_size | |
words | 是 | Array | 识别出来的单字信息包括单字(包括单字Character和单字置信度confidence) | |
coords | 是 | Array | 单字在旋转纠正之后的图像中的像素坐标,表示为(左上角x, 左上角y,宽width,高height) | |
candword | 是 | Array | 候选字符集(包含候选字Character以及置信度Confidence) | |
wordcoordpoint | 是 | Array | 单字在原图中的四点坐标 |
# 1.3.4 返回示例
Response:
{
"angle": 0,
"errormsg": "OK",
"errorcode": 0,
"items":
[{
"itemstring": "STRAY",
"itemconf": 0.9655953645706177,
"itemcoord":
{
"y": 575,
"x": 743,
"height": 17,
"width": 103
},
"words":
[{
"confidence": 0.919134795665741,
"character": "S"
}],
"parag":
{
"parag_no": 5,
"word_size": 13
},
"candword":
[{
"words":
[{
"confidence": 0.9994702935218811,
"character": "腾"
}]
"coordpoint":
{
"x": [743, 575, 845, 575, 845, 591, 743, 591]
}
}]
}]
}
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
# 1.3.5 接口错误码说明
错误码 | 错误码消息 | 错误码说明 |
---|---|---|
-5208 | OCR_SERVER_INTERN_ERROR | 服务器内部错误 |
-1102 | SDK_IMAGE_DECODE_FAILED | 图片解码失败 |
-9004 | GLOCR_LANGUAGE_NOT_SUPPORT | 不支持的语言 |
-9021 | GLOCR_DETECT_BOX_EMPTY | 未检测到文本 |
-9022 | GLOCR_RECOG_TIMEOUT | 识别超时 |
-9003 | GLOCR_RECOG_FAILED | 识别失败 |