# 高精度文字识别
版本 V1.0.0
# 1. 接口定义
# 1.1 接口
URL = “ http://ip:port/hex/ocrapi/hpgeneralocr ”
其中 ip 为部署机器的 ip 地址,port 为对应服务器的端口
# 1.2 描述
高精度文字识别基于业界领先的深度学习技术,为用户提供图片中文字识别服务。
# 1.3 HTTP请求格式
# 1.3.1 请求参数
| 属性 | 参数名称 | 必选 | 类型 | 参数描述 | 
| 固 定 列 | image | 和url二选一 | String | 图像base64编码后的字符串,图像需是JPG、PNG、BMP其中之一的格式 | 
| 
 | url | 和image二选一 | String | 图片url地址,url与image两者填一个即可,同时赋值时,则以url指定的图像作为输入 | 
| 
 | session_id | 否 | String | 用户自定义的唯一会话id | 
# 1.3.2 请求示例
Request:
{
 "app_id": 填写对应的app_id,
 "image": 填写Base64编码后的图片数据,
 "session_id": 填写对应的session_id
}
2
3
4
5
6
# 1.3.3 返回参数
| 属性 | 参数 | 是否必然返回 | 类型 | 参数说明 | 
| 固 定 列 | errorcode | 是 | Int32 | 错误码 | 
| errormsg | 是 | string | 错误码消息 | |
| session_id | 否 | string | 相应请求的session标识符,可用于结果查询 | |
| 可 变 | itemstring | 是 | string | 识别出的字段名称对应的值,也就是字段item对应的字符串结果 | 
| itemconf | 是 | Float | 置信度 | |
| itemcoord | 是 | Object | 文本行在旋转纠正之后的图像中的像素坐标,表示为(左上角x, 左上角y,宽width,高height) | |
| coordpoint | 是 | Object | 文本行在原图中的四点坐标 | |
| parag | 是 | Object | 识别出来的文本行段落信息,包括段落编号parag_no,以及字体大小word_size | |
| words | 是 | Array | 识别出来的单字信息包括单字(包括单字Character和单字置信度confidence) | |
| coords | 是 | Array | 单字在旋转纠正之后的图像中的像素坐标,表示为(左上角x, 左上角y,宽width,高height) | |
| candword | 是 | Array | 候选字符集(包含候选字Character以及置信度Confidence) | |
| wordcoordpoint | 是 | Array | 单字在原图中的四点坐标 | 
# 1.3.4 返回示例
Response:
{
  "angle": 0,
  "errormsg": "OK",
  "errorcode": 0,
  "items":
  [{
      "itemstring": "STRAY",
      "itemconf": 0.9655953645706177,
      "itemcoord":
      {
        "y": 575,
        "x": 743,
        "height": 17,
        "width": 103
      },
      "words":
      [{
          "confidence": 0.919134795665741,
          "character": "S"
      }],
      "parag":
      {
          "parag_no": 5,
          "word_size": 13
        },
      "candword":
        [{
          "words":
          [{
            "confidence": 0.9994702935218811,
            "character": "腾"
          }]
        "coordpoint":
          {
            "x": [743, 575, 845, 575, 845, 591, 743, 591]
          }
        }]
  }]
}
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
# 1.3.5 接口错误码说明
| 错误码 | 错误码消息 | 错误码说明 | 
|---|---|---|
| -5208 | OCR_SERVER_INTERN_ERROR | 服务器内部错误 | 
| -1102 | SDK_IMAGE_DECODE_FAILED | 图片解码失败 | 
| -9004 | GLOCR_LANGUAGE_NOT_SUPPORT | 不支持的语言 | 
| -9021 | GLOCR_DETECT_BOX_EMPTY | 未检测到文本 | 
| -9022 | GLOCR_RECOG_TIMEOUT | 识别超时 | 
| -9003 | GLOCR_RECOG_FAILED | 识别失败 | 
