# 高精度文字识别

版本 V1.0.0

# 1. 接口定义

# 1.1 接口

URL = “ http://ip:port/hex/ocrapi/hpgeneralocr ”

其中 ip 为部署机器的 ip 地址,port 为对应服务器的端口

# 1.2 描述

高精度文字识别基于业界领先的深度学习技术,为用户提供图片中文字识别服务。

# 1.3 HTTP请求格式

# 1.3.1 请求参数

属性

参数名称

必选

类型

参数描述

固 定 列

image

和url二选一

String

图像base64编码后的字符串,图像需是JPG、PNG、BMP其中之一的格式

 

url

和image二选一

String

图片url地址,url与image两者填一个即可,同时赋值时,则以url指定的图像作为输入

 

session_id

String

用户自定义的唯一会话id

# 1.3.2 请求示例

Request:
{
 "app_id": 填写对应的app_id,
 "image": 填写Base64编码后的图片数据,
 "session_id": 填写对应的session_id
}
1
2
3
4
5
6

# 1.3.3 返回参数

属性

参数

是否必然返回

类型

参数说明

固 定 列

errorcode

Int32

错误码

errormsg

string

错误码消息

session_id

string

相应请求的session标识符,可用于结果查询

可    变

itemstring

string

识别出的字段名称对应的值,也就是字段item对应的字符串结果

itemconf

Float

置信度

itemcoord

Object

文本行在旋转纠正之后的图像中的像素坐标,表示为(左上角x, 左上角y,宽width,高height)

coordpoint

Object

文本行在原图中的四点坐标

parag

Object

识别出来的文本行段落信息,包括段落编号parag_no,以及字体大小word_size

words

Array

识别出来的单字信息包括单字(包括单字Character和单字置信度confidence)

coords

Array

单字在旋转纠正之后的图像中的像素坐标,表示为(左上角x, 左上角y,宽width,高height)

candword

Array

候选字符集(包含候选字Character以及置信度Confidence)

wordcoordpoint

Array

单字在原图中的四点坐标

# 1.3.4 返回示例

Response:
{
  "angle": 0,
  "errormsg": "OK",
  "errorcode": 0,
  "items":
  [{
      "itemstring": "STRAY",
      "itemconf": 0.9655953645706177,
      "itemcoord":
      {
        "y": 575,
        "x": 743,
        "height": 17,
        "width": 103
      },
      "words":
      [{
          "confidence": 0.919134795665741,
          "character": "S"
      }],
      "parag":
      {
          "parag_no": 5,
          "word_size": 13
        },
      "candword":
        [{
          "words":
          [{
            "confidence": 0.9994702935218811,
            "character": "腾"
          }]
        "coordpoint":
          {
            "x": [743, 575, 845, 575, 845, 591, 743, 591]
          }
        }]
  }]
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

# 1.3.5 接口错误码说明

错误码 错误码消息 错误码说明
-5208 OCR_SERVER_INTERN_ERROR 服务器内部错误
-1102 SDK_IMAGE_DECODE_FAILED 图片解码失败
-9004 GLOCR_LANGUAGE_NOT_SUPPORT 不支持的语言
-9021 GLOCR_DETECT_BOX_EMPTY 未检测到文本
-9022 GLOCR_RECOG_TIMEOUT 识别超时
-9003 GLOCR_RECOG_FAILED 识别失败
上次更新: 2022-11-29 17:50:55