# 通用手写体文字

版本 V1.0.0

# 1. 接口定义

# 1.1 接口

URL = http://ip:port/hex/ocrapi/handwritingocr

其中 ip 为部署机器的 ip 地址,port 为对应服务器的端口

# 1.2 描述

通用手写体OCR为用户提供图片内手写体文字的检测和识别服务,针对手写字体无规则、字迹潦草、模糊等特点进行识别能力的增强。可应用于银行、保险、金融等手写单据录入、教育行业笔记文档化等场景。

# 1.3 HTTP请求格式

# 1.3.1 请求参数

属性

参数名称

必选

类型

可选值

默认值

参数描述

image

url二选一

String

图像base64编码后的字符串,图像需是JPGPNGBMP其中之一的格式

url

image二选一

String

图片url地址,urlimage两者填一个即可,同时赋值时,则以url指定的图像作为输入

session_id

String

用户自定义的唯一会话id

可变

preprocess

Bool

false\true

true

预处理开关,功能是检测图片倾斜的角度,将原本倾斜的图片转正

rotate_180

Bool

false\true

true

旋转开关,主要是在图片检测和识别前,对颠倒的图片进行180度旋转,
便于检测和识别。功能在preprocess处理之后

detect_text

Bool

false\true

true

文本检测开关,关闭后可直接单行识别

side_detect_short

Int32

(0,1000]

1000

短边尺寸,检测前对图片进行缩放至最短边的最大尺寸

side_detect_long

Int32

(0,1500]

1500

长边尺寸,检测前对图片进行缩放至最长边的最大尺寸

box_layout

Bool

false\true

false

排版开关,功能是将原文本内容的排版输出更加合理(按照文本原来的段落顺序和阅读顺序输出)

ret_image

String

""

默认为空,如果填入"preprocess"字段就会返回预处理后的图像数据(使用base64加密后的字符串)

ret_candword

Bool

false\true

false

候选字开关,开启可返回识别时多个可能的候选字(每个候选字对应其置信度)

enable_location

Bool

false\true

false

单字宽高位置开关,开启可返回单字位置信息(xyweightheight

enable_coord_point

Bool

false\true

false

单字四点坐标开关,开启可返回图片中单字的四点坐标

recognize_maxtime

Int32

-1

设置识别超时时间(单位:ms,默认:-1,即对超时时间不做限制
当识别时间超过设置的时间,返回错误。该值小于0,不做限制。

enable_only_reg_hw

Bool

false\true

false

只返回手写内容(需要同时设置language=zh_hw_only

# 1.3.2 请求示例

{
  "image": 填写Base64编码后的图片数据,
  "session_id": 填写对应的session_id,
  "options":
  {
    "preprocess":true,
    "rotate_180":true,
    "side_detect_short":1000,
    "side_detect_long":1500,
    "ret_candword":true,
    "enable_location": true,
    "enable_coord_point": true
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14

# 1.3.3 返回参数

属性

参数

是否必然返回

类型

参数描述

errorcode

Int32

错误码

errormsg

string

错误码消息

session_id

string

相应请求的session标识符,可用于结果查询

   

angle

Float

图片旋转角度(角度制),文本的水平方向为0°;顺时针为正,逆时针为负

coordpoint

Object

文本行在原图中的四点坐标

itemstring

string

识别出的文本行字符串

itemconf

Float

文本行置信度

parag

Object

识别出来的文本行段落信息,包括段落编号parag_no,以及字体大小word_size

itemcoord

Object

文本行在旋转纠正之后的图像中的像素坐标,表示为(左上角x, 左上角y,宽width,高height

words

Array

识别出来的单字信息包括单字(包括单字Character和单字置信度confidence

coords

Array

单字在旋转纠正之后的图像中的像素坐标,表示为(左上角x, 左上角y,宽width,高height

candword

Array

候选字符集(包含候选字Character以及置信度Confidence

wordcoordpoint

Array

单字在原图中的四点坐标

# 1.3.4 返回示例

{
 "items": [{
    "itemstring": "独坐敬亭山",
    "wordcoordpoint": [{"x": [58,35,80,35,80,57,58,57]}],
    "itemconf": 0.9963534474372864,
    "coords": [{"y": 35,"x": 58,"height": 23,"width": 23}],
    "itemcoord": {
      "y": 37,
      "x": 57,
      "height": 19,
      "width": 98
    },
    "words":
    [{
        "confidence": 0.9999226331710815,
        "character": "独"
    }],
    "parag": {
      "parag_no": 0,
      "word_size": 16
    },
    "candword": [{
        "words": [{
            "confidence": 0.9999226331710815,
            "character": "独"
          }]
    "coordpoint":
    {
      "x": [18,130,211,130,211,150,18,150]
    }
  }]
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32

# 1.3.5 接口错误码说明

错误码

错误码消息

错误码说明

-5208

OCR_SERVER_INTERN_ERROR

服务器内部错误,初始化失败

-1102

SDK_IMAGE_DECODE_FAILED

图片解码失败

-9004

GLOCR_LANGUAGE_NOT_SUPPORT

不支持的语言

-9021

GLOCR_DETECT_BOX_EMPTY

未检测到文本

-9022

GLOCR_RECOG_TIMEOUT

识别超时

-9003

GLOCR_RECOG_FAILED

识别失败

上次更新: 2020-9-14 20:24:52