# 财务票据混贴识别

版本 V1.1.0

# 1. 接口定义

# 1.1 接口

URL = http://ip:port/hex/ocrapi/invoiceocr_mixed

其中 ip 为部署机器的 ip 地址,port 为对应服务器的端口

# 1.2 描述

财务票据混贴识别服务支持多张、多类票据一次混合识别,系统自动完成多种票据的切割和识别,适用于财务报销,发票验证,个人账单管理等多种场景。

# 1.3 HTTP请求格式

# 1.3.1 请求参数

属性

参数名称

必选

类型

可选值

默认值

参数描述

image

url二选一

String

图像base64编码后的字符串,图像需是JPGPNGBMP其中之一的格式

url

image二选一

String

图片url地址,urlimage两者填一个即可,同时赋值时,则以url指定的图像作为输入

session_id

String

用户自定义的唯一会话id

 

type_list

Int Array

0,1,2,3,5,8,9,10,11,12,13

默认识别可选值范围中列出的标号对应的所有票据;type_list=[0,1,2],支持识别列表中编号对应的票据类型,并返回识别结果,不在此列表中的只返回票据类型。对应类型如下:
0: 出租车票
1: 定额发票
2: 火车票
3: 增值税发票
5: 机票行程单
8: 通用机打发票
9: 客运发票
10: 轮船票
11: 增值税发票(卷票)
12: 机动车销售统一发票
13: 过路费发票

enable_pdf_recognize

 

Bool

false\true

true

是否开启pdf识别,默认开启

pdf_page_index

Int32

[0,正无穷)

0

pdf页码,从0开始,默认为0

ret_image

 

Bool

false\true

true

是否返回各票据的单张切图,默认返回

# 1.3.2 请求示例

{
  "image": 填写Base64编码后的图片数据,
  "session_id": 填写对应的session_id
}
1
2
3
4

# 1.3.3 返回参数

属性

参数

是否必然返回

类型

参数说明

errorcode

Int32

错误码

errormsg

string

错误码消息

session_id

string

相应请求的session标识符,可用于结果查询

mixed_items

items_list

errorcode

Int32

单张图片请求错误码

errormsg

string

单张图片请求的错误码信息

type

string

识别出的图片从属的财务票据类型,type值类型对应如下:

type=-1,未知类型
type=0,出租车票
type=1,定额发票
type=2,火车票
type=3,增值税发票
type=4,客运限额发票
type=5,机票行程单
type=6,酒店账单
type=7,购置税发票/完税证明
type=8,通用机打发票
type=9,客运发票
type=10,轮船票
type=11,增值税发票(卷票)
type=12,机动车销售统一发票
type=13,过路费发票
type=14,购物小票

location

Object

单张票据在混贴图片中的像素坐标,表示为(左上角x, 左上角y,宽width,高height

angle

Float

单张图片在混贴图片中的角度

items

item

String

单张图片识别出的字段名称(关键字)

itemstring

String

单张图片识别出的字段名称对应的值,也就是字段item对应的字符串结果

itemconf

Float

对应字段的置信度

itemcoord

Object

单张票据旋转纠正后的文本行坐标,表示为(左上角x, 左上角y,宽width,高height

col

Int32

字段属于第几列,用于相同字段的排版(默认值为-1,表示无列排版)

row

Int32

字段属于第几行,用于相同字段的排版(默认值为-1,表示无列排版)

# 1.3.4 返回示例

{
  "session_id": "",
  "errorcode": 0,
  "errormsg": "",
  "mixed_items": {
    "items_list": [
      {
        "angle": 0,
        "errormsg": "OK",
        "errorcode": 0,
        "location": {
            "y": 9,
            "x": 520,
            "height": 454,
            "width": 541
        },
        "items": [
          {
            "itemstring": "144011782217",
            "wordcoordpoint": [

            ],
            "item": "发票代码",
            "itemconf": 0.8212594985961914,
            "coords": [

            ],
            "itemcoord": {
                "y": 146,
                "x": 213,
                "height": 22,
                "width": 195
            },
            "words": [

            ],
            "candword": [

            ],
            "col": -1,
            "row": -1
          }
        ],
        "type": 13
      },
      {
        "angle": 0,
        "errormsg": "OK",
        "errorcode": 0,
        "location": {
            "y": 10,
            "x": 19,
            "height": 1181,
            "width": 494
        },
        "items": [
          {
            "itemstring": "14547954",
            "wordcoordpoint": [

            ],
            "item": "发票号码",
            "itemconf": 0.9803304672241211,
            "coords": [

            ],
            "itemcoord": {
                "y": 238,
                "x": 25,
                "height": 25,
                "width": 242
            },
            "words": [

            ],
            "candword": [

            ],
            "col": -1,
            "row": -1
          }
        ],
        "type": 11
      }
    ]
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87

# 1.3.5 接口错误码说明

错误码

错误码消息

错误码说明

-5208

OCR_SERVER_INTERN_ERROR

服务器内部错误

-1102

SDK_IMAGE_DECODE_FAILED

图片解码失败

-1400

ERROR_OCR_TEMPLATE_NOT_MATCH

模板不匹配

-9003

GLOCR_RECOG_FAILED

识别失败

-9907

OCR_ERROR_PDF_PAGE_INDEX

pdf页码超出范围

上次更新: 2023-11-1 15:25:09