一、场景介绍

本章节SDK业务场景主要面向文字识别/图像文字识别、发票识别及身份证识别

二、新建应用

业务场景:识别网络图片并把图片中文字写入到excel中

视频案例:



源码分享:

import ocr
def start():
    #打开一个excel文件
    xls = rpa.excel.open(file = r'\\Mac\Home\Desktop\test.xlsx',visible = True)
    sheet = xls.get_sheet()
    #序列号
    sheet.set_col_width(col = 'A',width = '6')
    #写入A1 字段为序列号
    sheet.write(range = 'A1',value = '序列号')
    #写入B1 字段为识别内容
    sheet.write(range = 'B1',value = '识别内容')
    #设置列宽度
    sheet.set_col_width(col = 'B',width = '65')
    count = 1
    for i in range(1,4):
        #本地图片 动态变化
        image_path = r'\\Mac\Home\Desktop\批量识别网络图片\网络图片00'+str(i)+'.jpg'
        #app_code 填写自己在阿里云注册的号
        text = ocr.text(image_path,app_code='xxxxxxxxxxxxxxxxxxxx')
        sheet.write(range = 'A'+str(count),value = str(i))
        sheet.write(range = 'B'+str(count),value = text)
        count+=1
        rpa.logger.info(text)
    
    
    xls.save()


三、代码编写

1、text 文字/图片文字识别

阿里云ocr

import ocr
def start():
    #图片支持本地或网络图片
    image_path = ''
    #app_code 填写自己在阿里云注册的号
    text = ocr.text(image_path,app_code='xxxxxxxxxxxxxxxxxxxxxx')
    rpa.logger.info(text)


有关app_code:


  1. 如何购买
  2. ocr够买链接如下:https://market.aliyun.com/products/57124001/cmapi023866.html
  3. 如何查看


import ocr
def start():
    #图片支持本地或网络图片
    image_path = ''
    #google开源ocr
    text = ocr.text(image_path,'google')
    rpa.logger.info(text)


2、invoice发票识别


import ocr
def start():
    #本地或网络发票图片路径
    #app_code替换成自己的
    file_path = r"xxxxxxx"
    result = ocr.invoice(file_path,app_code='xxxxxxxxxx')
    #rpa.logger.info(result)
    rpa.logger.info(result["受票方名称"])
    rpa.logger.info(result["发票税额"])
    rpa.logger.info(result["开票日期"])
    rpa.logger.info(result["发票代码"])


发票识别,识别结果包括的信息:

发票代码,发票号码,开票日期,校验码,发票金额,发票税额,不含税金额,受票方名称,

受票方税号,受票方地址、电话,受票方开户行、账号,销售方名称,销售方税号,销售方地址、电话,销售方开户行、账号


发票app_code购买链接:https://market.aliyun.com/products/57124001/cmapi027758.html