不懂先生

基于python的OCR(文字识别)
序言为了维修登记系统能够在我生日当天正式使用,这几天一直在赶进度(忘记了学习),昨天做了纸质登记表查看功能,但是检...
扫描右侧二维码阅读全文
05
2022/04

基于python的OCR(文字识别)

序言

为了维修登记系统能够在我生日当天正式使用,这几天一直在赶进度(忘记了学习),昨天做了纸质登记表查看功能,但是检索起来很鸡肋,学长提了个建议,把纸质的登记表文字识别并存入数据库,特意给我开了一个接口,于是一个基于python的OCR就诞生了。

功能

它实现的功能是遍历一个文件夹内所有的图片,并将图片转换成二进制通过post请求对应的接口,实现文字识别,将返回值存入数据库对应图片名称的pagetext字段。

代码

# -*-coding:utf-8 -*-
# 作者:不懂先生
# 日期: 2021/4/4
import os
import requests
import pymysql
url = "https://xxx"
filepath = 'D:\code\python\上传图片\'
# 改变工作文件夹
os.chdir(filepath)
# 遍历改文件夹所有的文件,并for循环
for name in os.listdir(filepath):
    fileName = name
    print(fileName)
    img = open(fileName, 'rb')
    file = {'file': (fileName, img, 'Content-Type: image/jpg')}
    try:
        result = requests.post(url,  files=file)
        print(result.text)
        conn = pymysql.connect(host='localhost', user='xxx', password='xxx', database='xxx')
        # 3、创建游标对象
        cur = conn.cursor()
        # 4、使用游标对象执行SQL语句
        sql = "update old_weixiu set pagetext = '%s'  where savename like '%s'" % (result.text,fileName)
        try:
            result = cur.execute(sql)
            conn.commit()
        except:
            conn.rollback()
        conn.close()
    except Exception as e:
        print(e)
    finally:
        img.close()

效果

91607-ukplyd9a9m.png

Last modification:April 5th, 2022 at 02:49 pm

Leave a Comment