序言
为了维修登记系统能够在我生日当天正式使用,这几天一直在赶进度(忘记了学习),昨天做了纸质登记表查看功能,但是检索起来很鸡肋,学长提了个建议,把纸质的登记表文字识别并存入数据库,特意给我开了一个接口,于是一个基于python的OCR就诞生了。
功能
它实现的功能是遍历一个文件夹内所有的图片,并将图片转换成二进制通过post请求对应的接口,实现文字识别,将返回值存入数据库对应图片名称的pagetext字段。
代码
# -*-coding:utf-8 -*-
# 作者:不懂先生
# 日期: 2021/4/4
import os
import requests
import pymysql
url = "https://xxx"
filepath = 'D:\code\python\上传图片\'
# 改变工作文件夹
os.chdir(filepath)
# 遍历改文件夹所有的文件,并for循环
for name in os.listdir(filepath):
fileName = name
print(fileName)
img = open(fileName, 'rb')
file = {'file': (fileName, img, 'Content-Type: image/jpg')}
try:
result = requests.post(url, files=file)
print(result.text)
conn = pymysql.connect(host='localhost', user='xxx', password='xxx', database='xxx')
# 3、创建游标对象
cur = conn.cursor()
# 4、使用游标对象执行SQL语句
sql = "update old_weixiu set pagetext = '%s' where savename like '%s'" % (result.text,fileName)
try:
result = cur.execute(sql)
conn.commit()
except:
conn.rollback()
conn.close()
except Exception as e:
print(e)
finally:
img.close()