基于python的OCR（文字识别）

序言

为了维修登记系统能够在我生日当天正式使用，这几天一直在赶进度（~~忘记了学习~~），昨天做了纸质登记表查看功能，但是检索起来很鸡肋，学长提了个建议，把纸质的登记表文字识别并存入数据库，特意给我开了一个接口，于是一个基于python的OCR就诞生了。

功能

它实现的功能是遍历一个文件夹内所有的图片，并将图片转换成二进制通过post请求对应的接口，实现文字识别，将返回值存入数据库对应图片名称的pagetext字段。

代码

# -*-coding:utf-8 -*-
# 作者：不懂先生
# 日期: 2021/4/4
import os
import requests
import pymysql
url = "https://xxx"
filepath = 'D:\code\python\上传图片\'
# 改变工作文件夹
os.chdir(filepath)
# 遍历改文件夹所有的文件，并for循环
for name in os.listdir(filepath):
    fileName = name
    print(fileName)
    img = open(fileName, 'rb')
    file = {'file': (fileName, img, 'Content-Type: image/jpg')}
    try:
        result = requests.post(url,  files=file)
        print(result.text)
        conn = pymysql.connect(host='localhost', user='xxx', password='xxx', database='xxx')
        # 3、创建游标对象
        cur = conn.cursor()
        # 4、使用游标对象执行SQL语句
        sql = "update old_weixiu set pagetext = '%s'  where savename like '%s'" % (result.text,fileName)
        try:
            result = cur.execute(sql)
            conn.commit()
        except:
            conn.rollback()
        conn.close()
    except Exception as e:
        print(e)
    finally:
        img.close()

基于python的OCR（文字识别）

序言

功能

代码

效果

Leave a Comment Cancel reply

typecho全站添加ssl

layui实现向子页面传值

基于pyautogui的健康上报程序

web后端实践（修补学校oj的分页bug）

一次通宵修漏洞经历

re正则提取

课表更新（增加了返回顶部按钮和图片懒加载）

matlab安装

解决pycharm终端无法运行问题

web后端实践（修补学校oj的分页bug）