mangguobang
2018-01-16 10:39:39
python3实现获取图片中的文字含中文
一、运行环境
(1) win10
(2) pycharm
(3) python 3.5
(4) pip3 install pillow
pip3 install pytesseract
(5) 识别引擎tesseract-ocr ,下载之后解压安装,下载地址:http://download.csdn.net/download/huxiangen/10170075
二、 运行代码
# -*- coding: utf-8 -*- from PIL import Image import pytesseract #上面都是导包,只需要下面这一行就能实现图片文字识别 text=pytesseract.image_to_string(Image.open('show.jpg'),lang='chi_sim') #设置为中文文字的识别 #text=pytesseract.image_to_string(Image.open('test.png'),lang='eng') #设置为英文或阿拉伯字母的识别 print(text)
三、报错解决
1.FileNotFoundError:[WinError 2]系统找不到指定文件。
解决办法:
打开文件pytesseract.py,找到如下代码,将tesseract_cmd的值修改为全路径,再次使用就不会报这个错了。
tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'
2.pytesseract.pytesseract.TesseractError:(1,'Error opening data file\\Progr
解决办法:
打开文件pytesseract.py,找到image_to_string,指定config的参数,如下:
tessdata_dir_config = '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"' def image_to_string(image, lang=None, boxes=False, config=tessdata_dir_config):
评论
最近浏览
qazxsw12QW
2021年6月15日
暂无贡献等级
SXberc LV1
2020年12月16日
2996321909 LV1
2020年9月18日
Commuovere LV1
2020年7月21日
275239212 LV1
2020年5月22日
asdsasddas LV6
2019年7月2日
zivjqzuidaima LV1
2019年1月16日
sjjsjjs LV6
2018年6月14日
CGmatt LV9
2018年6月5日
ysdy001 LV2
2018年5月2日