廢話不多說,直接開幹!
首先安裝庫
pip install pytesseract
pip install PILLOW
然後按照tesseract程式下載安裝
tessercat下載地址:https://digi.bib.uni-mannheim.de/tesseract/ //請依據自己的作業系統下載exe檔案安裝
使用者變數,系統變數都新增:PATH C:\Program Files (x86)\Tesseract-OCR; //這是tesseract的安裝目錄
系統變數新增:TESSDATA_PREFIX C:\Program Files (x86)\Tesseract-OCR
//有的博文寫到「TESSDATA_PREFIX」目錄需要到tessdata,但是我電腦設定到tessdata就會多一級tessdata目錄,命令測試時會找不到,所以這裡自己依據偵錯哪個OK用哪個~
再找到pytesseract.py檔案
修改新增tesseract.exe
tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'
#! -*- coding:utf-8 -*-
import pytesseract
from PIL import Image
im=Image.open('D:/py3.8/src/商標/8.jpg')
code = pytesseract.image_to_string(im).strip()
print('驗證碼識別結果:'+code)
print(type(code))
if(code =='51188'):
print('ok')
# print(pytesseract.image_to_string(im))
執行結果
驗證碼識別結果:51188
<class 'str'>
ok
Process finished with exit code 0
只能識別部分驗證碼,加條線,下劃線好像不行!