Python識別驗證碼

2020-09-29 11:01:08

廢話不多說,直接開幹!
首先安裝庫

pip install pytesseract
pip install PILLOW

然後按照tesseract程式下載安裝

tessercat下載地址:https://digi.bib.uni-mannheim.de/tesseract/ //請依據自己的作業系統下載exe檔案安裝

使用者變數,系統變數都新增:PATH C:\Program Files (x86)\Tesseract-OCR; //這是tesseract的安裝目錄
系統變數新增:TESSDATA_PREFIX C:\Program Files (x86)\Tesseract-OCR
//有的博文寫到「TESSDATA_PREFIX」目錄需要到tessdata,但是我電腦設定到tessdata就會多一級tessdata目錄,命令測試時會找不到,所以這裡自己依據偵錯哪個OK用哪個~
在這裡插入圖片描述

再找到pytesseract.py檔案
修改新增tesseract.exe

 tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'

在這裡插入圖片描述

#! -*- coding:utf-8 -*-

import pytesseract
from PIL import Image
im=Image.open('D:/py3.8/src/商標/8.jpg')
code = pytesseract.image_to_string(im).strip()
print('驗證碼識別結果:'+code)
print(type(code))
if(code =='51188'):
    print('ok')
# print(pytesseract.image_to_string(im))

執行結果

驗證碼識別結果:51188
<class 'str'>
ok

Process finished with exit code 0

只能識別部分驗證碼,加條線,下劃線好像不行!