关于python验证码识别库,网上主要介绍的为pytesser及pytesseract,其实pytesser的安装有一点点麻烦,所以这里我不考虑,直接使用后一种库。
要安装pytesseract库,必须先安装其依赖的PIL及tesseract-ocr,其中PIL为图像处理库,而后面的tesseract-ocr则为google的ocr识别引擎。
1、Pillow 下载地址:[ 见导航栏 ]
3.4中只能使用pillow,使用方法基本和PIL没有什么区别。
2、tesseract-ocr下载地址: [ 见导航栏 ]
3、pytesseract安装 [ 见导航栏 ]
直接使用pip install pytesseract安装即可,或者使用easy_install pytesseract
import pytesseract from PIL import Image image = Image.open('vcode.png') vcode = pytesseract.image_to_string(image) print (vcode)
识别率还挺高的,当然这也和验证码本身有关,因为这个验证码设计的比较容易识别,别用来干坏事哦