python如何提取图片中的文字
要提取图片中的文字,可使用Python的第三方库tesseract-ocr。Tesseract是一个开源的OCR引擎,可以辨认多种语言的文字。
首先,安装tesseract-ocr库和pytesseract库:
```
pip install tesseract-ocr
pip install pytesseract
```
然后,使用以下代码提取图片中的文字:
```python
import pytesseract
from PIL import Image
# 打开图片
image = Image.open('image.jpg')
# 使用tesseract辨认图片中的文字
text = pytesseract.image_to_string(image)
# 打印辨认结果
print(text)
```
以上代码将会打开名为image.jpg的图片,使用tesseract-ocr辨认图片中的文字,并将辨认结果打印出来。
请注意,要使代码正常运行,需要确保tesseract-ocr已正确安装,并且指定的图片文件存在,并且包括清晰可见的文字。有时候,对复杂的图片或低质量的图片,辨认结果可能不准确。
TOP