新闻资讯

质量为本、客户为根、勇于拼搏、务实创新

< 返回新闻资讯列表

PaddleOCR如何对大量图片进行批量文本识别,paddleocr怎么样

发布时间:2024-04-07 17:27:37

PaddleOCR如何对大量图片进行批量文本辨认

PaddleOCR可以通过编写简单的Python脚本来实现对大量图片进行批量文本辨认。以下是一个示例代码,演示怎样使用PaddleOCR对指定目录下的所有图片进行批量文本辨认:

import os
from paddleocr import PaddleOCR, draw_ocr

ocr = PaddleOCR()

# 指定需要辨认文本的图片目录
img_dir = 'path/to/your/image/directory'

# 获得目录下所有图片文件名
img_files = [f for f in os.listdir(img_dir) if f.endswith('.jpg') or f.endswith('.png')]

for img_file in img_files:
    img_path = os.path.join(img_dir, img_file)
    result = ocr.ocr(img_path, cls=True)

    for line in result:
        print('Detected text:', ''.join([word[0] for word in line[1]]))
        print('Confidence:', line[1][0][⑴])
        
    # 可以根据需要将辨认结果保存到文件中
    output_file = 'path/to/save/{}.txt'.format(os.path.splitext(img_file)[0])
    with open(output_file, 'w', encoding='utf⑻') as f:
        for line in result:
            f.write(''.join([word[0] for word in line[1]]) + '
')

在上面的示例代码中,首先导入PaddleOCR模块,然后实例化一个PaddleOCR对象。接着指定需要辨认文本的图片目录,获得该目录下所有图片文件名,并遍历每一个图片文件进行文本辨认。最后,将辨认结果打印出来,并可选择保存到文件中。

通过这类方式,您可以轻松地对大量图片进行批量文本辨认,并将结果保存到文件中,以供后续分析和处理。