Назад към всички

image-ocr-reader

// 从图片中提取文字内容的技能,支持中文和英文识别。

$ git log --oneline --stat
stars:1,933
forks:367
updated:March 4, 2026
SKILL.mdreadonly

Image OCR Reader

从图片中提取文字内容的技能,支持中文和英文识别。

功能

  • 从图片文件中提取文字 (OCR)
  • 支持中文、英文混合识别
  • 使用 Tesseract OCR 引擎
  • 兼容 jpg、png、jpeg 等常见图片格式

依赖

  • Python 3
  • tesseract-ocr
  • pytesseract
  • Pillow

安装

1. 安装系统依赖

# Ubuntu/Debian
sudo apt-get install tesseract-ocr

# macOS
brew install tesseract

# CentOS/RHEL
sudo yum install tesseract

2. 安装 Python 依赖

pip install pytesseract Pillow

使用方法

命令行

python3 image_ocr_reader.py --file /path/to/image.jpg

Python API

from image_ocr_reader import extract_text

text = extract_text("/path/to/image.jpg")
print(text)

输出示例

输入一张包含文字的图片,输出提取的文字内容。


积分

  • 版本: 1.0.0
  • 作者: OpenClaw
  • 许可证: MIT