GLM-OCR（LLM）と Tesseract を同じ画像で比較してわかったこと

2026.02.09 4:52

Zenn.dev

はじめに画像からテキストを抽出する OCR には、従来型の Tesseract と、近年登場した LLM ベースの手法があります。本記事では、オープンソースのビジョン言語モデル GLM-OCR（vLLM でローカル実行）と Tesseract で同じ書籍画像群を OCR し、その違いを統計的に比較しました。対象は 4 冊分の書籍画像（小説・図鑑的...

記事全文へ