はじめに 画像からテキストを抽出する OCR には、従来型の Tesseract と、近年登場した LLM ベースの手法があります。本記事では、オープンソースのビジョン言語モデル GLM-OCR(vLLM でローカル実行)と Tesseract で同じ書籍画像群を OCR し、その違いを統計的に比較しました。 対象は 4 冊分の書籍画像(小説・図鑑的...
ここんところのWeb界隈についての主観的記録
AWS ParallelCluster v3.15.0 で P6-B300 サポートなど主要な変更点を確認してみた
極寒-30℃から深海45mまで!最強スマートウォッチAmazfit T-Rex Ultra 2がすごい!
OpenClaw × OllamaをMacBook 16GBで動かす - ローカルLLM入門
株式会社スーツスーツアップ・セミナー「AIによるタスクひな型」開催のお知らせ
まだコメントはありません。
コメントを送信しました。