VLMは方眼を数えられない——編み図読み取りで AI を見限り、古典CVに切り替えるまでの8日間

medium

Zenn AI2026/6/11原文を読む →

AI 要約

弁護士兼個人開発者が編み図読み取りPWAを8日間で開発した際、VLM（視覚言語モデル）が方眼紙の格子カウントに失敗することを発見し、古典的コンピュータビジョン手法に切り替えた実装記録。VLMが苦手とする「精密なグリッドカウント」というユースケースを具体的に示しており、AI活用における適材適所の判断事例として参考になる。開発者・AIエンジニアがVLMの限界を理解し、ハイブリッドアプローチを検討する際の実践知として価値がある。

VLM限界コンピュータビジョン個人開発AIの適材適所PWA