VLMは方眼を数えられない——編み図読み取りで AI を見限り、古典CVに切り替えるまでの8日間
mediumAI 要約
弁護士兼個人開発者が編み図読み取りPWAを8日間で開発した際、VLM(視覚言語モデル)が方眼紙の格子カウントに失敗することを発見し、古典的コンピュータビジョン手法に切り替えた実装記録。VLMが苦手とする「精密なグリッドカウント」というユースケースを具体的に示しており、AI活用における適材適所の判断事例として参考になる。開発者・AIエンジニアがVLMの限界を理解し、ハイブリッドアプローチを検討する際の実践知として価値がある。
VLM限界コンピュータビジョン個人開発AIの適材適所PWA