OpenCVの使い方36 ~ テンプレートマッチング2
今回は前回紹介したテンプレートマッチングを利用した漢字・文字間違い探しについて紹介する。
1. 漢字間違い探し1
以下の漢字間違い探しの問題をテンプレートマッチングを用いて解答してみる。
テンプレートマッチングは、一致する画像を検出するためのものであるので、今回は正しいものをすべて検出することで間違っているものをあぶり出す。
以下の1文字だけ間違った漢字を見つける。
正しい漢字をテンプレート画像として
テンプレート画像に一致する複数箇所を検出する。
結果は以下の通りで、すべての"若"が検出され、1文字だけ誤った"苦"は検出されなかった。
2. 文字間違い探し(難問)
難しい問題の例として、まず漢字の"二"とカタカナの"ニ"が混ざっている問題を解いてみる。
説明によると漢字の"二"の方がカタカナよりもサイズが大きくなっている。
テンプレート画像は漢字の"二"とする。
結果は以下の通り、見事にカタカナのニを見つけることができた。
最後にアルファベットのiとギリシャ数字のⅰで、わずかにアルファベットのiの方が短いようだ。
この問題については以下の通りすべての文字が検出されてしまい、閾値を0.999にしても結果が変わらなかった。
間違い1、2に関しては目視でもわかるぐらいの違いだが、3番目は目視でも区別ができないレベル。ここまで微妙な差だとテンプレートマッチングでも厳しいかもしれない。