OpenCVの使い方36 ～テンプレートマッチング2

今回は前回紹介したテンプレートマッチングを利用した漢字・文字間違い探しについて紹介する。

1. 漢字間違い探し1

以下の漢字間違い探しの問題をテンプレートマッチングを用いて解答してみる。

テンプレートマッチングは、一致する画像を検出するためのものであるので、今回は正しいものをすべて検出することで間違っているものをあぶり出す。

以下の１文字だけ間違った漢字を見つける。

正しい漢字をテンプレート画像として

漢字間違い1テンプレート

テンプレート画像に一致する複数箇所を検出する。

結果は以下の通りで、すべての"若"が検出され、１文字だけ誤った"苦"は検出されなかった。

難しい問題の例として、まず漢字の"二"とカタカナの"ニ"が混ざっている問題を解いてみる。

説明によると漢字の"二"の方がカタカナよりもサイズが大きくなっている。

テンプレート画像は漢字の"二"とする。

結果は以下の通り、見事にカタカナのニを見つけることができた。

最後にアルファベットのiとギリシャ数字のⅰで、わずかにアルファベットのiの方が短いようだ。

この問題については以下の通りすべての文字が検出されてしまい、閾値を0.999にしても結果が変わらなかった。

間違い１、２に関しては目視でもわかるぐらいの違いだが、３番目は目視でも区別ができないレベル。ここまで微妙な差だとテンプレートマッチングでも厳しいかもしれない。