No.66 1994年4月

「CEDARにおける研究報告−線/背景構造及び方向特徴抽出アルゴリズム―」

                                 技術開発研究センター研究官 松井 俊弘 
1 技術開発研究センターでは、郵便処理システムの高度化・自動化に向けて、文字認識技術の高度化、道順組立処理の自動化、郵便輸送・搬送システムの将来形態の研究などを推進しているところである。なかでも、文字認識技術は郵便の自動化のための根幹技術であり、認識精度の向上がそのまま自動化率に反映される。そこで、技術開発研究センターでは、高精度な文字認識技術確立のため、新たな文字認識手法の研究に取り組んでいる。

2 手書き英数字認識技術で高い実績を持ち、手書き英数字データベース及び研究環境の整ったニューヨーク州立大学バッファロー校の文書認識・理解高度化センター(以下、CEDAR;Center of Excellence for document Analysis and Recognition)に平成5年9月より同年12月まで滞在し、米国における文字認識技術の調査と手書き英数字の新たな認識手法の研究を行った。

3 CEDARで開発した新しい文字特徴抽出アルゴリズムは、文字線の接続状態に着目した文字線構造特徴、文字の背景部とその周囲にある文字線の位置関係に基づいた文字背景構造特徴及び輪郭チェインコードと呼ばれる文字線の傾き変化の分布特徴の3特徴を効率的に抽出し、融合する手法である。この特徴抽出アルゴリズムを用いて、CEDAR所有の手書き英数字データベースを対象に認識実験を行った。その結果、手書き数字で約99%、手書き英字では、大文字で約96%、小文字で約90%の高い認識率を達成することができた。

本文書[rtf形式]の転送


HomePage