SusuPRB-M01

修士論文「確率的ニューラルネットワーク向け専用集積回路の研究」

図.１ Photograph of Prototype Board.

1.はじめに

本研究はパターン認識処理とそのパラメータ学習の高速化を目的とするもので、その主な手法はアルゴリズムのデジタル回路(ハードウェア)化とその並列化である。これにより従来のPC(パソコン)による処理に比べ数十～数百倍以上の高速処理が実現可能である。さらに我々の提案する新たなアーキテクチャを用いることで、ハードウェアでの並列化の際に問題となるピン・ボトルネックを抑えることができ、低実装面積、低コストが実現できる。この結果、現実的なサイズ(デスクトップ・サイズ)で高速なパターン認識処理を行うことができる。確率的ニューラルネットワーク(PNN)は別名、カーネルベース法ともよばれ、ベイズの識別定理に基づいた、パターン認識アルゴリズムの一つで最近見直され始めている。このアルゴリズムは並列性が高いため、ハードウェアの並列度を高められれば、より高速な処理が可能となる。さらに本研究では認識処理よりもはるかに計算量が多く、より高速な処理が期待される、認識パラメータ学習の高速化についても研究を進めている。

2.ハードウェア構成と実装

図.１に製作した試作基板の写真を示す。本試作基板は試作基板としては２作目で、１作目でFPGA内で行っていたNTSCビデオ・コンポジット信号のデコード／エンコードを専用チップを用いて行っている。これは今後利用を考えているカラー信号に対応することが主な目的であるが、現在のところ輝度情報のみを用いたパターン認識処理を行っている。FPGAは計３つ実装しており、ビデオカメラから入力された画像より、モザイク・パターンの生成を行うプリプロセッサ(前処理部)、そのパターンの認識を行うノードプロセッサ(認識部)、そして学習回路(Best Sigma Detector)及び全体の制御回路を搭載した学習／制御部から構成されている。

図.2 PNN System Configuration.

この他にパターンデータを保存しておくためのハードディスク・インターフェースやパソコンとデータや命令をやりとりするためのRS-232Cインターフェースなどを持っている。図.2に全体の構成を示す。ビデオカメラから入力された画像はOKI製のNTSCデコーダMSM7664TBで輝度値約8bit(シンクを含む)に量子化(A/Dコンバート)されXilinx社のFPGA XCV800HQ240内に作成したプリプロセッサに入力される。プリプロセス(モザイク化等の処理)結果はAnalogDevices社のNTSCエンコーダを経由してテレビモニタにてモニタリングできる。図.2中ではMax Detector, Best Sigma DetectorはXCV800にインプリメントされているが、現在はアーキテクチャの細かな変更に伴い、XCS30XL及びXCV300にインプリメントしている。このようなインプリメントの変更が容易に行えるのもFPGAならではである。

3.PNNのハードウェア化

図.3 The Node Processor Configuration.

図.3に現在製作しているPNNハードウェアの回路構成を示す。この回路は並列に多数実装することができるようにモジュール化されており、ここではこれを Node Processorとよぶ。Node Processorの並列実装構成については図.2に示す通りである。Node Processorは入力として、サンプルパターン、テストパターン、そして核サイズ(パラメータσ)の３つ(それぞれ8bit幅)と、１つの出力を持つ。ここで重要なのことは、サンプルパターン入力以外は全て他のNode Processorと共通のバス接続となっていることである。これによりNode Processorの実装面での並列化が容易となっている。ところで、バス接続を用いることは時に時分割処理を要求し、スケーラビリティの低下を招く。本アーキテクチャにおいてもNode Processorの出力をバス接続とすることによって時分割処理を行うことになるが、この処理の割合は、その前段の並列処理可能なNode Processor内の演算処理に比べはるかに小さいため、高いスケーラビリティを得られる。
次に、Node Processorの動作について述べる。図.3中でまず「Kernel Size Adjuster」にて、メモリから読み込まれたサンプルパターンの1segmentの値に σの値を加算、減算する。これによりサンプルパターンのこの1segmentの値は図.3中左上のように、その値を中心にσ分の範囲を持つことになる。次に「Kernel Size Comparator」にてこのσ分の範囲を持ったサンプルパターンと位置的に対応するsegmantのテストパターンを比較し、全ての値がこの範囲内にあれば"1"を、そうでなければ"0"を出力する。この"1"の数を後段のカウンタで数え、これを時分割で外部のバスに出力する。この値が最も大きかったものがそのサンプルに近いものと考えられ、そのサンプルの属するカテゴリがテストパターンのカテゴリと言える。こうして未知のテストパターンが既知のいずれのカテゴリに属するかを識別する。これはベイズの識別器そのものと言えよう。

おまけ

図.4 The 1st Prototype Board.

図.4は第１作目のパターン認識ボード「SusuPRB」のプロトタイプで、エッチング処理、グリーンレジスト塗装をした手製の両面基板を使用している。FPGAは XILINX社のSpartanシリーズを使用しており、他にSRAMとビデオ用のA/D,D/Aコンバータ、ATAハードディスク用の40Pinコネクタを搭載している。このプロトタイプは白黒映像のみを想定していたので特に外部に専用チップは用いず、NTSCのデコード／エンコードは外部の DAC,ADCとFPGAのみで行っている。

ｂｙすすたわり

研究室のホームページへ

Researchへ戻る

E-mail: susu@susutawari.org