ディープラーニングを始めてみる 8
前回
参考書はこれ
ニューラルネットワークが大体できるようになったので、実際にデータを用意してニューラルネットワークの画像認識で一番有名な手書き数字の認識をやってみます。
郵便局の郵便番号仕分けシステム等でも同じようなシステムが使われているはずです。
で、何が問題かというと、手書きのデータをどうやって用意するのかということです。
精度が高い数字認識手書きの数字の画像データを大体数万枚用意しないといけません。
これを手書きで用意するのはいくらなんでも難しいです。手書きで書いてカメラやスキャナで取り込むにしても膨大な手間がかかります。
幸いなことにこの本ではMNIST(エムニスト)データセットというものを使用するので、わざわざデータを用意する必要はありません。
これは手書き数字の画像データと、答えの数値データが一緒になったもので、カメラやスキャナで取り込んで数字認識用データを作らなくてもよくなります。
本を出版しているオライリージャパンのサイトから「関連ファイル」をクリックして「サンプルコード」をクリックすれば、ソースコード配布サイトに飛びます。
この章は本の3章なのでch03フォルダとdatasetフォルダのファイルを丸ごとダウンロードし、MNISTデータ読み込みスクリプトを起動させれば、データを使えるようになります。
このデータを使ってニューラルネットワークをやっていきます。