今日はあまり作業が進まなかった。先週まででニューラルネットワークでやっておきたいことがすべてできたので、今日からはもっと自動で動くようにし、またニューラルネットワークのテストデータを増やすことにした。

 

テストデータは学習データと同じではやりたくない。テストデータを増やしたいが、手動でのダウンロードは大変なため、自動でやりたい。自動でやるにはurlの指定が必要だが、学習データと別にするには学習データをダウンロードしてきたサイトとは別のところからダウンロードしてくる必要がある。今まではflickrというサイトからダウンロードしていたが、今日いいツールを見つけた。google-images-downloadである。これはpythonのプログラムであり、pipでインストールできる。コマンドで使い、引数でほしいキーワードを設定すればよい。これをインストールして初めて使ったときはダウンロードの間隔が短いなあと思ったが、とても使いやすいと感じた。しかし2回目の挑戦をすると、chromeがインストールされていないといったような注意が出た。なぜだ!一回目はしっかりダウンロードできたのに。。。chromeもしっかりインストールされているのに。。。仕方がなくアンインストールし使うのをあきらめ、以前使っていたflickrからダウンロードして、学習データと被ったら学習のほうだけ被ったものを削除しようと考え、flickrの自動ダウンロードプログラムを実行した。しかし!こちらも動かない!どうなっているのだ!

 

しょぼくれてAnacondaを再インストールしたらflickrはしっかり動いた。今度からテストデータもflickrからダウンロードし、学習と被ったら学習フォルダの被った画像を消すことにする。

 

正答率も自動で計算するプログラムを作っている。正答かどうかの%はテキストデータに保存され、正答率の確認をするプログラムを動かしている最中にそれを操作できなかった。だが新たに別のテキストファイルに保存することで、プログラムがいったん終了しても正答率を計算させられるということを発見した。プログラム自体は反復して動かすものだが、このように別の場所に保存をしておけばいくらでも長く動くプログラムに負けないものになる。