文書の過去の版を表示しています。

画像分類

はじめに

DeepLearningによる画像分類タスクの実験です。 ResNet50を使って、画像分類を行ないます。

今回は下記の2種類のタスクを行ないました。予想通り前者は難しく学習が安定しなかったので、後者のタスクを加えました。

イラストの著者分類
イラストのキャラクター分類

環境はGoogle Colabを利用します。毎回データをアップロードするのが手間だったりしますが、実験用途で使う分には、トータルで利便が勝ります。

データの準備

ResNet50に入力できる画像のサイズは224×224となります。そのためイラスト全体を使用すると縦横比がおかしくなったり、細かいパーツやタッチに関する情報が潰れてしまう懸念がありました。そこで学習の対象を「顔」のみとするべく、縦横1対1の比率で切り抜きを行ないました。画像サイズは学習時の事前処理でリサイズするので、この段階で揃えません。

著者分類では、自分が描いたイラストとその他の著者が描いたイラストを約50枚ずつ用意しました。描かれているキャラクターはある程度重複するようにしています。

Google Colabへのアップロードは、ファイル単位のみみたいなので、ローカルでzip圧縮してからアップロードして、Google Colab上で展開しました。

!unzip data.zip

考察

著者分類は全く上手くいきませんでしたが、自分以外の著者のイラストについて、特定の著者に統一しなかったことが学習が安定しなかった原因かもしれません。まあ、元々難しいタスクなので、それだけが原因とは思いません。しかし、自分以外の著者のイラストの範囲が広すぎて、自分に近い画風の人とかけ離れた画風の人があった場合、上手くいかないように思えます。

技術でWiki

目次

画像分類

はじめに

データの準備

考察