image-classification
差分
このページの2つのバージョン間の差分を表示します。
| 両方とも前のリビジョン前のリビジョン次のリビジョン | 前のリビジョン | ||
| image-classification [2026/01/02 09:07] – bokupi | image-classification [2026/01/02 09:24] (現在) – [データの準備] bokupi | ||
|---|---|---|---|
| 行 1: | 行 1: | ||
| - | ====== 画像分類 | + | ====== 画像分類の実験 |
| - | + | ||
| - | ====== はじめに | + | |
| DeepLearningによる画像分類タスクの実験です。 | DeepLearningによる画像分類タスクの実験です。 | ||
| 行 15: | 行 13: | ||
| 毎回データをアップロードするのが手間だったりしますが、実験用途で使う分には、トータルで利便が勝ります。 | 毎回データをアップロードするのが手間だったりしますが、実験用途で使う分には、トータルで利便が勝ります。 | ||
| - | ====== データの準備 | + | 以下にGoogle Colabで使ったipynbノートブックファイルを載せておきます。大した容量ではないですが、拡張子でアップロード制限を受けてしまうので、zip形式にしています。 |
| + | |||
| + | {{ : | ||
| + | |||
| + | ====== 準備 ====== | ||
| + | |||
| + | ===== データの準備 ===== | ||
| ResNet50に入力できる画像のサイズは224×224となります。そのためイラスト全体を使用すると縦横比がおかしくなったり、細かいパーツやタッチに関する情報が潰れてしまう懸念がありました。そこで学習の対象を「顔」のみとするべく、縦横1対1の比率で切り抜きを行ないました。画像サイズは学習時の事前処理でリサイズするので、この段階で揃えません。 | ResNet50に入力できる画像のサイズは224×224となります。そのためイラスト全体を使用すると縦横比がおかしくなったり、細かいパーツやタッチに関する情報が潰れてしまう懸念がありました。そこで学習の対象を「顔」のみとするべく、縦横1対1の比率で切り抜きを行ないました。画像サイズは学習時の事前処理でリサイズするので、この段階で揃えません。 | ||
| 行 27: | 行 31: | ||
| </ | </ | ||
| - | 自分が描いたイラストはサンプルとして提供しても良いのですが、他人が描いたイラストの方は当然提供できないので、保留します。 | + | キャラクター分類のタスクで使ったデータは、自分が描いたイラストのみ使用しているので、サンプルとして提供します。 |
| + | 著者分類は他人が描いたイラストを含み、当然それは提供できません。 | ||
| - | ====== ライブラリインストール ====== | + | {{ :data.zip |}} |
| + | ===== ライブラリの準備 | ||
| 標準では入っていないライブラリを利用するので、インストールしておきます。 | 標準では入っていないライブラリを利用するので、インストールしておきます。 | ||
| 行 37: | 行 43: | ||
| </ | </ | ||
| - | ====== 学習モデルの用意 | + | ====== 学習処理のコーディング ====== |
| + | |||
| + | ===== 学習モデルの用意 ===== | ||
| ここからコーディングとなります。まずは学習モデルを用意します。 | ここからコーディングとなります。まずは学習モデルを用意します。 | ||
| 行 67: | 行 75: | ||
| </ | </ | ||
| - | ====== 学習モデルの構造を確認 | + | ===== 学習モデルの構造を確認 ===== |
| 下記で学習モデルの構造を確認できます。 | 下記で学習モデルの構造を確認できます。 | ||
| 行 79: | 行 87: | ||
| </ | </ | ||
| - | ====== データセットとデータローダの用意 | + | ===== データセットとデータローダの用意 ===== |
| 学習データを扱えるように、データセットとデータローダを用意します。 | 学習データを扱えるように、データセットとデータローダを用意します。 | ||
| 行 119: | 行 127: | ||
| </ | </ | ||
| - | ====== 学習の実施 | + | ===== 学習の実施 ===== |
| 学習を行ないます。 | 学習を行ないます。 | ||
| 行 176: | 行 184: | ||
| ====== 評価 ====== | ====== 評価 ====== | ||
| + | |||
| + | ===== テスト用データローダを流用して評価 ===== | ||
| 学習したモデルを用いて、再度推論を実施し、その判断根拠をGrad-CAMで可視化します。 | 学習したモデルを用いて、再度推論を実施し、その判断根拠をGrad-CAMで可視化します。 | ||
| 行 229: | 行 239: | ||
| </ | </ | ||
| - | ====== 評価 | + | ===== データローダを使わずに画像を直接指定して評価 ===== |
| 続いて、データローダを使わず、直接画像ファイルを使って推論して、grad-CAMによる可視化を行ないます。 | 続いて、データローダを使わず、直接画像ファイルを使って推論して、grad-CAMによる可視化を行ないます。 | ||
| 行 321: | 行 331: | ||
| {{: | {{: | ||
| - | |||
image-classification.1767344821.txt.gz · 最終更新: by bokupi
