差分

このページの2つのバージョン間の差分を表示します。

--- image-classification [2026/01/02 09:05] – bokupi
+++ image-classification [2026/01/02 09:24] (現在) – [データの準備] bokupi
@@ 行 1: / 行 1: @@
-====== 画像分類 ======
+====== 画像分類の実験 ======
-====== はじめに ======
 DeepLearningによる画像分類タスクの実験です。
@@ 行 15: / 行 13: @@
 毎回データをアップロードするのが手間だったりしますが、実験用途で使う分には、トータルで利便が勝ります。
-====== データの準備 ======
+以下にGoogle Colabで使ったipynbノートブックファイルを載せておきます。大した容量ではないですが、拡張子でアップロード制限を受けてしまうので、zip形式にしています。
+{{ :authorchecker.zip |}}
+====== 準備 ======
+===== データの準備 =====
 ResNet50に入力できる画像のサイズは224×224となります。そのためイラスト全体を使用すると縦横比がおかしくなったり、細かいパーツやタッチに関する情報が潰れてしまう懸念がありました。そこで学習の対象を「顔」のみとするべく、縦横1対1の比率で切り抜きを行ないました。画像サイズは学習時の事前処理でリサイズするので、この段階で揃えません。
@@ 行 27: / 行 31: @@
 </code>
-自分が描いたイラストはサンプルとして提供しても良いのですが、他人が描いたイラストの方は当然提供できないので、保留します。
+キャラクター分類のタスクで使ったデータは、自分が描いたイラストのみ使用しているので、サンプルとして提供します。
+著者分類は他人が描いたイラストを含み、当然それは提供できません。
-====== ライブラリインストール ======
+{{ :data.zip |}}
+===== ライブラリの準備 =====
 標準では入っていないライブラリを利用するので、インストールしておきます。
@@ 行 37: / 行 43: @@
 </code>
-====== 学習モデルの用意 ======
+====== 学習処理のコーディング ======
+===== 学習モデルの用意 =====
 ここからコーディングとなります。まずは学習モデルを用意します。
@@ 行 67: / 行 75: @@
 </code>
-====== 学習モデルの構造を確認 ======
+===== 学習モデルの構造を確認 =====
 下記で学習モデルの構造を確認できます。
@@ 行 79: / 行 87: @@
 </code>
-====== データセットとデータローダの用意 ======
+===== データセットとデータローダの用意 =====
 学習データを扱えるように、データセットとデータローダを用意します。
@@ 行 119: / 行 127: @@
 </code>
-====== 学習の実施 ======
+===== 学習の実施 =====
 学習を行ないます。
@@ 行 160: / 行 168: @@
 </code>
-下記のように正解率が収束すれば、学習が上手くいっている可能性が高いです。
+下記のように正解率が収束すれば、学習が上手くいっている可能性が高いです。本当に上手く学習できているかは、後述のgrad-CAMなどを用いて判断します。
 <file>
@@ 行 176: / 行 184: @@
 ====== 評価 ======
+===== テスト用データローダを流用して評価 =====
 学習したモデルを用いて、再度推論を実施し、その判断根拠をGrad-CAMで可視化します。
@@ 行 229: / 行 239: @@
 </code>
-====== 評価 ======
+===== データローダを使わずに画像を直接指定して評価 =====
 続いて、データローダを使わず、直接画像ファイルを使って推論して、grad-CAMによる可視化を行ないます。
@@ 行 321: / 行 331: @@
 {{:grad-cam_komekome-checker.png?direct&600|}}