ユーザ用ツール

サイト用ツール


image-classification

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
image-classification [2026/01/02 09:05] bokupiimage-classification [2026/01/02 09:24] (現在) – [データの準備] bokupi
行 1: 行 1:
-====== 画像分類 ====== +====== 画像分類の実験 ======
- +
-====== はじめに ======+
  
 DeepLearningによる画像分類タスクの実験です。 DeepLearningによる画像分類タスクの実験です。
行 15: 行 13:
 毎回データをアップロードするのが手間だったりしますが、実験用途で使う分には、トータルで利便が勝ります。 毎回データをアップロードするのが手間だったりしますが、実験用途で使う分には、トータルで利便が勝ります。
  
-====== データの準備 ======+以下にGoogle Colabで使ったipynbノートブックファイルを載せておきます。大した容量ではないですが、拡張子でアップロード制限を受けてしまうので、zip形式にしています。 
 + 
 +{{ :authorchecker.zip |}} 
 + 
 +====== 準備 ====== 
 + 
 +===== データの準備 =====
  
 ResNet50に入力できる画像のサイズは224×224となります。そのためイラスト全体を使用すると縦横比がおかしくなったり、細かいパーツやタッチに関する情報が潰れてしまう懸念がありました。そこで学習の対象を「顔」のみとするべく、縦横1対1の比率で切り抜きを行ないました。画像サイズは学習時の事前処理でリサイズするので、この段階で揃えません。 ResNet50に入力できる画像のサイズは224×224となります。そのためイラスト全体を使用すると縦横比がおかしくなったり、細かいパーツやタッチに関する情報が潰れてしまう懸念がありました。そこで学習の対象を「顔」のみとするべく、縦横1対1の比率で切り抜きを行ないました。画像サイズは学習時の事前処理でリサイズするので、この段階で揃えません。
行 27: 行 31:
 </code> </code>
  
-自分が描いたイラストサンプルとして提供しても良いのでが、他人が描いたイラストの方は当然提供できないので、保留し+キャラクター分類のタスクで使ったデータは、自分が描いたイラストのみ使用しているので、サンプルとして提供し。 
 +著者分類は他人が描いたイラストを含み、当然それは提供できません
  
-====== ライブラリインストール ======+{{ :data.zip |}} 
 +===== ライブラリの準備 =====
  
 標準では入っていないライブラリを利用するので、インストールしておきます。 標準では入っていないライブラリを利用するので、インストールしておきます。
行 37: 行 43:
 </code> </code>
  
-====== 学習モデルの用意 ======+====== 学習処理のコーディング ====== 
 + 
 +===== 学習モデルの用意 =====
  
 ここからコーディングとなります。まずは学習モデルを用意します。 ここからコーディングとなります。まずは学習モデルを用意します。
行 67: 行 75:
 </code> </code>
  
-====== 学習モデルの構造を確認 ======+===== 学習モデルの構造を確認 =====
  
 下記で学習モデルの構造を確認できます。 下記で学習モデルの構造を確認できます。
行 79: 行 87:
 </code> </code>
  
-====== データセットとデータローダの用意 ======+===== データセットとデータローダの用意 =====
  
 学習データを扱えるように、データセットとデータローダを用意します。 学習データを扱えるように、データセットとデータローダを用意します。
行 119: 行 127:
 </code> </code>
  
-====== 学習の実施 ======+===== 学習の実施 =====
  
 学習を行ないます。 学習を行ないます。
行 160: 行 168:
 </code> </code>
  
-下記のように正解率が収束すれば、学習が上手くいっている可能性が高いです。+下記のように正解率が収束すれば、学習が上手くいっている可能性が高いです。本当に上手く学習できているかは、後述のgrad-CAMなどを用いて判断します。
  
 <file> <file>
行 176: 行 184:
  
 ====== 評価 ====== ====== 評価 ======
 +
 +===== テスト用データローダを流用して評価 =====
  
 学習したモデルを用いて、再度推論を実施し、その判断根拠をGrad-CAMで可視化します。 学習したモデルを用いて、再度推論を実施し、その判断根拠をGrad-CAMで可視化します。
行 229: 行 239:
 </code> </code>
  
-=====評価 ======+===== データローダを使わずに画像を直接指定して評価 =====
  
 続いて、データローダを使わず、直接画像ファイルを使って推論して、grad-CAMによる可視化を行ないます。 続いて、データローダを使わず、直接画像ファイルを使って推論して、grad-CAMによる可視化を行ないます。
行 321: 行 331:
  
 {{:grad-cam_komekome-checker.png?direct&600|}} {{:grad-cam_komekome-checker.png?direct&600|}}
- 
  
image-classification.1767344749.txt.gz · 最終更新: by bokupi

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki