2017/08/31

DeepLearningを実用する際のテクニック2

いきなりまとめ


DeepLearningではデータの事前処理が必要。
Computer Visionには特有の事前処理、
  • ピクセル値の標準化
  • サイズの標準化
  • データの増幅
などが存在。



Today I Learned


Chapter 12 Application
を参考に。


Computer Vision


ANNでは通常データの事前処理が必要。
画像データの場合は
  • スケーリングは必須 ([0,1] or [-1, 1])
  • サイズの標準化も必要(可変サイズの場合はpoolingでサイズ調整が必要)
その他にも必要に応じて、
  • dataset augmentation(トレーニングデータの増幅)
  • データの正準型への変換(データの変動の削減)
など。


・Contrast Normalization

データの変動の大きな要因がコントラスト。
deep learningにおいてはコントラストはピクセルの標準偏差。

Global contrast normalization(GCN)では画像全域のデータによってピクセルの値を標準化。
これによりデータは球状に分布(DeepLearningは方向と距離を同時に扱うのは困難)。
GCNではエッジがボケてしまう場合がある(暗い部分と明るい部分のエリアが大きい画像、街の画像など)。

local contrast normalizationでは小領域ごとに標準化。
これによってGCNでボケてしまうエッジを検出可能。


・Dataset Augmentation

Dataset Augmentatioではトレーニングデータのコピーによってデータを増幅。
これによってモデルの一般性が向上可能。
特に画像認識において有効。


0 件のコメント:

コメントを投稿

Relation Netowrksの概要

いきなりまとめ Relation Netowrksとは関係性の推論を行えるニューラルネット。 画像や音声の単純な認識ではなく、複雑な思考が可能。 例えば、 グレーの物体から最も離れている物体の形は何か? ボールは今何処にあるか? ランダムに動くボール群のどれが...