いきなりまとめ
DeepLearningではデータの事前処理が必要。
Computer Visionには特有の事前処理、
- ピクセル値の標準化
- サイズの標準化
- データの増幅
Today I Learned
Chapter 12 Application
を参考に。
Computer Vision
ANNでは通常データの事前処理が必要。
画像データの場合は
- スケーリングは必須 ([0,1] or [-1, 1])
- サイズの標準化も必要(可変サイズの場合はpoolingでサイズ調整が必要)
- dataset augmentation(トレーニングデータの増幅)
- データの正準型への変換(データの変動の削減)
・Contrast Normalization
データの変動の大きな要因がコントラスト。
deep learningにおいてはコントラストはピクセルの標準偏差。
Global contrast normalization(GCN)では画像全域のデータによってピクセルの値を標準化。
これによりデータは球状に分布(DeepLearningは方向と距離を同時に扱うのは困難)。
GCNではエッジがボケてしまう場合がある(暗い部分と明るい部分のエリアが大きい画像、街の画像など)。
local contrast normalizationでは小領域ごとに標準化。
これによってGCNでボケてしまうエッジを検出可能。
・Dataset Augmentation
Dataset Augmentatioではトレーニングデータのコピーによってデータを増幅。
これによってモデルの一般性が向上可能。
特に画像認識において有効。
0 件のコメント:
コメントを投稿