本研究では畳み込みデノイジングオートエンコーダを用いた顔画像のノイズ除去を目標とした。
オートエンコーダは、エンコーダとデコーダからなるニューラルネットワークである。ネットワークの出力が入力になるべく近くなるように学習させる。近さの尺度として二乗誤差を用いる。デノイジングオートエンコーダは、オートエンコーダと同じ構造のネットワークにノイズ入りのデータを入力し、その出力が入力の元のデータに近付くように学習させるものである。学習させたネットワークにノイズが載った未知のデータが入力された際に、ノイズが取り除かれたデータが出力されることを期待する。本研究ではエンコーダ部分に畳み込みを、デコーダ部分に転置畳み込みを用いて、顔画像のノイズ除去を試みる。顔画像データには正面の顔画像だけでなく、顔の向きが左右にふれた顔画像も含まれている。このように扱うデータにバリエーションがある場合、1つのネットワークで学習することが困難だと予想できるので、これに対して複数のネットワークを組み合わせた改良手法を検討した。LFWという顔認識の研究のために用意されている顔画像13233枚を用いて、畳み込みデノイジングオートエンコーダによる顔画像のノイズ除去の実験を行った。実験の結果、学習とテスト同じノイズを載せた条件で最も出力と正解の誤差が小さくなった。扱った画像は正面だけでなくある程度左右を向いたものも含まれており、出力を見ると、左右を向いた画像で復元がうまくできていないことがわかった。それを踏まえ、ネットワークを複数組み合わせた改良手法を用いて実験を行ったが、前の実験と比べて誤差が下がらず良い性能にはならなかった。