wav2pixというGANの派生モデルがある。
要するに、音声から顔画像を生成するgeneratorを持つGANである。
wav2pixの実装はgithub上に見つかるのだが、いかんせんpython2系で実装されておりイマイチだったので、 これをpython3系でも動くよう、取り急ぎfixしたということ。
動作確認環境はpython3.6.9 on Ubuntu 18.04 LTSである。スクリプト全体はblackによりフォーマット済である。
実際にwav2pixを手元で動かして得られた生成画像はこんな感じ。
ソースコードをpylintでチェックするとまだスコアが低いので、コードの修正はさらに必要である。