Tim Cooijmans, Nicolas Ballas, César Laurent, Çağlar Gülçehre, Aaron Courville, "Recurrent Batch Normalization, " arXiv preprint, 2016. https://arxiv.org/abs/1603.09025
実装

本実装は以下の先行実装に依拠しており、ここに感謝する次第である。

前者はTensorFlow実装、後者はTheano実装であるが、前者は後者を参考にして実装された。本実装はさらに前者の実装に対して自分用に手を加えたということである。なおTensorFlow 0.10でのみ動作確認をしている。

本実装ではBN_LSTMCellクラスが定義されている。使い方の注意点は、BN_LSTMCellのインスタンスを作成する際、引数に'is_training'を取るということである。これはバッチ正規化に関して、学習時と評価時で振る舞いを変えるためのものである。より具体的に言うと、学習時には各ミニバッチについて統計量（平均と分散）を計算してバッチ正規化を行う必要があるのだが、評価時の各ミニバッチに対しては改めて統計量を計算する必要はなく、学習データ全体から求められる確定した統計量に基づいてバッチ正規化を行うのである。

今後はGRUやSGU, MGUなどにrecurrent batch normalizationを実装する予定である。

2016-09-24

TensorFlowのRNN系関数群を色々と強化するライブラリ『Project RNN Enhancement』

深層学習

Project RNN Enhancement、ということらしい：
github.com

作者はSeq2Seqへの応用を念頭に置いているらしいが。

2016-09-19

FIT2016の企画「ここから始める情報処理～画像、音声、テキスト、検索、学習、一気にまとめてチュートリアル～」のスライドまとめ

Facebookにて、山崎俊彦氏がまとめていらっしゃったので、こちらにもメモ的に残しておこうということ。

ディープラーニングでおそ松さんの６つ子は見分けられるのか？ FIT2016 from Yota Ishida

【FIT2016チュートリアル】ここから始める情報処理～音声編～ by 東工大・篠崎先生 from Toshihiko Yamasaki

ゼロから始める自然言語処理【FIT2016チュートリアル】 from Yuki Arase

検索評価ツールキットNTCIREVALを用いた様々な情報アクセス技術の評価方法 from kt.mako

【FIT2016チュートリアル】ここから始める情報処理～機械学習編～ from Toshihiko Yamasaki

2016-09-18

WaveNetの各種実装：TensorFlow, Chainer, and Keras

深層学習

TensorFlow実装

github.com

Chainer実装
- その１ github.com
- その２ github.com

Keras実装
- その１ github.com
- その２（バックエンドはTheano？）github.com

番外編：WaveNetによる音声生成の高速化実装（学習ではない）

Fast Wavenet: An efficient Wavenet generation implementation
github.com
どれくらい高速か、というと論文の通りにナイーブに実装すると、層の数Lに対して2^Lに比例するオーダーだったのが、Lの1次に比例するオーダーになるそうだ（下図参照）。
f:id:tam5917:20160925115303p:plain

現在、もっとも開発が盛んなのはTensorFlow実装のリポジトリだろうか。生成の高速化実装も取り込まれた。充実感がある。
これらが実際に使い物になるかどうかはまた別の問題である。

2016-09-12

『リーマン多様体の等長埋め込み論小史, あるいは外史』

数学

http://www.math.tsukuba.ac.jp/~tasaki/yuzawa/2004/agaoka2004.pdf