『深層学習からマルチモーダル情報処理へ』p.37におけるミニバッチ版確率的勾配の分散を導出している論文

深層学習

この論文の付録を読めば導出が書いてある arxiv.org

2024-01-12

Conv1d の後段にBatchNorm1dではなくLayerNormを置きたいとき

python 深層学習

GroupNormを使う． nn.BatchNorm1d(out_channels) から nn.GroupNorm(1, out_channels) への置き換えでOK．GroupNormの第1引数はグループ数であり，ここを1に指定するとLayerNormと等価になる． discuss.pytorch.org

2023-09-01

Deep Divergence Learning (ICML 2020) の論文に掲載された実験結果を検証する試み −分布クラスタリング前編−

深層学習機械学習距離学習

はじめに論文の概要応用可能性 −分布クラスタリング− 実験： Clustering Multivariate Gaussian Distributions 実験条件データセット生成比較手法ネットワークアーキテクチャおよび損失関数評価指標その他の実験条件補足：経験分布の構成実験結果…

2023-08-01

距離学習と深層距離学習の違い

距離学習深層学習機械学習

距離学習と深層距離学習の違いについて備忘録を残しておく．共通していることデータセット中の2点 $\mathbf{x}, \mathbf{y}$間の距離関数$d(\mathbf{x}, \mathbf{y})$が与えられる．距離関数はクラス分類やクラスタリング・異常検知などのタスクで活用さ…

2023-07-27

日本語x-vectorから感情成分を分離するニューラルネットワークを構築してみた −感情分類に敵対的な損失関数の導入−

音声深層学習機械学習

はじめに本記事は前回記事の続編に相当する．前回記事では声優統計コーパスの3話者・3感情の音声データに対してx-vector抽出器を適用し，UMAPで可視化を試みた．この可視化の実験を通じて，感情成分が分離できていない傾向が見られた．すなわち，本来は話…

2023-07-21

日本語x-vector抽出器により声優統計コーパスからx-vectorを抽出してUMAPで可視化した話

深層学習音声 python

はじめに最近，日本語 x-vector 抽出器がPyPIに登録された旨がツイートされた． M1中田くんが，日本語 x-vector 抽出 (音声に含まれる話者特徴をベクトルで表現してくれるもの) を pip で入るようにしてくれました．ご活用下さい．学習済みモデルがあるので…

2023-02-22

拡散モデルの勉強に役立つかもしれないリンク集

拡散モデル深層学習機械学習

拡散モデルに関する備忘録として。大量に関連リンクを集めてもそれだけで満足してしまいがちなので、この記事では少なめで。書籍解説論文解説記事解説動画その他実装書籍拡散モデル（岡野原大輔著）サポートページ解説論文 [2208.11970] Unders…

2022-12-03

AIミュージックバトル！『弁財天』スターターキットのPyTorch版Google Colabノートブックを作った話

深層学習機械学習音楽情報処理 python

はじめに AIミュージックバトル！『弁財天』が配布しているスターターキットについて、PyTorch版を作成した記事を以前書いたことがあった。 tam5917.hatenablog.com その記事の段階では、Google Colabのノートブックを用意していなかったので、今回作ってみ…

2022-11-21

異常音検知関連の情報まとめ

異常検知音声深層学習機械学習

異常音検知に関して、まとめてリストしておく。備忘録。解説論文・スライドスライド論文ソフトウェアデータセット書籍コンペティション解説論文・スライドスライド音響信号に対する異常音検知技術と応用音響信号に対する異常音検知技術と応用 fro…

2022-11-19

微分可能な複素正弦波オシレータを用いて日本語5母音を近似させてみた

深層学習機械学習信号処理音声

はじめに実装実験実験条件実験結果おわりにはじめに SNSにて、しゃをみん氏が興味深い記事をツイートされていた。昨日書きました。「コンピューターは遂に「音の高低」を理解した」と言えるほどの大きな進歩です。【注目論文】Sinusoidal Frequency E…

2022-10-25

AIミュージックバトル！『弁財天』のスターターキットをPyTorchに移植してアドリブメロディの自動生成を試してみた

深層学習機械学習音楽情報処理 python

はじめにスターターキットについてスターターキットが提供するモデルの概要実装必要なパッケージ実装の概要メロディ生成実験実験条件実験結果実装の舞台裏やTIPS、TensorFlow版との違いなどおわりにはじめに最近、下記のイベントが開催されるこ…

2022-10-10

Transformerを用いてオノマトペから環境音を合成する手法をPyTorchで実装した（Transformer版 Onoma-to-Wave）

深層学習機械学習 python 音声

はじめに事前準備実装の概要環境音合成実験実験条件実験結果実装の舞台裏などおわりにはじめに以前、Onoma-to-Waveを実装した記事を書いたことがあった： tam5917.hatenablog.com Onoma-to-Waveとはオノマトペ（文字列）を環境音（スペクトログラム…

2022-09-16

Transformerの学習率を調整するSchedulerクラスをPyTorchで書いた

深層学習 python

はじめに Attention is All You Needという論文で「warmup & ステップ数の逆平方根で学習率を減衰」させる学習率スケジューリングが提案されたが、そのようなスケジューリングを手軽に行うスケジューラを書いたということである。ソースコード from torch.o…

2022-07-01

オノマトペ（擬音語）から環境音を合成するニューラルネットワーク（Onoma-to-Wave）をPyTorchで実装した

深層学習機械学習 python 音声

はじめに事前準備ソースコード実装の概要と動かし方補助的に作成したモジュールの概要おまけ：訓練済みモデルのリリース環境音合成実験音響イベントによる条件付けなし音響イベントによる条件付けあり実装の舞台裏とかTIPS おわりに参考文献はじ…

2022-05-26

wav2pixがpython2系で実装されていたので、python3系で動くように修正した

深層学習機械学習 python

wav2pixというGANの派生モデルがある。要するに、音声から顔画像を生成するgeneratorを持つGANである。図1: wav2pixのネットワーク構成 qiita.com wav2pixの実装はgithub上に見つかるのだが、いかんせんpython2系で実装されておりイマイチだったので、こ…

2021-08-22

Pythonの異常検知用パッケージPyODの形式に従って、ガウス混合モデル（GMM）に基づく異常検知を実装した

機械学習深層学習異常検知 python

はじめに 2021年8月22日現在、Pythonの異常検知用パッケージであるPyODにガウス混合モデル（Gaussian Mixture Model; GMM）ベースの異常検知が実装されていなかったので、それを実装したということである。 PyODのインストール pipでインストール可能である…

2021-08-20

DAGMMに基づく教師なし異常検知をPyTorchで実装した

機械学習深層学習異常検知 python

はじめに教師なし異常検知の機械学習モデルの一つとして、"Deep Autoencoding Gaussian Mixture Model" （以降DAGMM）が知られている。今回はこれを、異常検知/外れ値検知のためのPythonパッケージPyODの仕様に沿った形で、PyTorchにより実装したというこ…

2021-08-17

OC-NNに基づく教師なし異常検知をPyTorchで実装した

機械学習深層学習異常検知 python

はじめに教師なし異常検知の機械学習モデルの一つとして、"One-Class Neural Network" （以降OC-NN）が知られている。今回はこれを、異常検知/外れ値検知のためのPythonパッケージPyODの仕様に沿った形で、PyTorchにより実装したということである。異常検…

2021-08-16

Deep SVDDに基づく外れ値検知をPyTorchで実装した

機械学習深層学習異常検知 python

はじめに外れ値検知の機械学習モデルの一つとして"Deep SVDD" が知られている。今回はこれを、異常検知/外れ値検知のためのPythonパッケージPyODの仕様に沿った形で、PyTorchにより実装したということである。外れ値検知は1クラス分類と捉えることができ…

2021-04-24

AdaCosのPyTorch実装にまつわるバグ

深層学習距離学習

深層距離学習の一つであるAdaCosはとても有効である。 PyTorch実装も利用できる。 github.com ところがこの実装には（2021/04/24時点）、使い方を間違えるとNaNが頻発する不具合がある。 forward関数内でscaleをadaptiveに更新しているのだが、学習データの…

2019-03-26

Flow系の論文たち

深層学習機械学習

サーベイ論文 Normalizing Flows: Introduction and Ideas (2019) URL Normalizing Flows for Probabilistic Modeling and Inference (2019) URL 代表的なもの NICE: Non-linear Independent Components Estimation (2014) URL MADE: Masked Autoencoder for…

2019-02-27

Kingma氏の論文

深層学習機械学習

Kingma氏が第１著者の論文を（独断と偏見で）抜き出してまとめておく。 Adam: A Method for Stochastic Optimization Auto-Encoding Variational Bayes Semi-Supervised Learning with Deep Generative Models Improved Variational Inference with Inverse …

2017-11-22

MinimalRNNをTensorFlowで実装した（だけ）

深層学習

もはや「実装した」と呼べるかどうか。既存のコードを少しいじっただけなので。論文 [1711.06788] MinimalRNN: Toward More Interpretable and Trainable Recurrent Neural Networks 実装 A TensorFlow implementation of MinimalRNN. · GitHub 論文を要約…

2017-09-06

Chaos Free NetworkをTensorflowで実装した

深層学習

CFN (Chaos-Free Network) 論文 A recurrent neural network without chaos 実装 An implementation of Chaos-Free Network (CFN) in TensorFlow · GitHub

2017-05-01

Multiplicative LSTM (Workshop Track in ICLR 2017)をTensorFlowで実装した

深層学習

はじめに表題の通り、ICLR 2017のWorkshop Trackで発表されたMultiplicative LSTMを実装した。論文 Ben Krause, Iain Murray, Steve Renals and Liang Lu, "Multiplicative LSTM for sequence modelling," Workshop Track in ICLR 2017. URL https://openr…

2017-04-27

Zoneout正規化をLSTMに実装した by TensorFlow

深層学習

論文 Zoneout: Regularizing RNNs by Randomly Preserving Hidden Activations実装 An implementation of zoneout regularizer on LSTM-RNN in Tensorflow · GitHub 著者によるプレゼン動画(直接サイトに飛んでみたほうが良いかも) videolectures.net要する…

2017-04-06

音声／音楽生成・音響処理分野におけるEnd-to-End系の論文情報とか各種スライド情報とかを忘れないうちにメモ

深層学習

なんだか最近、当該分野でEnd-to-End系の論文が急に増えたなぁということで、忘れないうちに自分用にメモ。面白そうな論文情報も含めて。もうね、正直言ってお腹いっぱいなんですけど、流れには逆らえないですね。ほとんどarXivなので、信頼性は担保されてお…

2016-09-25

RNNに関するコード、各応用分野（CV, NLPなど）における論文などのリソースを集めたサイト『Awesome Recurrent Neural Networks』

深層学習

以下のサイト。 github.com コードは最近の深層学習系パッケージなら入っているからいいとして、論文のまとめはありがたい。このリストの作者は、以下のCV系深層学習の論文関連情報のサイトもメンテしている； github.com

2016-09-24

RNN に関するニューラルネットの最新手法をTensorFlowで実装している人がいた

深層学習

以下のリポジトリ。 github.com既実装は以下： Highway Networks Recurrent Highway Networks Multiplicative Integration Within RNNs Recurrent Dropout Layer Normalization Layer Normalization & Multiplicative Integration LSTM With Multiple Memory…

2016-09-24

Recurrent Batch NormalizationをTensorFlowで実装した

深層学習

要するにLSTMの内部でバッチ正規化を行うということ。論文と実装は以下の通り。 Tim Cooijmans, Nicolas Ballas, César Laurent, Çağlar Gülçehre, Aaron Courville, "Recurrent Batch Normalization, " arXiv preprint, 2016. https://arxiv.org/abs/1603.0…