読者です 読者をやめる 読者になる 読者になる

『Introduction to Deep Learning and its applications in Computer Vision』 という257枚のスライド

多いな… http://www.isba2015.org/files/Deep_Learning_ISBA_2015.pdf

A Statistical View of Deep Learning という記事のシリーズ

A Statistical View of Deep Learning というシリーズものの記事があったのでメモ。blog.shakirm.comblog.shakirm.comblog.shakirm.comblog.shakirm.comblog.shakirm.comblog.shakirm.comblog.shakirm.com

話者認識のツール for MATLAB

今から2年以上前にMSRがリリースしていた。 research.microsoft.com同ツールの記事 IEEE Signal Processing Society - SLTC Newsletter : November 2013 : MSR Identity Toolbox v1.0: A MATLAB Toolbox for Speaker-Recognition Research マニュアル http:…

MFCC抽出ツールの情報 for MATLAB

PLP and RASTA (and MFCC, and inversion) in Matlab using melfcc.m and invmelfcc.m HTKの抽出結果との比較は↓ Reproducing the feature outputs of common programs in Matlab using melfcc.m HTKの結果も再現できるようだ。その他だと VOICEBOX: Speech …

MacからリモートのLinuxマシンにTrampしたときに感じたイライラ

Mac上のEmacsで、Tramp modeを使ってリモートサーバ(Linux)上のファイルを編集することが多々あるんだけども、リージョンをコピーしてからyankするときに、「pbpasteが見つからないよ!」みたいな感じて怒られる。よく設定を見直したら、以下が悪さをしてい…

Tramp Modeの情報をまとめたくて

リモートサーバー上のファイルをローカルマシン上で編集できたりするので大変便利。 /ssh:hoge@fuga:/path/to/file Emacs: まだターミナルで消耗してるの? | 葉月夜堂 fukuyama.cod.hatena.ne.jpd.hatena.ne.jpblog.digital-bot.comnishikawasasaki.hatenab…

swiper-multiの使い方

Use "C-M-m" (`ivy-call') to add or remove one more buffer without exiting. Use "C-m" (`ivy-done') to add one last buffer. Or use "C-M-j" (`ivy-immediate-done') to finish without adding more buffers. Hold "C-M-n" (`ivy-next-line-and-call') …

深層学習の勉強に役立つ書籍など(日本語)

Web検索すればスライドの類は見つかるけども、自分は文章としてきちんとまとまった解説を読みたい派なので。 深層学習 Deep Learning (監修:人工知能学会); 出版元:近代科学社 www.amazon.co.jp 深層学習 (機械学習プロフェッショナルシリーズ); 出版元:講…

Company の補完をcase sensitiveにするための設定

companyで補完が走るとき、全部lower caseで補完されるのがストレスフルだから、以下の設定を入れる。 (setq company-dabbrev-downcase nil) 参考 dabbrev - How to make Company mode be case-sensitive on plain Text? - Emacs Stack Exchange

加速度センサの勉強に役立つ資料

http://www.cqpub.co.jp/dwm/contents/0117/dwm011700700.pdf http://star.web.nitech.ac.jp/pdf/070619short.pdf

HDP-HSMMの論文

Bayesian Nonparametric Hidden Semi-Markov Models http://www.jmlr.org/papers/volume14/johnson13a/johnson13a.pdf:および著書の博士論文 Bayesian Time Series Models and Scalable Inference http://www.mit.edu/~mattjj/thesis.pdf

クォータニオン勉強のための参考資料

奥が深いでこれホンマに。 PDF ベクトル・複素数・クォータニオン クォータニオン計算便利ノート MATLABによるクォータニオン数値計算 Quaternions and Rotation Sequences APPLICATION OF QUATERNIONS TO COMPUTATION WITH ROTATIONS Quaternion and its Ap…

Kenichi Kanatani先生による最適化手法の概説論文

Overviews of Optimization Techniques for Geometric Estimation http://www.iim.cs.tut.ac.jp/~kanatani/papers/okatutor.pdf

プレゼンのための参考資料

ちょっと探したのでまとめておく。 研究発表のためのプレゼンテーション技術 from Shinnosuke Takamichi www.slideshare.net Itolab presentation2015 from Takayuki Itoh www.slideshare.net 研究発表で失敗しないための8つのTips from Yasunori Sakai www.…

Richard Diestelのグラフ理論の本が無料で読める(落とせるとは言ってない)

著者のサイト http://diestel-graph-theory.com/ から、リンクをたどることで全ページのプレビューが可能。ただしPDFでは落とせない。 http://www.flooved.com/reader/3447#1

音声のモデル化単位

音声をモデル化する際、付随するテキストの情報が活用できる。最もシンプルなのはテキストをローマ字に変換して、母音と子音という単位で音声を細かく区切ってモデル化することである。これは一つの例であるが、実際はテキスト情報の活用の度合いに応じて、…

コンテキスト依存モデルのまとめ

はじめに 『音声合成の確率的な定式化その4』で必要になるコンテキスト依存モデルについて、簡単にまとめておく。 コンテキスト依存モデル 定義を述べれば、音響的特徴を決定する要因がコンテキストである。音声合成では実際にどのようなものがコンテキスト…

Statistical Parametric Speech Synthesis by Zenさん

HMM音声合成の概要、そして最新の研究トピックを知るには良いスライドhttp://static.googleusercontent.com/media/research.google.com/ja//pubs/archive/42624.pdf

Speech Prosody in Speech Synthesis (2015) という専門書

Springerから2015年に出版されている。 Speech Prosody in Speech Synthesis: Modeling and generation of prosody for high quality and flexible speech synthesis - Springer この本は "Prosody, Phonology and Phonetics" というシリーズの中の一冊であ…

音声情報処理技術の最先端(2004年)

「音声情報処理技術の最先端」という特集が2004年の学会誌『情報処理』にあったようだ。CiNiiからPDFが見れる。 Link以下のトピックである; 隠れマルコフモデルによる音声認識と音声合成 統計的手法を用いた音声モデリングの高度化とその音声認識への応用 …

音声合成の確率統計的な定式化 その3:音声波形のパラメトリック表現

前回までのあらすじ 音声合成の基本問題 をこんな感じに数式で表現して、 次に上式の右辺に現れる予測分布の式変形を進めたのであった。 本記事では式変形をさらに続ける。 音声波形のパラメトリック表現の導入 上式の右辺において、は、音声波形の直接的な…

ソースフィルタモデルについてのまとめ(永遠に未完)

はじめに 『音声合成の確率統計的な定式化:その3』の記事で必要になるので、ここに記事を書いて簡単に整理することにした。本記事はディジタル信号処理の言葉で述べられるので、それについて読者には多少の予備知識を仮定するが、「知らないよ、そんなの(´…

メルケプストラムについてのまとめ

はじめに メルケプストラムとは何か?一言で表せば、 人間の聴覚特性を考慮したケプストラム となるだろうか。本記事ではメルケプストラムについて簡単にまとめる。 メルケプストラムの特徴 ケプストラムとメルケプストラムの違いは以下の図に示す通りである…

暗黒通信団の本を買ってみた(相対論関係)

以下の書籍。 こう見えて相対論 ローレンツ収縮についての考察 一般相対論的運動方程式の導出 「双子のパラドクス」の定量計算 総集編 概要は後ほど書くかも。

音声合成の確率統計的な定式化 その2:予測分布と音響モデルの導入

はじめに 音声データベースからテキストと音声波形、そして任意のテキストが与えられたとき、対応する音声波形を求めよ、というのが音声合成の基本問題だった。 定式化 この問題を確率統計的な視点で捉えてみよう。求めたい音声波形を確率変数として考えて、…

音声合成の確率統計的な定式化 その1:音声合成の基本問題

前回の記事より、HMM音声合成の定式化を勉強する流れで。 音声合成の基本問題 音声データベース(音声波形と対応するテキスト)があるとき,任意に与えられたテキストに対応する音声波形を求めよ 記号は以下のように定義される。 「波形を求めよ」と言われて…

テキスト音声合成のまとめもどき

音声合成難しそうだな(´・ω・`) でも理解したい(`・ω・´) ということで。音声合成ソフトの使い方に関するブログは多いんだけどね。NII山岸先生のスライドをお借りすると、こんな感じにまとめられるみたいだ。ちなみに一番下の青いギザギザが音声の波形。と…

論文の書き方とかサーベイの仕方のリンク集をめざして

そんなものを作ってみたく。探すと見つかるもんだね。 論文の書き方 松尾ぐみの論文の書き方 | 松尾 豊 松尾ぐみの論文の書き方:英語論文 | 松尾 豊 一流論文誌に採択される研究戦略と論文執筆(大阪大学の鷲尾先生) 国際会議論文の読み方・書き方(NAIST…

「10 Deep Learning Trends at NIPS 2015」の日本語化(?)

以下のサイトで、NIPSという国際会議における「深層学習」のトレンドが10個紹介されている。 Brad Neuberg: Ten Deep Learning Trends at NIPS 2015あとから英語を読み返すのはダルいので、日本語で箇条書きにしておこう; ニューラルネットワークの構造は…

深層学習の資料的な

メモメモqiita.comaidiary.hatenablog.com 生成モデルの Deep Learning from Seiya Tokui www.slideshare.net

Deep neural netの層は広いよりも深いほうが良い性能を発揮する

ということをちゃんと理論解析?しているらしい論文。The Power of Depth for Feedforward Neural Networks http://arxiv.org/pdf/1512.03965.pdfちょっと気になるかも。

ポケモンのセレクトバグ

初代ポケモンがVC配信されたことだし。このサイト読めばいいのでは? http://www.geocities.jp/pa_feku/poke/bug2.html後はこれら: ameblo.jp ameblo.jp ameblo.jp色々できるんですねぇ。

行列式という名前の由来ってどこからなのよ?

はじめに 線形代数を勉強した人ならば、行列式という言葉は耳にしたことがあるはずであり、その具体的計算は試験問題になったりして大変な思いをした人もいると思う。かく言う筆者も計算ミスで苦い思い出がある。さてこの行列式であるが、英語ではdeterminan…

板倉文忠先生の博士論文

名古屋大学学術機関リポジトリからダウンロード可能。 NAGOYA Repository: 統計的手法による音声分析合成系に関する研究最尤スペクトル法に基づいてLPC分析を解説している本には、昔から 古井先生の本とか斉藤収三先生の本とかがあるけども、概説なので、 詳…

球面三角法

なじみがあまりないけど。http://www.astro.sci.yamaguchi-u.ac.jp/~kenta/eclipse/SphericalTriangle081106.pdf

微分幾何の古典

超がつくほどの古典をスキャンしたもの。 個人的には嬉しいのもいくつか。 Eisenhartの本とか、Darbouxの本とか。http://geographiclib.sourceforge.net/geodesic-papers/

計量テンソルの行列式の微分公式

とある本を読んでいて、すぐに思い出せなかった。 いつも忘れるのでメモ。 導出はこちらを参考に。 EMANの物理学・相対性理論・行列式を微分する公式

メモ:間違いやすい英語表現

とりあえず。eikaiwable.net eikaiwable.net eikaiwable.net

ポケモンORASをプレイ中

ポケモンORAS(オメガルビー・アルファサファイア)のオメガルビーを先日購入。 ポケモンリーグ殿堂入りした後、現在エピソードデルタをクリアしたところ。久しぶりのポケモンであったが、中々に面白い。 当面は図鑑完成目指して、余暇を利用しながら地道に…

MCMCの高速化、という某記事の元論文(おそらく)

先日、こんな記事が。japan.zdnet.com記事の元ネタの論文はおそらくこれ↓ [1402.1694] Accelerating Asymptotically Exact MCMC for Computationally Intensive Models via Local Approximations難しい\(^o^)/

ガウス過程を取り扱ったD論(随時更新予定)

Roger Frigola-Alcalde, "Bayesian Time Series Learning with Gaussian Processes," Cambridge University(2015)URL Andreas Damianou, "Deep Gaussian Processes and Variational Propagation of Uncertainty," University of Sheffield(2015)URL Andr…

赤池先生からのメッセージ(動画)

YouTubeより。赤池弘次(京都賞2006受賞者)からのメッセージwww.youtube.com 今後統計学が重要になる分野 あらゆる科学技術の分野,哲学を含め,モノの考え方に関連するところはどこにでも関係してくる。 創造性を維持していくには 創造性を維持するよりむ…

日本語で読める赤池先生の論文(PDF)

備忘録として。PDFで電子的に読めないものは省略。 和文の論文リストは以下から。 和文論文 | 故赤池弘次先生記念ウェブサイト 赤池記念館 傳播現象の統計数理的解析―I―マイクロウェイブに於けるフェイディングの一分析― 統計数理研究輯報, 第11号, (1953),1…

SPTKをDOS窓からコンパイル

1. Visual Studio をインストール 2. DOS窓を開く 3. 以下を入力 C:\Program Files\Microsoft Visual Studio 某(あなたのバージョン番号)\VC\bin\vcvar32.bat4.SPTKのソースがあるフォルダに移動して以下を入力 nmake /f Makefile.mak nmake /f Makefile.mak…

^M (CR改行コード)をLF改行コードに置換

メモ。 M-x replace-string RET C-q C-m RET C-q C-j RET replace-stringはquery-replace (M-%)などでもよい。 また以下のマクロも悪くはない: (fset 'replace-ctrlms [escape ?< escape ?% ?\C-q ?\C-m return ?\C-q ?\C-j return ?!]) (global-set-key "\C…

ace-pinyinをace-isearchで用いるときのやり方

ace-jump-modeはもともと英数字のみを対象にジャンプするコマンドだが、これを日本語文字に対しても利用可能にしたのがるびきち氏であった: emacs ace-pinyin.el : 【念願のMigemo化】ace-jump-char-modeが日本語文字に対応!(元中国語) | MELPA Emacs Lisp…

avyを用いた関数の小ネタ集

avyという便利なパッケージが最近出てきた。 詳細は以下の記事を参考に。 qiita.comさて、このavyを用いて、指定した範囲のテキスト、すなわち指定する2行に挟まれるテキストに対してコピーやペースト、インデントやコメントアウトなどを行う関数を書いてみ…

ベクトルポテンシャルを用いて書いたマクスウェル方程式

数式の練習を兼ねて。 ただただ美しいというか、かっこいい。

基本周波数抽出実験 for 歌声データ

はじめに 前回の記事は対象となるデータが通常の話し言葉だった。 今回は歌声に対してやってみた。 実験 実験条件 データ HTSの歌声合成デモスクリプト に同梱のnitech_jp_song070_f001_003.raw サンプリング周波数 48kHz 量子化ビット数 16bit SPTKのバージ…

基本周波数抽出器 REAPERによる抽出実験

はじめに とあるメーリングリストHTS-users に投稿があった: [hts-users:04236] REAPER: the pitch tracker音声のピッチ抽出器とのこと。せっかくだから試してみよう、というわけである。なお基本周波数の簡単な知識については先の記事を参考に。 基本周波…