2016-03-01から1ヶ月間の記事一覧

Richard Diestelのグラフ理論の本が無料で読める(落とせるとは言ってない)

著者のサイト http://diestel-graph-theory.com/ から、リンクをたどることで全ページのプレビューが可能。ただしPDFでは落とせない。 http://www.flooved.com/reader/3447#1

音声のモデル化単位

音声をモデル化する際、付随するテキストの情報が活用できる。最もシンプルなのはテキストをローマ字に変換して、母音と子音という単位で音声を細かく区切ってモデル化することである。これは一つの例であるが、実際はテキスト情報の活用の度合いに応じて、…

コンテキスト依存モデルのまとめ

はじめに 『音声合成の確率的な定式化その4』で必要になるコンテキスト依存モデルについて、簡単にまとめておく。 コンテキスト依存モデル 定義を述べれば、音響的特徴を決定する要因がコンテキストである。音声合成では実際にどのようなものがコンテキスト…

Statistical Parametric Speech Synthesis by Zenさん

HMM音声合成の概要、そして最新の研究トピックを知るには良いスライドhttp://static.googleusercontent.com/media/research.google.com/ja//pubs/archive/42624.pdf

Speech Prosody in Speech Synthesis (2015) という専門書

Springerから2015年に出版されている。 Speech Prosody in Speech Synthesis: Modeling and generation of prosody for high quality and flexible speech synthesis - Springer この本は "Prosody, Phonology and Phonetics" というシリーズの中の一冊であ…

音声情報処理技術の最先端(2004年)

「音声情報処理技術の最先端」という特集が2004年の学会誌『情報処理』にあったようだ。CiNiiからPDFが見れる。 Link以下のトピックである; 隠れマルコフモデルによる音声認識と音声合成 統計的手法を用いた音声モデリングの高度化とその音声認識への応用 …

音声合成の確率統計的な定式化 その3:音声波形のパラメトリック表現

前回までのあらすじ 音声合成の基本問題 をこんな感じに数式で表現して、 次に上式の右辺に現れる予測分布の式変形を進めたのであった。 本記事では式変形をさらに続ける。 音声波形のパラメトリック表現の導入 上式の右辺において、は、音声波形の直接的な…

ソースフィルタモデルについてのまとめ(永遠に未完)

はじめに 『音声合成の確率統計的な定式化:その3』の記事で必要になるので、ここに記事を書いて簡単に整理することにした。本記事はディジタル信号処理の言葉で述べられるので、それについて読者には多少の予備知識を仮定するが、「知らないよ、そんなの(´…

メルケプストラムについてのまとめ

はじめに メルケプストラムとは何か?一言で表せば、 人間の聴覚特性を考慮したケプストラム となるだろうか。本記事ではメルケプストラムについて簡単にまとめる。 メルケプストラムの特徴 ケプストラムとメルケプストラムの違いは以下の図に示す通りである…

暗黒通信団の本を買ってみた(相対論関係)

以下の書籍。 こう見えて相対論 ローレンツ収縮についての考察 一般相対論的運動方程式の導出 「双子のパラドクス」の定量計算 総集編 概要は後ほど書くかも。

音声合成の確率統計的な定式化 その2:予測分布と音響モデルの導入

はじめに 音声データベースからテキストと音声波形、そして任意のテキストが与えられたとき、対応する音声波形を求めよ、というのが音声合成の基本問題だった。 定式化 この問題を確率統計的な視点で捉えてみよう。求めたい音声波形を確率変数として考えて、…

音声合成の確率統計的な定式化 その1:音声合成の基本問題

前回の記事より、HMM音声合成の定式化を勉強する流れで。 音声合成の基本問題 音声データベース(音声波形と対応するテキスト)があるとき,任意に与えられたテキストに対応する音声波形を求めよ 記号は以下のように定義される。 「波形を求めよ」と言われて…

テキスト音声合成のまとめもどき

音声合成難しそうだな(´・ω・`) でも理解したい(`・ω・´) ということで。音声合成ソフトの使い方に関するブログは多いんだけどね。NII山岸先生のスライドをお借りすると、こんな感じにまとめられるみたいだ。ちなみに一番下の青いギザギザが音声の波形。と…

論文の書き方とかサーベイの仕方のリンク集をめざして

そんなものを作ってみたく。探すと見つかるもんだね。 論文の書き方 松尾ぐみの論文の書き方 | 松尾 豊 松尾ぐみの論文の書き方:英語論文 | 松尾 豊 一流論文誌に採択される研究戦略と論文執筆(大阪大学の鷲尾先生) 国際会議論文の読み方・書き方(NAIST…

「10 Deep Learning Trends at NIPS 2015」の日本語化(?)

以下のサイトで、NIPSという国際会議における「深層学習」のトレンドが10個紹介されている。 Brad Neuberg: Ten Deep Learning Trends at NIPS 2015あとから英語を読み返すのはダルいので、日本語で箇条書きにしておこう; ニューラルネットワークの構造は…

深層学習の資料的な

メモメモqiita.comaidiary.hatenablog.com 生成モデルの Deep Learning from Seiya Tokui www.slideshare.net

Deep neural netの層は広いよりも深いほうが良い性能を発揮する

ということをちゃんと理論解析?しているらしい論文。The Power of Depth for Feedforward Neural Networks http://arxiv.org/pdf/1512.03965.pdfちょっと気になるかも。