Jetson NanoでTacotron2（音声合成）を動かす

Jetson Nano 音声合成

Jetson nanoでTacotron2を動かしてみます。なお本記事は2019年11月末時点のものです。ツールのバージョンアップ等により、この手順で動かなくなることもありうるので、あらかじめご容赦ください。 Jetson NanoでTacotron2＋WaveGlowが動きましたが、実行に約…

2019-11-30

Tacotron2を調べてみた３

音声合成

前回はDecoderの概要部分でしたので、次は中身を見ていきたいと思います。 2.6 decode,2.7 Location Sensitive Attention,2.8 Postnet,2.9 Tacotron2.inferenceの出力。複雑なところは図にまとめました。

2019-11-28

Tacotron2を調べてみた２

音声合成

前回の続きです。誤記、わかりやすくするため、たびたび加筆、修正するかも知れませんが、ご容赦頂きたく。akifukka.hatenablog.com 2.3 Decoderの概要ここからはmodel.pyのクラスTacotron2のinferenceの次の文の中身になります。Decoderはちょっと入り組ん…

2019-11-21

Tacotron2を調べてみた1

音声合成

以前Colaboratoryで試して、英語の音声合成ができることはわかったので、日本語を目標にまずはtacotron2の中身を解説してみます。Googleの論文とNVIDIA実装を中心に見ていきます。過去にColaboratoryで試した時の記事akifukka.hatenablog.com GoogleのTacot…

2019-11-19

ランニングことはじめ２

ランニング

この記事は2019年秋現在です。今回は、今実際に使っているものを中心にランニングに便利なグッヅを紹介します。ちなみに、毎週土曜は21km、日曜は10kmと、週2回のペースでランニングしています。１．シューズ何はともあれこれでしょう。前回も書いた通り…

2019-11-16

音声合成を試す2

音声合成

少し解説を。(1)メルスペクトログラム(2)発声の仕組み(3)耳での音の周波数成分分解(4)声帯の発生音周波数と声道（喉、口）の共鳴スペクトラム(5)ケプストラム python用ライブラリlibrosaを使って音声の周波数解析も試してみます。

2019-11-15

音声合成を試す1 Tacotron2 + WaveGlow

音声合成

ディープラーニングによって音声合成も目覚ましく進歩しているようです。 2019年4月に発表されたマイクロソフトAIりんなの歌の完成度は非常に高く、人と区別つきません。まだ、誰もが使える技術ではありませんが、いつかは誰もがつかえるようになるでしょう…

2019-11-13

ランニングことはじめ1

ランニング

2018年の春にランニングを始め、1年半ほどになります。先月になってやっとハーフ21kmを走り切ることができるようになり、今は土曜ﾆ21km、日曜は5kmか10kmを走っています。これからランニングを始めようと思っている方に多少なりとも参考になれば思い、走り…

2019-11-12

SingleShotPoseをYOLOv2-Tinyベースにして高速化を試みる2

Jetson Nano

前回の記事の続きです。Colaboratoryで改造したネットワーク構造でSingleShotPoseを学習させ、動かしてみます。最後にJetson Nanoでも動かしてみました。計算時間の短縮と引き換えに精度が下がってしまいました。

2019-11-09

SingleShotPoseをYOLOv2-Tinyベースにして高速化を試みる１

Jetson Nano

高速化のためSingleShotPoseのネットワーク構造をYOLOv2ベースからYOLOv2-Tinyに変更して学習させてみます。この記事は前の記事でGoogleドライブにSingleShotPoseがダウンロード済みであることを前提に書かれています。

2019-11-06

SingleShotPoseをColaboratoryで動かしてみた

Jetson Nano

SingleShotPoseをColaboratoryで動かしてみます。本記事の手順は2019年11月のものです。scipyのバージョンアップのため若干修正して動かすことができました。

2019-11-04

多摩川ランニング　2019年11月4日

ランニング

多摩川サイクリングロードをランニングしてきました。涼しい中、気持ちのいい天気でごきげんでしたが、おかげで筋肉痛ぎみです。往復約21kmで約2時間ほどのコースです。写真でコースを紹介します。

2019-11-02

Jetson NanoでSingleShotPoseを動かす

Jetson Nano

SingleShotPoseはMicrosoftが開発した対象物の姿勢を画像から推定するネットワークです。ネットワークの構造はYOLOをヒントに開発されたとあって良く似た構造です。極端に大きなネットワークでは無いのでJetson Nanoで試しに動かしてみます。

やってみた！

試したことを中心に、書評や興味のあること、思ったこととか

2019-11-01から1ヶ月間の記事一覧

Jetson NanoでTacotron2（音声合成）を動かす

Tacotron2を調べてみた３

Tacotron2を調べてみた２

Tacotron2を調べてみた1

ランニングことはじめ２

音声合成を試す2

音声合成を試す1 Tacotron2 + WaveGlow

ランニングことはじめ1

SingleShotPoseをYOLOv2-Tinyベースにして高速化を試みる2

SingleShotPoseをYOLOv2-Tinyベースにして高速化を試みる１

SingleShotPoseをColaboratoryで動かしてみた

多摩川ランニング　2019年11月4日

Jetson NanoでSingleShotPoseを動かす