オンライン版の使い方

オンライン版の使い方

オンライン版の使い方について説明します。

概要

Google Colaboratory(以下 Colab)はブラウザ上でGoogleのクラウドPCを動かせるウェブサービスです。こちらのサービスを利用してオンライン上でNEUTRINOを動かします。
ブラウザ上で機械学習・ディープラーニングのプログラムを実行したり、結果の確認がノートを書いているかのようにできることが特徴で、データ分析の現場や研究、教育などで広く用いられています。
ウェブブラウザ上で動作が完結するためPCすら不要で、スマートフォンなどでも動作します。そして何とColabでは無料でGPUも使用することができます。
この機会にぜひ最新のニューラルボコーダー歌声合成(NSF版)をご体験ください。

必要なもの

  • Googleアカウント
     お持ちでない場合はこちらから作成してください。
  • webブラウザ
     主要なブラウザで動作します。
     ChromeとFirefoxがお勧めです。

導入方法

1. NEUTRINO(オンライン版)をダウンロードし解凍

2. Google Driveにアクセス

3. マイドライブに”Colab Notebooks”フォルダを作成し、先ほど解凍したNEUTRINOをコピー

4.NEUTRINOフォルダに移動して右クリック、「その他」→「アプリを追加」を選択

5.「Colaboratory」を検索し追加する。

6.NEUTRINOフォルダ内にある「NEUTRINO.ipynb」を右クリック→「アプリで開く」→「Google Colaboratory」でノートブックを開きます。

7.画面上部のメニューの「ランタイム」→「ランタイムのタイプを変更」でノートブックの設定を開きます。Python3とGPUが選択されていることを確認します。

8.セルの左に表示されている[]又は再生ボタンを順番に押して実行していきます。
ユーザー認証のリンクが表示された場合は、リンクをクリックして認証を行います。認証コードが表示されるのでそれをコピー&ペーストで入力してください。

9.後は順番に実行していけば、音声がNEUTRINO/output以下に出力されます。

10.お手持ちのMusicXMLを使う場合は、score/musicxmlフォルダにアップロードし、BASENAMEを変更して4番を再度実行してください。

11.ローカルPCで作成した音響特徴量ファイル(f0、mgc、bap)やラベルファイルを使う場合は、scoreフォルダ・outputフォルダをそのままアップロードし、BASENAMEを変更し、5番のNSFを再度実行してください。
※4番を動かすと上書きされてしまうので注意してください!

備考

割り当てられるCPUのスペックがそこまで良くないので、ローカルでWORLDまで動かしておいてNSFだけColab上で動かした方が速く合成が終わります。
NSF部分は初回実行時は遅い(0.5~1.0倍速)ですが、二回目以降は高速(約5倍速)です。

色々と複雑そうに見えますが、最初のセットアップが20~30分程度掛かるだけで以降は従来の流れとほぼ変わりません。
ぜひ最新の ニューラルボコーダー歌声合成 (NSF版)をご体験ください。

よくある質問

・Notebookの2番でフォルダに移動できない。
環境設定によっては、半角スペースの前に%が不要な場合があります。
その場合は、下記のように’\ ‘→’ ‘ (%を除去)にすると移動できます。
×: %cd drive/My\ Drive/Colab\ Notebooks/NEUTRINO/
〇:%cd drive/My Drive/Colab Notebooks/NEUTRINO/

・音声が正常に出力されない or 途中で処理が止まる
まずはファイルが全て同期されているかチェックしてください。
ファイルが不足している場合は正常に出力が行われません。
ブラウザによっては空フォルダがアップロードされない場合があります。ブラウザを変えていただくと動作する可能性があります。

また、ノイズのような音声が出力される場合は、Google Colaboratory自体を再インストールすると直るケースもあるようです。

その他

上記のようにGoogle Colaboratoryは素晴らしいサービスです。
一部制約はあるものの、GPU環境が無償で利用でき、OSも関係なく、持ち運びやチーム内での共有も非常に容易です。
まずは歌声合成でディープラーニングの効果を実感いただき、一人でも多くの方ディープラーニング・機械学習を始めるきっかけになれば幸いです。