Skip to content

sp-nitech/Voist

Repository files navigation

Voist

screen

  • このソフトウェアは,円滑な音声収録を目的として,名古屋工業大学徳田研究室により開発されたものです.
  • Windowsのみインストーラを用意していますが,Javaを用いているため,ビルド次第では他のOSで動作できる可能性があります.

インストール方法

  1. リリースページからVoist.msiをダウンロードしてください.
  2. ダウンロードしたVoist.msiを実行し,起動したインストーラに従ってください.

収録手順

  1. メニューの左上にある『ファイル』から『ユーザの変更』を選択して,任意のユーザ名を入力して『変更』ボタンを押します.
    1. PCを共有していない場合,ユーザ名を変える必要はありません.
    2. 音声ファイルはC:/Users/(Windowsのユーザ名)/Documents/Voist/recording/(ユーザ名)/(プロンプト名)/以下に保存されます.
  2. メニューの『設定』→『プロンプト』→ 『フォントタイプ』から好みのフォントを選択します.
    1. F2, F3キーでも変更可能です.
  3. メニューの『設定』→『プロンプト』→ 『フォントサイズ』からフォントの大きさを設定します.
    1. マウスホイールでも調整可能です.
  4. 『サンプル再生』ボタンを押して,お手本の音声を聞きます.
    1. サンプル音声ファイルはC:/Users/(Windowsのユーザ名)/Documents/Voist/sample/(プロンプト名)/以下に配置されている必要があります.
    2. サンプル音声ファイル名は録音ファイル名と同一である必要があります.
    3. サンプル音声が無い場合や,お手本に従う必要がない場合はスキップしてください.
  5. 『収録開始』ボタンを押すとビープ音が再生されるので,一拍置いてから文を読み上げます.
  6. 文を読み終わったら,同様に一拍置いてから『収録停止』ボタンを押します.
    1. 「収録に失敗しました」というメッセージが出た場合,メッセージに従って再収録してください.
  7. 必要に応じて『収録音声再生』ボタンを押して,収録音声を確認します.
  8. 『次の文へ』ボタンを押して,すべての文を収録するまで同様の操作を繰り返します.
    1. メニューの『表示』→『収録フォルダ』から収録した音声を確認できます.

Q&A

  • 収録の成功条件を厳しくしたいです.
    • メニューの『設定』→『音声収録』から所望の設定に変更してください.
  • 漢字の読めない小さな子に読ませたいです.
    • メニューの 『設定』→『プロンプト』→『ルビタイプ』からBを選択してください.
    • F1キーでも変更可能です.
  • 一文当たりの録音の最大時間は何秒ですか.
    • 20秒です.
  • サンプリング周波数を変更したいです.
    • インストールされたVoist/res/properties/system.Voist.propertiesSAMPLE_RATEを変更してください.
    • 1000Hz ~ 96000Hzまで対応しています.
  • ビットレートを変更したいです.
    • インストールされたVoist/res/properties/system.Voist.propertiesSAMPLE_SIZEを変更してください.
    • 2 (16bit), 3 (24bit), 4 (32bit)のみ対応しています.すべて整数型です.
  • サンプル再生ボタンを隠したいです.
    • res/properties/system.Buttons.propertiesUSE_SAMPLEfalseにしてください.
  • 音声合成器を作りたいです.
    • こちらのソフトウェアは音声収録のみを目的としています.
    • HTSESPnet等のソフトウェアをご利用ください.

開発環境の構築(開発者向け)

要件

手順

  1. 前準備
    1. git clone https://github.com/sp-nitech/Voist.git
    2. CallPortAudio.dllportaudio_x64.dllがシンボリックリンクになっているか確認する.
    3. tools/以下にあるmake1.batを実行する.
    4. tools/java/jdk-21_windows-x64_bin.exeを実行してJDKをインストールする(インストール先はデフォルトのまま).
    5. tools/以下にあるmake2.batを実行する.
  2. ASIO SDKをダウンロード
    1. SteinbergからASIO SDKをダウンロードする.
    2. ダウンロードしたzipファイルを解凍する.
    3. 解凍してできたディレクトリをASIOSDKにリネームする.
    4. リネームしたASIOSDKtools/portaudio/src/hostapi/asio/に配置する.
  3. PortAudioをコンパイル
    1. tools/portaudio/msvc/portaudio.slnを開く.
    2. プロジェクトの変換について聞かれるのでOKを押す(警告が出るが無視する).
    3. ソリューション構成をDebugからReleaseに変更する.
    4. プラットフォームがx64になっているか確認する.
    5. 『プロジェクト』→『プロパティ』→『構成プロパティ』→『C/C++』を選択する.
      1. プラットフォームがx64になっているか確認する.
      2. 『最適化』→『フレームポイントなし』を『はい/(Oy)』にする.
      3. 『コード生成』→『ランタイムライブラリ』を『マルチスレッド(/MT)』にする.
      4. 『コード生成』→『浮動小数点モデル』を『Fast/(fp:fast)』にする.
    6. 『ビルド』→『ソリューションのビルド』を実行する.
  4. CallPortAudioをコンパイル
    1. extern/CallPortAudio.slnを開く.
    2. ソリューション構成をDebugからReleaseに変更する.
    3. プラットフォームがx64になっているか確認する.
    4. 『ビルド』→『ソリューションのビルド』を実行する.
  5. Voistをコンパイル
    1. Eclipse FoundationからEclipseのインストーラをダウンロードする.
    2. インストーラを実行する.
    3. Eclipse IDE for Java Developersを選択して,そのままINSTALLボタンを押す.
    4. Eclipseを起動する.Workspaceは任意で良い.
    5. 『File』→『Open Projects from File System...』から,このリポジトリのルートディレクトリを指定する.
    6. 『Run』→『Run』で動作確認する.
  6. インストーラを作成
    1. Eclipseの『File』→『Export...』→『Java』→『Runnable JAR file』からJARファイルを出力する.
      1. Launch configuration: Voist
      2. Export destination: Voist/package/bin/Voist.jar
      3. Package required libraries into generated JAR: チェック
    2. tools/launch4j/launch4j-3.50-win32.exeを実行してLaunch4jをインストールする.
    3. Launch4j.exeを起動してJARファイルをEXEファイルに変換する.
      1. package/res/launch4j.config.xmlを開く.
      2. Build wrapper(歯車のボタン)を実行する.
    4. tools/wixedit/WixEdit-0.8.1417.11.msiを実行してWixEditをインストールする.
    5. WixEditを起動してインストーラを作成する.
      1. package/res/wixedit.config.wxsを開く.
      2. 『Build』→『Build MSI setup package』を実行する.
    6. インストーラpackage/bin/Voist.msiを実行して動作確認する.
  7. 後処理
    1. tools/llvm/LLVM-17.0.1-win64.exeを実行してclang-formatをインストールする.
    2. tools/以下にあるformat.batを実行する.

参考文献

@InProceedings{sp-nitech2016voist,
  author = {吉村建慶 and 橋本佳 and 大浦圭一郎 and 南角吉彦 and 徳田恵一},
  title = {クラウドソーシングによる音声収集のための収録ソフトウェアの設計},
  booktitle = {日本音響学会2016年春季研究発表会},
  pages = {307--308},
  year = {2016},
}