Ubuntuで「open-jtalk」日本語音声合成を使ってみる

「open-jtalk」日本語音声合成を使ってみようと思います。
open-jtalkはフリーで利用できる日本語音声合成エンジンで、入力された日本語文字を音声合成して読み上げてくれます。今回は、インストールと、ちょっとした実行だけですが、既にiPhoneに実装されているような「アクセシビリティ」等がありますが、更に色々発展させていくと何か便利な物が出来る予感がしますね。。

openj

下記のサイトではWeb上でのデモンストレーションが出来ます。

http://www.sp.nitech.ac.jp/demo/open_jtalk/

 

 

じゃUbuntuにインストールしていきます。

sudo apt-get install open-jtalk open-jtalk-mecab-naist-jdic hts-voice-nitech-jp-atr503-m001

 

実行時オプションが多いのでシェルを作って実行する

シェル作成「talk.sh」(とりあえずホームディレクトリの直下に置く)

#!/bin/sh
TMP=~/open-talk.wav
touch $TMP
cd /usr/share/hts-voice/nitech-jp-atr503-m001
#cd /usr/share/hts-voice/mei_happy
echo "$1" | open_jtalk \
-td tree-dur.inf \
-tf tree-lf0.inf \
-tm tree-mgc.inf \
-md dur.pdf \
-mf lf0.pdf \
-mm mgc.pdf \
-dm mgc.win1 \
-dm mgc.win2 \
-dm mgc.win3 \
-df lf0.win1 \
-df lf0.win2 \
-df lf0.win3 \
-dl lpf.win1 \
-ef tree-gv-lf0.inf \
-em tree-gv-mgc.inf \
-cf gv-lf0.pdf \
-cm gv-mgc.pdf \
-k gv-switch.inf \
-s 16000 \
-a 0.05 \
-u 0.0 \
-jm 1.0 \
-jf 1.0 \
-jl 1.0 \
-x /var/lib/mecab/dic/open-jtalk/naist-jdic \
-ow $TMP && \
aplay --quiet $TMP

 

シェルを使う場合はここから取得して!(上のやつコピーすると動きません)

https://gist.github.com/4701715


ちょっとだけ説明
「-ow」で指定したWAVファイル(~/open-talk.wav)で保存される。
その他に、数値の部分を適当にいじると話速、声質、ピッチが変えられる。

 

実行

【なんちゃってモヤモヤさまぁ~ず】
~/talk.sh 最近は、なんだか忙しいんですが、今日は小田急線の、祖師ヶ谷大蔵駅に来てみた。ここは、商店街も多くあって、賑やかな街なんだよね


【エスカレーターのご利用について】

~/talk.sh エスカレーターのご利用について・移動手すり・デッキボードの上に乗らないでください。からだをはさまれたり、転落の原因となるんだよね

 

【ホーム案内】

~/talk.sh 3番線に・電車が・まいります。黄色い線の・内側まで・下がって待ちなよっ。この電車は、急行なんで、次止まる駅に、気をつけたほうがいいと思うんだよね。

 

【祇園精舎】

~/talk.sh 祗園精舎の鐘の声、諸行無常の響きあり。娑羅双樹の花の色・盛者必衰のことわりをあらわす。
~/talk.sh おごれる人も久しからず、唯春の夜の夢のごとし。たけきものもついにはほろびぬ、偏に風の前の塵に同じ。


 

 

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です