「open-jtalk」日本語音声合成を使ってみようと思います。
open-jtalkはフリーで利用できる日本語音声合成エンジンで、入力された日本語文字を音声合成して読み上げてくれます。今回は、インストールと、ちょっとした実行だけですが、既にiPhoneに実装されているような「アクセシビリティ」等がありますが、更に色々発展させていくと何か便利な物が出来る予感がしますね。。
下記のサイトではWeb上でのデモンストレーションが出来ます。
http://www.sp.nitech.ac.jp/demo/open_jtalk/
じゃUbuntuにインストールしていきます。
sudo apt-get install open-jtalk open-jtalk-mecab-naist-jdic hts-voice-nitech-jp-atr503-m001 |
実行時オプションが多いのでシェルを作って実行する
シェル作成「talk.sh」(とりあえずホームディレクトリの直下に置く)
#!/bin/sh TMP=~/open-talk.wav touch $TMP cd /usr/share/hts-voice/nitech-jp-atr503-m001 #cd /usr/share/hts-voice/mei_happy echo "$1" | open_jtalk \ -td tree-dur.inf \ -tf tree-lf0.inf \ -tm tree-mgc.inf \ -md dur.pdf \ -mf lf0.pdf \ -mm mgc.pdf \ -dm mgc.win1 \ -dm mgc.win2 \ -dm mgc.win3 \ -df lf0.win1 \ -df lf0.win2 \ -df lf0.win3 \ -dl lpf.win1 \ -ef tree-gv-lf0.inf \ -em tree-gv-mgc.inf \ -cf gv-lf0.pdf \ -cm gv-mgc.pdf \ -k gv-switch.inf \ -s 16000 \ -a 0.05 \ -u 0.0 \ -jm 1.0 \ -jf 1.0 \ -jl 1.0 \ -x /var/lib/mecab/dic/open-jtalk/naist-jdic \ -ow $TMP && \ aplay --quiet $TMP |
シェルを使う場合はここから取得して!(上のやつコピーすると動きません)
https://gist.github.com/4701715
ちょっとだけ説明
「-ow」で指定したWAVファイル(~/open-talk.wav)で保存される。
その他に、数値の部分を適当にいじると話速、声質、ピッチが変えられる。
実行
【なんちゃってモヤモヤさまぁ~ず】
~/talk.sh 最近は、なんだか忙しいんですが、今日は小田急線の、祖師ヶ谷大蔵駅に来てみた。ここは、商店街も多くあって、賑やかな街なんだよね
【エスカレーターのご利用について】
~/talk.sh エスカレーターのご利用について・移動手すり・デッキボードの上に乗らないでください。からだをはさまれたり、転落の原因となるんだよね
【ホーム案内】
~/talk.sh 3番線に・電車が・まいります。黄色い線の・内側まで・下がって待ちなよっ。この電車は、急行なんで、次止まる駅に、気をつけたほうがいいと思うんだよね。
【祇園精舎】
~/talk.sh 祗園精舎の鐘の声、諸行無常の響きあり。娑羅双樹の花の色・盛者必衰のことわりをあらわす。
~/talk.sh おごれる人も久しからず、唯春の夜の夢のごとし。たけきものもついにはほろびぬ、偏に風の前の塵に同じ。