音声認識エンジンJuliusをインストールする
更新日:2020.10.25
作成日:2016.12.21
音声認識エンジンを調査したときのメモです。
音声認識エンジン
- Apple - Siri
- Google -
- Microsoft - Bing API
- Julius
Juliusとは
Juliusは、フリーの高性能音声認識ソフトウェアです。
http://julius.osdn.jp/index.php?q=whatis.html
Juliusのインストール
Juliusで音声から文字起こしする(ディクテーション)をする場合は、最小限のモデル(不特定話者音響モデル + 汎用言語モデル)が必要です。
以下の手順でJulius本体と、モデルをインストールします。
1. 下記URLから最新版のJulius(4.4.2)をダウンロード
2. ダウンロードしたファイルを解凍し、make install
$ cd julius-4.4.2
$ ./configure
$ make
$ make install
3. インストールを確認
問題なくインストールされていたら、以下のコマンドを実行すればJuliusのバージョンが表示される。
$ julius -version
JuliusLib rev.4.4.2 (fast)
Engine specification:
- Base setup : fast
- Supported LM : DFA, N-gram, Word
- Extension :
- Compiled by : gcc -g -O2
Library configuration: version 4.4.2
- Audio input
primary A/D-in driver : coreaudio (MacOSX CoreAudio)
available drivers :
wavefile formats : RAW and WAV only
max. length of an input : 320000 samples, 150 words
- Language Model
class N-gram support : yes
MBR weight support : yes
word id unit : short (2 bytes)
- Acoustic Model
multi-path treatment : autodetect
- External library
file decompression by : zlib library
- Process hangling
fork on adinnet input : no
- built-in SIMD instruction set for DNN
SSE AVX FMA
FMA is available maximum on this cpu, use it
Try `-help' for more information.
4. Git Large File Storage
のインストール
次の手順においてダウンロードするリポジトリが2GBぐらいあります。
そのため、git-lfs(Git Large File Storage)をインストールしないと途中でgit cloneが失敗する(と記載があった)ので、まずは以下のコマンドを実行してGit Large File Storage
をインストールします。
$ brew install git-lfs