Google Speech APIを利用して音声認識をしてみたところなかなか優秀
Google Speech API ver.2の使い方 - Qiitaを参考に試用。
つまづいた点だけメモ。
- 日本アカウントによるGoogle Speech APIのキー取得にはChromiumのグループに参加が必須。
https://groups.google.com/a/chromium.org/forum/?fromgroups#!forum/chromium-dev - SoX (Sound eXchange)がインストールされていなかったのでインストール。
(下記ページからダウンロードした実行ファイルを/usr/local/binにコピー。brew install soxでもいけるとの情報があったがエラーになったため断念)
SoX - Sound eXchange | HomePage - 音源がステレオだと認識してもらえないらしく、常に空のレスポンスが。。。モノクロに変換する必要あり。(参考URLのソースコードに下記赤文字を追加)
sox_command_template = "sox %s -r 16000 -c 1 %s.flac"