概要 しゃべったことが文字になる
$0.02 USD/分
Bulemixにログイン
右上にある「カタログ」リンクをクリック。「カタログページ」遷移できます。
[サービス]-[Watson]-[Speech To Text]をクリック
右下の「作成」ボタンを押す
[Demo]をクリック
APIなどの資料へのリンクがありますが、[Transcribe Audio]-[Voice Model:]-[Japanease 8kHz か16kHz]を選択
[Keywords to spot:]にしゃべるであろうキーワードを入れておきます。
マイクの準備を確認してある前提ですが、[Record Audio]をクリックすると、認識が開始します。
一般的な用語については、高い認識率でしたが、サーバにデータを転送し展開し稼働させる一連の処理を意味する「デプロイ」という単語については、「で黒い」とか、「で鎧」とか、 10回ぐらい試したのですが、かたくなに認識してくれませんでした。
curl -X POST -u {ユーザ名}:{パスワード} --header "Content-Type: audio/flac" --header "Transfer-Encoding: chunked" --data-binary @{音声データの入ったパス}audio-file.flac "https://stream.watsonplatform.net/speech-to-text/api/v1/recognize"
{ "results": [ { "alternatives": [ { "confidence": 0.8691191673278809, "transcript": "翻訳結果の文字 " } ], "final": true } ], "result_index": 0 }
動作確認のため、あらかじめ会話をjson形式であらかじめ定義しておけます。
watsonのConversation toolingページを開きます。
Launch toolボタンをクリックします。
createボタンの右側にある↑矢印のアイコンが、Importボタンと呼ばれ、これをクリックすることで、jsonで定義した会話が利用できるよう、準備されます。
http://qiita.com/tsota/items/497513585f069386626f