概要 しゃべったことが文字になる
$0.02 USD/分
Bulemixにログイン
右上にある「カタログ」リンクをクリック。「カタログページ」遷移できます。
[サービス]-[Watson]-[Speech To Text]をクリック
右下の「作成」ボタンを押す
[Demo]をクリック
APIなどの資料へのリンクがありますが、[Transcribe Audio]-[Voice Model:]-[Japanease 8kHz か16kHz]を選択
[Keywords to spot:]にしゃべるであろうキーワードを入れておきます。
マイクの準備を確認してある前提ですが、[Record Audio]をクリックすると、認識が開始します。
一般的な用語については、高い認識率でしたが、サーバにデータを転送し展開し稼働させる一連の処理を意味する「デプロイ」という単語については、「で黒い」とか、「で鎧」とか、 10回ぐらい試したのですが、かたくなに認識してくれませんでした。
curl -X POST -u {ユーザ名}:{パスワード}
--header "Content-Type: audio/flac"
--header "Transfer-Encoding: chunked"
--data-binary @{音声データの入ったパス}audio-file.flac
"https://stream.watsonplatform.net/speech-to-text/api/v1/recognize"
{
"results": [
{
"alternatives": [
{
"confidence": 0.8691191673278809,
"transcript": "翻訳結果の文字 "
}
],
"final": true
}
],
"result_index": 0
}