- 追加された行はこの色です。
- 削除された行はこの色です。
*SpeachToText [#j1ade56a]
概要
しゃべったことが文字になる
*流れ [#l423a9fd]
BlueMix上でSpeachToTextを使う
*コスト [#y110373a]
$0.02 USD/分
*STEP [#jc6433ff]
Bulemixにログイン
右上にある「カタログ」リンクをクリック。「カタログページ」遷移できます。
[サービス]-[Watson]-[Speech To Text]をクリック
右下の「作成」ボタンを押す
[Demo]をクリック
APIなどの資料へのリンクがありますが、[Transcribe Audio]-[Voice Model:]-[Japanease 8kHz か16kHz]を選択
[Keywords to spot:]にしゃべるであろうキーワードを入れておきます。
マイクの準備を確認してある前提ですが、[Record Audio]をクリックすると、認識が開始します。
*結果 [#ze508b53]
一般的な用語については、高い認識率でしたが、サーバにデータを転送し展開し稼働させる一連の処理を意味する「デプロイ」という単語については、「で黒い」とか、「で鎧」とか、
10回ぐらい試したのですが、かたくなに認識してくれませんでした。
*呼び出すコマンド例 [#u9de23b9]
curl -X POST -u {ユーザ名}:{パスワード}
--header "Content-Type: audio/flac"
--header "Transfer-Encoding: chunked"
--data-binary @{音声データの入ったパス}audio-file.flac
"https://stream.watsonplatform.net/speech-to-text/api/v1/recognize"
**帰ってくるJSON [#v4ab59ac]
{
"results": [
{
"alternatives": [
{
"confidence": 0.8691191673278809,
"transcript": "翻訳結果の文字 "
}
],
"final": true
}
],
"result_index": 0
}