SpeachToText?

概要 しゃべったことが文字になる

流れ

BlueMix?上でSpeachToText?を使う

コスト

$0.02 USD/分

STEP

Bulemixにログイン

右上にある「カタログ」リンクをクリック。「カタログページ」遷移できます。

[サービス]-[Watson]-[Speech To Text]をクリック

右下の「作成」ボタンを押す

[Demo]をクリック

APIなどの資料へのリンクがありますが、[Transcribe Audio]-[Voice Model:]-[Japanease 8kHz か16kHz]を選択

[Keywords to spot:]にしゃべるであろうキーワードを入れておきます。

マイクの準備を確認してある前提ですが、[Record Audio]をクリックすると、認識が開始します。

結果

一般的な用語については、高い認識率でしたが、サーバにデータを転送し展開し稼働させる一連の処理を意味する「デプロイ」という単語については、「で黒い」とか、「で鎧」とか、 10回ぐらい試したのですが、かたくなに認識してくれませんでした。

呼び出すコマンド例

curl -X POST -u {ユーザ名}:{パスワード}
--header "Content-Type: audio/flac"
--header "Transfer-Encoding: chunked"
--data-binary @{音声データの入ったパス}audio-file.flac
"https://stream.watsonplatform.net/speech-to-text/api/v1/recognize"

帰ってくるJSON

{
  "results": [
    {
      "alternatives": [
        {
          "confidence": 0.8691191673278809,
          "transcript": "翻訳結果の文字 "
        }
      ],
      "final": true
    }
  ],
  "result_index": 0
}
トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS