SpeachToText?

概要 しゃべったことが文字になる

流れ

BlueMix?上でSpeachToText?を使う

コスト

$0.02 USD/分

STEP

Bulemixにログイン

右上にある「カタログ」リンクをクリック。「カタログページ」遷移できます。

[サービス]-[Watson]-[Speech To Text]をクリック

右下の「作成」ボタンを押す

[Demo]をクリック

APIなどの資料へのリンクがありますが、[Transcribe Audio]-[Voice Model:]-[Japanease 8kHz か16kHz]を選択

[Keywords to spot:]にしゃべるであろうキーワードを入れておきます。

マイクの準備を確認してある前提ですが、[Record Audio]をクリックすると、認識が開始します。

結果

一般的な用語については、高い認識率でしたが、サーバにデータを転送し展開し稼働させる一連の処理を意味する「デプロイ」という単語については、「で黒い」とか、「で鎧」とか、 10回ぐらい試したのですが、かたくなに認識してくれませんでした。

呼び出すコマンド例

curl -X POST -u {ユーザ名}:{パスワード}
--header "Content-Type: audio/flac"
--header "Transfer-Encoding: chunked"
--data-binary @{音声データの入ったパス}audio-file.flac
"https://stream.watsonplatform.net/speech-to-text/api/v1/recognize"

帰ってくるJSON

{
  "results": [
    {
      "alternatives": [
        {
          "confidence": 0.8691191673278809,
          "transcript": "翻訳結果の文字 "
        }
      ],
      "final": true
    }
  ],
  "result_index": 0
}

Conversation

あらかじめ会話を定義したい

動作確認のため、あらかじめ会話をjson形式であらかじめ定義しておけます。

作成した会議を取り込む手順

watsonのConversation toolingページを開きます。

Launch toolボタンをクリックします。

createボタンの右側にある↑矢印のアイコンが、Importボタンと呼ばれ、これをクリックすることで、jsonで定義した会話が利用できるよう、準備されます。

利用例

会話エンジンにWatson Conversationを使ったSlack botを作ってみた

http://qiita.com/tsota/items/497513585f069386626f

Watson Conversationを使って天気予報をするSlack botを作ってみた

http://qiita.com/tsota/items/560d1b6f9c6a27aec412

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2017-08-19 (土) 13:58:08 (2439d)