BYO STTとTTS を利用する(要開発)

BYOは”Bring Your Own”の意味で、お客さまが準備した物やサービスを指します。ここではBYO STTとTTSを利用する方法をご紹介します。

⚠️
TTS を利用する場合は弊社側の設定が必要です。カスタマーサクセスまでご連絡ください。

BYO STT(Speech to Text)

BYO STTを実装するには、Webブラウザ上で任意のサービスとのSTTを実装し、音声から変換されたテキストをUneeQ APIに連携します。

使用するAPIは、ホステッドエクスペリエンスかReactFrontend(uneeq-js)かによって異なります。ただし、ReactFrontendはサポートが終了しているため、お客様自身でメンテナンスを行ってください。

 
Notion image

ホステッドエクスペリエンスの場合

uneeqAsk()を使用します。引数としてSTTで取得したテキストを指定します。

ReactFrontend -EOL(uneeq-js)の場合

sendTranscript()を使用します。引数としてSTTで取得したテキストを指定します。

BYO TTS(Text to Speech)

ByoTTSを行うには、UneeQ側でNLP(チャットボットエンジン)サービスを使用して特定した返答テキストを音声合成(TTS)する際に呼び出せる、ByoTTSを行うWeb APIを実装します。 ByoTTSを使用する際には、Web APIのエンドポイントURL等をUneeQ側で設定を行う必要があります。カスタマーサクセスにお問い合わせください。

Notion image

ByoSTT APIへのUneeQからのリクエスト内容

メソッド POST

リクエストヘッダ

項目
Content-Type
application/json

リクエストボディ

下記の項目と値を含むJSONデータがセットされます。

項目
text
返答テキスト(音声合成するテキスト)
apikey
ペルソナ毎に指定できる任意の値
  • apikeyとしてセットしたい値は、カスタマーサクセスにご指定ください。

リクエストボディ(例)

{
    "text": "こんにちは",
    "apikey": "任意の値"
}

ByoSTT APIからUneeQへのレスポンス内容

レスポンスヘッダ

項目
Content-Type
application/octet-stream

レスポンスボディ

UneeQへのレスポンスボディは、下記のフォーマットの音声バイナリデータです。

項目
フォーマット
raw
チャンネル数
1
ビットレート
16bit
サンプリングレート
16000Hz
エンコーディング
signed-integer
エンディアン
little
お役に立ちましたか?
😞
😐
🤩

最終更新日 June 17, 2023