設定・制御できる要素

このページの目的

デジタルヒューマンおよびデジタルヒューマンプラットフォームは、自由度が高いプラットフォームです。このページでは、変更、設定、制御できる要素を一覧しています。

プラットフォーム概要図

Notion image

アニメーションプラットフォーム

標準設定項目

デジタルヒューマンのキャラクターや背景の変更、接続する会話AI/チャットボットなどの設定をまとめた単位(インスタンス)を「ペルソナ」と呼んでいます。以下は標準の設定項目です。

項目
タイプ
備考
管理用Name
文字列
ペルソナの管理用名
キャラクターの外見
選択
プランによって利用できるキャラクターが異なります。
背景
選択
背景画像を選択可能です。
Conversation settings
選択
Amazon LEX, DialogflowES, Try Mode
API URL
文字列
デジタルヒューマンが参照するNLPや、NLPが接続されたゲートウェイの参照先を設定します。
音声認識(STT)
選択
音声合成(TTS)
選択
Amazon Poly, WellSaid, Google Cloud, Microsoft Azure の話者が設定できます。

カスタム設定項目

標準設定できない拡張設定は以下の通りです。設定はすべて弊社にて行います。

項目
タイプ
備考
キャラクターの外見
カスタム設定
オリジナルキャラクターを作製した場合は弊社側で設定します。
背景
カスタム設定
会社のロゴが入ったオリジナルデザインの背景を利用したい場合は弊社側で設定します。カスタム背景はプロプラン以上で対応。
Conversation settings
選択
ChatGPT、Azure OpenAI、DialogflowES、miiboなど
API URL
文字列
日本のゲートウェイを経由したり、DHマネージャーを利用する場合は弊社が設定します。
音声認識(STT)
カスタム設定
BYO/サードパーティー音声認識を利用できます。標準で使えるSTTプロバイダーでもアニメーションプラットフォームを経由させたく無い場合にも利用できます。
音声合成(TTS)
カスタム設定
BYO/サードパーティー音声合成を利用できます。
アバターポジション・サイズ
カスタム設定
背景画像に対する、アバターの左右位置やサイズをカスタマイズできます

フロントエンド

NLPやチャットボットから制御可能な項目

フロントエンドは表示の形によって利用できる機能が変わります。ビューの種類はこちらをご覧下さい。デジタルヒューマンは自律的にアニメーションを生成しますが、チャットボットやNLPから制御できる項目は以下です。

項目
タイプ
備考
発話内容
文字列
デジタルヒューマンに喋らせたい内容
デジタルヒューマンが発話する際の、声の早さ、ピッチ、ブレイク、読み方などはSSMLで制御可能です。SSMLは合成音声プロバイダーである程度共通化されていますが、完全に統一されていませんので、利用するプロバイダーによって利用できるSSMLタグが変わります。
感情表現
デジタルヒューマンの表情は自律的に生成されますが、幸せや興奮等の感情を付与して表現する事が出来ます。
手足等のアクション制御
デジタルヒューマンGen3からは、空間の概念がうまれ3D移動(対応予定)や手足を使ったアクション表現等が制御出来るようになりました。
カメラ制御(アバターの表示位置)
デジタルヒューマンを撮影しているカメラが利用出来、ズーム・ズームアウト・パンチルトが利用出来るようになります。
ビューのコンポーネント
コマンド
各ビューに依存します。ビューの種類はこちらをご覧下さい。
話者撮影のカメラ
環境依存
話者を撮影するカメラ、またはカメラを使った解析・認識・認証の機能はデジタルヒューマンプラットフォームとして提供しておらず、外部のサービスとの連携になります。詳しくはお問い合わせください。

DHマネージャー

DHマネージャーならびに日本のゲートウェイ仕様の詳細は弊社までお問い合わせください。

 

対話AI/チャットボット

ChatGPTをはじめ、さまざまな対話AIやチャットボットが接続可能です。接続するための仕様は下記をこちらをご覧下さい。

チャットボット/NLP (自然言語処理)プラットフォーム統合の概要

オーケストレーションインターフェースの設置方法・手順

 
お役に立ちましたか?
😞
😐
🤩

最終更新日 January 1, 2023