ユーザー（一般利用者）向け
- よくあるお問い合わせ
  - デジタルヒューマンを快適に利用するための端末要件
  - インターネット接続は必須ですか？
- トラブルシューティング
  - デジタルヒューマン株式会社のウェブサイト上のソフィーが私の声を聞いていない様です（デジタルヒューマンに声が届かないようです）
  - デジタルヒューマンが私の声を聞いていない様です（デジタルヒューマンに声が届かないようです）
  - デジタルヒューマンが表示されません
  - 画面上にデジタルヒューマン以外のコンテンツが表示されない
  - デジタルヒューマンが画面に表示されていますが、質問しても応答しません
  - 特定の端末や環境で文字化けする
設定・運用
- 概要
  - プラットフォームの概要
  - 世代（Gen1,Gen2,Gen3 / P1,P2）
  - 利用できる言語と音声認識・音声合成
  - 設定・制御できる要素
- 制御する
  - ふるまいの変更：概要
  - ふるまいの変更：アクション編
  - ふるまいの変更：感情表現編
  - ふるまいの変更：カメラ制御編
  - ふるまいの変更：生成AI向けサンプルプロンプト
  - 発話の制御：SSMLの利用
  - SpeakAPI（スピークAPI）
  - 独自のスタートボタンを実装する
  - PPT（プッシュトゥトーク）モードを使用する
- 会話AI チャットボットと接続する
  - 接続実績のある会話AI・チャットボット
  - 会話AIやチャットボットとの接続を変更する
  - NLP プロファイル共通パラメータ
  - Dify と接続する
  - miibo と接続する
  - Kore.ai と接続する
  - Allganize Alli と接続する
- トラブルシューティング
  - ログの確認方法、ログイベント一覧、セッションIDの取得
  - デジタルヒューマンプラットフォームの稼働状況
  - 音が途切れる、ビデオがコマ落ちする原因を切り分ける
  - デジタルヒューマンが画面に表示されません
  - デジタルヒューマンがフリーズしたり、同期が取れなくなりました
開発・設置
- 概要とネットワーク
  - プラットフォームの概要
  - ファイアウォール・ネットワーキングとWebRTC + TURN
- ホステッドエクスペリエンス
  - 概要
  - ビューの種類
  - 設置手順
  - 設定オプション
  - 表示文字列（多言語対応）
  - コードスニペットサンプル
  - コンテンツを表示する
  - コンテンツエリアで使用可能なHTMLタグ
  - コマンドの作成とコマンドエディタ
  - イベント
  - メソッド
  - スピーチイベント
  - セキュリティ保護
  - マルチプル表示
  - マイグレーションガイド（P1からP2）
- BYO STTとTTS
  - BYO TTSを利用する（DHKKゲートウェイ）
- ミニプレム（MiniPrem）
  - インストール
  - トラブルシュート
  - アップデート
- 会話AI・チャットボットとの接続
  - 会話AI・チャットボットとのプラットフォームインテグレーションの概要
  - 会話AI・チャットボットに求めるレスポンス例・機能
  - 接続元IPアドレス
カスタマー・パートナー向け
- 契約・申込み
  - デジタルヒューマンを試してみたい（デモと2週間の無料試用が可能です）
  - アニメ・2Dのキャラクターをデジタルヒューマンのプラットフォームで利用できますか？
  - オリジナルキャラクター/クローンキャラクターを作成するには
  - ユーザー・カスタマー・パートナー・ベンダー・サプライヤーの位置づけについて
  - 導入支援してほしい
廃止・旧ドキュメント
- ホステッドエクスペリエンス 1.0（終息）
  - 概要
  - ビューの種類
  - 設置手順
  - コードスニペットサンプル
  - カスタマイズ
  - コンテンツを表示する
  - コンテンツエリアで使用可能なHTMLタグ
  - コマンドの作成（コマンドエディタ）
  - カスタムデータの受け渡し
  - 安全な利用環境を守るための設定
  - メソッド一覧
  - イベントハンドリング
- SYNAPSE
  - 概要
  - BYO 会話AI側エンドポイント仕様書
- SDKリファレンス（SDKのみの提供は行っていません）
  - SDK リファレンス
  - SDK UneeqOptions
  - SDK Methods
  - SDK Messages
- キャプチャースタジオ（終息）
  - 概要
  - ダウンロードとセットアップ
  - 使い方
Terms, Privacy and Legal
- 文書一覧
  - 利用規約
  - フリートライアル利用規約
  - サービスレベルアグリーメント
  - プライバシーポリシー（個人情報保護方針）
  - 情報セキュリティ方針
More

設定・制御できる要素

このページの目的

デジタルヒューマンおよびデジタルヒューマンプラットフォームは、自由度が高いプラットフォームです。このページでは、変更、設定、制御できる要素を一覧しています。

プラットフォーム概要図

アニメーションプラットフォーム

標準設定項目

デジタルヒューマンのキャラクターや背景の変更、接続する会話AI/チャットボットなどの設定をまとめた単位（インスタンス）を「ペルソナ」と呼んでいます。以下は標準の設定項目です。

項目	タイプ	備考
管理用名	文字列	ペルソナの管理用名
キャラクターの外見	選択	プランによって利用できるキャラクターが異なります。
背景	選択	背景画像を選択可能です。
API URL	文字列	会話AIのAPIエンドポイントか、会話AIが接続されたオーケストレーション・ゲートウェイのエンドポイントを設定します。
音声認識（STT）	選択	プラットフォーム上で利用できる26言語から選択
音声合成（TTS）	選択	Google Cloud, Microsoft Azure, ElevenLabs の話者が設定できます。

カスタム設定項目

標準設定できない拡張設定は以下の通りです。設定はすべて弊社にて行います。

項目	タイプ	備考
キャラクターの外見	カスタム設定	弊社側で設定します。
カスタム音声認識（BYO STT）	カスタム設定	BYO/サードパーティー音声認識を利用できます。標準で使えるSTTプロバイダーでもアニメーションプラットフォームを経由させたく無い場合にも利用できます。
カスタム音声合成（BYO TTS）	カスタム設定	~~BYO/サードパーティー音声合成を利用できます。~~ P2ではAzureのカスタムニューラルボイスのみ対応します。

フロントエンド

会話AIやチャットボットから制御可能な項目

フロントエンドは表示の形によって利用できる機能が変わります。ビューの種類はこちらをご覧下さい。デジタルヒューマンは自律的にアニメーションを生成しますが、チャットボットやNLPから制御できる項目は以下です。

項目	タイプ	備考
発話内容	文字列	デジタルヒューマンに喋らせたい内容
声	発話の制御：SSMLの利用	デジタルヒューマンが発話する際の、声の早さ、ピッチ、ブレイク、読み方などはSSMLで制御可能です。SSMLは合成音声プロバイダーである程度共通化されていますが、完全に統一されていませんので、利用するプロバイダーによって利用できるSSMLタグが変わります。
感情表現	ふるまいの変更：感情表現編	デジタルヒューマンの表情は自律的に生成されますが、幸せや興奮等の感情を付与して表現する事が出来ます。
手足等のアクション制御	ふるまいの変更：アクション編	デジタルヒューマンGen3からは、空間の概念がうまれ3D移動（対応予定）や手足を使ったアクション表現等が制御出来るようになりました。
カメラ制御（アバターの表示位置）	ふるまいの変更：カメラ制御編	デジタルヒューマンを撮影しているカメラが利用出来、ズーム・ズームアウト・パンチルトが利用出来るようになります。
ビューのコンポーネント	コマンド	各ビューに依存します。ビューの種類はこちらをご覧下さい。
ユーザや環境認識用のWebカメラ	環境依存	話者を撮影するカメラ、またはカメラを使った解析・認識・認証の機能はデジタルヒューマンプラットフォームとして提供しておらず、外部のサービスとの連携になります。詳しくはお問い合わせください。

対話AI/チャットボット

ChatGPTをはじめ、さまざまな対話AIやチャットボットが接続可能です。接続するための仕様は下記をこちらをご覧下さい。

接続実績のある会話AI・チャットボット

会話AI・チャットボットとのプラットフォームインテグレーションの概要

お役に立ちましたか？

😞

😐

🤩

最終更新日 November 1, 2024

利用できる言語と音声認識・音声合成ふるまいの変更：概要