ユーザー（一般利用者）向け
- よくあるお問い合わせ
  - デジタルヒューマンを快適に利用するための端末要件
  - インターネット接続は必須ですか？
- トラブルシューティング
  - デジタルヒューマン株式会社のウェブサイト上のソフィーが私の声を聞いていない様です（デジタルヒューマンに声が届かないようです）
  - デジタルヒューマンが私の声を聞いていない様です（デジタルヒューマンに声が届かないようです）
  - デジタルヒューマンが表示されません
  - 画面上にデジタルヒューマン以外のコンテンツが表示されない
  - デジタルヒューマンが画面に表示されていますが、質問しても応答しません
  - 特定の端末や環境で文字化けする
設定・運用
- 概要
  - プラットフォームの概要
  - 世代（Gen1,Gen2,Gen3 / P1,P2）
- ペルソナを設定する（DIP）
  - 設定・制御できる要素
  - 利用できる言語と音声認識・音声合成
  - はじめに
  - ペルソナ一覧
  - ペルソナの追加
  - ペルソナの設定
  - ワークスペース
  - セッションログ
  - サポート
  - 付録
- 制御する
  - ふるまい：概要
  - ふるまい：アクション
  - ふるまい：感情表現
  - ふるまい：カメラ制御
  - ふるまい：生成AI向けサンプルプロンプト
  - 発話制御：SSMLの利用
  - 強制発話：SpeakAPI（スピークAPI）
- 体験をつくる
  - コンテンツ：表示する
  - コンテンツ：使用可能なHTMLタグ
  - コンテンツ：エディタ（コマンドエディタ）
  - スタートボタン：オリジナルのボタンを実装する
  - スピーチイベント：発話のタイミングにあわせてイベントを発生させる
  - カスタムメタデータ：フロントエンドと会話AI間で情報をやり取りする
  - PTT：プッシュトゥトークモードを使用する
- 会話AI チャットボットと接続する
  - 接続実績のある会話AI・チャットボット
  - 会話AIやチャットボットとの接続を変更する
  - NLP プロファイル共通パラメータ
  - Dify と接続する
  - Dify で使える実装Tips集
  - miibo と接続する
  - Kore.ai と接続する
  - Allganize Alli と接続する
- トラブルシューティング
  - ログの確認方法、ログイベント一覧、セッションIDの取得
  - デジタルヒューマンプラットフォームの稼働状況
  - 解像度・通信量・帯域幅を確認する
  - WebRTCネットワーク診断ガイド（パケットロス調査）
  - デジタルヒューマンが画面に表示されません
  - デジタルヒューマンがフリーズしたり、同期が取れなくなりました
開発・設置
- 概要とネットワーク
  - プラットフォームの概要
  - ファイアウォール・ネットワーキングとWebRTC + TURN
- ホステッドエクスペリエンス
  - 概要
  - ビューの種類
  - 設置手順
  - 設定オプション
  - 表示文字列（多言語対応）
  - コードスニペットサンプル
  - イベント
  - メソッド
  - セキュリティ保護
  - マルチプル表示
- ミニプレム（MiniPrem）
  - 必ずお読みください
  - 環境準備
  - ファイアウォール設定
  - インストール
  - 操作ガイド
  - トラブルシュート
  - アップデート
- 会話AI・チャットボットとの接続
  - 会話AI・チャットボットとのプラットフォームインテグレーションの概要
  - 会話AI・チャットボットに求めるレスポンス例・機能
  - 独自LLMとデジタルヒューマンを接続する
  - 接続元IPアドレス
- BYO STTとTTS
  - BYO TTSを利用する（DHKKゲートウェイ）
カスタマー・パートナー向け
- リリースノート
  - リリースノート
- 契約・申込み
  - デジタルヒューマンを試してみたい（デモと2週間の無料試用が可能です）
  - アニメ・2Dのキャラクターをデジタルヒューマンのプラットフォームで利用できますか？
  - オリジナルキャラクター/クローンキャラクターを作成するには
  - ユーザー・カスタマー・パートナー・ベンダー・サプライヤーの位置づけについて
  - 導入支援してほしい
Terms, Privacy and Legal
- 文書一覧
  - 利用規約
  - フリートライアル利用規約
  - サービスレベルアグリーメント
  - プライバシーポリシー（個人情報保護方針）
  - 情報セキュリティ方針
More

利用できる言語と音声認識・音声合成

languages-and-speech-synthesis

多言語対応

デジタルヒューマンのプラットフォームで標準的に利用できる言語は下記の通りです。多言語対応させるには会話AI等によって様々なアプローチがありますので、エキスパートにご相談ください。

🗣

システムとしては、標準的に以下の機能に対応していますが、拡張すると対応可能言語が利用可能です。ご利用になる音声認識（STT）や音声合成（TTS）の多言語対応状況、バックエンドの会話AI（NLP・LLM）の多言語対応状況によって利用できるかどうかが変わります。

使用出来る音声認識、音声合成

日本語向け拡張として、以下のサードパーティー音声認識と音声合成との接続実績があります。その他のサービスでもAPIが公開されている場合、ほとんどの場合で接続が可能です。

音声認識（音声文字変換）

プラットフォーム標準	Google Cloud Speech-to-Text （標準）対応している言語 ※ホステッドエクスペリエンスで使用する場合はspeechToTextLocalesパラメータにロケールコード（言語タグ）を設定してください。
オプション・接続実績あり	Microsoft Azure Speech-to-Text AmiVoice API NTTドコモ AIエージェントAPI 音声認識 NTTレゾナント AISuite 音声認識 OpenAI Speech to text（含むRealtimeAPI）

音声合成（文字音声変換）

P2では現時点では音声合成はMicrosoft Azure / Text to SpeechとGoogle Cloud Platform / Text-to-Speech 、ElevenLabsにのみ対応しています。

プラットフォーム標準	Microsoft Azure / Text to Speech Google Cloud Platform / Text-to-Speech ElevenLabs
P2対応状況	~~NAVER Cloud Platform / CLOVA Voice IBM Watson / Text to Speech CoeFontAITalk® WebAPI VoiceText Web API ReadSpeaker~~ NTT FutureVoice Crayon (SynAnim対応）

お役に立ちましたか？

😞

😐

🤩

最終更新日 October 26, 2025

設定・制御できる要素はじめに