检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间
TextConfig 参数 参数类型 描述 text String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。
学术交流和教育合作也是非常重要的, 它们可以促进知识的共享和学术发展,同时也可以加强不同国家和地区的联系。 学习外语和翻译也是非常有用的, 它们可以帮助我们更好地理解和欣赏其他国家的文化和价值观,促进不同文化之间的交流。 艺术展览、文学节和演出等活动是艺术家和作品展示和交流的舞台,
ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间
参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。
ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间
ORDER:顺序循环 默认取值: 不涉及 reply_role 否 String 参数解释: 回复角色。 约束限制: 不涉及 取值范围: STREAMER:主播 CO_STREAMER:助播,仅声音。 默认取值: STREAMER robot_id 否 String 参数解释: 机器人ID。 约束限制:
ORDER:顺序循环 默认取值: 不涉及 reply_role String 参数解释: 回复角色。 约束限制: 不涉及 取值范围: STREAMER:主播 CO_STREAMER:助播,仅声音。 默认取值: STREAMER robot_id String 参数解释: 机器人ID。 约束限制:
参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。
String 鉴权Key。通过HmacSHA256生成的鉴权key expires_time 否 Long 参数解释: 鉴权key过期时间。从1970年1月1日(UTC/GMT的午夜)开始所经过的毫秒数。 取值范围: 0-4102415999000 refresh_url 否 Boolean
是否必选 参数类型 描述 voice_asset_id 是 String 音色模型ID。需要使用MetaStudio的数字资产管理相关接口从资产库查出。 script_type 否 String 脚本类型,即视频制作的驱动方式。默认TEXT TEXT: 文本驱动,即通过TTS合成语音
参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。
支持开启IAM子账号隔离能力。 取值如下所示: 关闭:默认关闭,即当前账号下各IAM子账号的已购资源和资产均可共享使用。 开启:各IAM子账户在开启之前上传或制作的资产,在开启之后均无法查看和使用。开启之后上传和制作的资产,各自独立管理和使用。 须知: 无论开启或关闭IAM子账户隔离能力,下述能力不发生变化:
cognized和semanticRecognized通知的流式返回有什么差异? semanticRecognized 【事件说明】 LLM对提问进行语义识别后输出回复文本的事件。speechRecognized和semanticRecognized分别为问题和答案,每轮问答共用一个chatId。
使用。 MetaStudio服务目前仅支持读取docx(包含图文)、txt和md格式,其他格式暂不支持。 docx格式说明:可以没有标题和分级标题, 如需添加标题和分级标题,请使用word标准格式,如图1和图2所示。 txt格式说明:文档内容当前仅支持纯文本,一行对应一条知识。
表6 VoiceConfig 参数 是否必选 参数类型 描述 voice_asset_id 是 String 参数解释: 音色资产ID,可以从资产库中查询。 音色ID的查询操作,详见查询预置音色ID。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 speed
含MAIN、COVER和OTHER 资产类型为PPT时,包含MAIN、COVER、PAGE和OTHER 资产类型为HUMAN_MODEL时,包含MAIN、COVER和OTHER 资产类型为VOICE_MODEL时,包含MAIN、SAMPLE(样例音频文件)和OTHER 资产类型为
修订记录 发布日期 修订记录 2024-07-09 新增PHP和Node.js语言SDK。 2023-06-30 第一次正式发布。
剧本名称。 script_description String 剧本描述。 model_asset_id String 数字人模型资产ID,可以从资产库中查询。 model_asset_type String 数字人模型类型。 HUMAN_MODEL_2D:分身数字人 HUMAN_MODEL_3D:3D数字人
资产管理 如何接收并激活声音和分身模型资产?