检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
setConfig(config: ConfigMap): void 【功能说明】 设置配置项,用于控制是否显示字幕或交互按钮。 【请求参数】 表13 config 参数 是否必须 默认值 类型 描述 config 是 - ConfigMap 配置信息,请参见表14。 表14 ConfigMap 参数 是否必须
10次/秒 10次/秒 设置TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 获取TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 删除TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 修改TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 3D数字人风格管理
需排查是否是下述原因导致: 电脑是否有独立显卡。 OBS视频采集工具的基础分辨率配置是否与输出分辨率一致。 检查独立显卡 用户使用的第三方直播平台所在电脑,必须装有独立显卡。 检查OBS视频分辨率配置 OBS视频采集工具的基础分辨率和输出分辨率的值需要保持一致。 检查方法如下所示:
是否支持H265(HEVC)视频解码。 图2 查看浏览器配置 用ffmpeg检查视频的编码是否是H265(HEVC),输入命令:ffmpeg -i 视频文件名。 图3 检查视频是否是hevc编码 需要先安装ffmpeg,安装方法如下。 ffmpeg下载地址:https://github
需排查是否是下述原因导致: 电脑是否有独立显卡。 OBS视频采集工具的基础分辨率配置是否与输出分辨率一致。 检查独立显卡 用户使用的第三方直播平台所在电脑,必须装有独立显卡。 检查OBS视频分辨率配置 OBS视频采集工具的基础分辨率和输出分辨率的值需要保持一致。 检查方法如下所示:
如表1所示。 图2 视频直播制作界面 表1 界面说明 区域 说明 ① 素材区域,包括如下内容。视频直播素材的操作详情,请参考视频直播公共配置。 模板:视频直播模板,“模板”页签仅管理员可见。 角色:数字人形象列表,可选择需要使用的数字人形象,支持自定义。 背景:背景图片列表,支持本地导入。可选择需要使用的背景图。
视频制作限制 分身数字人视频制作限制说明,如表1所示。 表1 视频制作限制 视频制作配置 限制 场景 一个视频草稿的场景数量不能超过50个。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。 每个单场景如果包含语音合成标记语言SSML标签,文字数量需小于128K。
选中左侧的互动库,单击界面右侧的“新建”,弹出“新建互动”对话框,如图3所示。 可以给当前互动库,新增1条互动规则。参数配置说明,如表1所示。 图3 互动规则 表1 互动规则配置说明 参数 说明 类型 互动类型。 包含如下选项: 弹幕 用户入场 点赞 送礼 互动名称(可选) 互动名称。 触发方式
这里设置的多音字,仅对当前视频草稿有效,如需全局生效,可参考配置特殊词表配置。 别名 选中需要通过别名播报的文本内容 ,单击“别名”,设置为实际播报的内容。 须知: 这里设置的别名,仅对当前视频草稿有效,如需全局生效,可参考配置特殊词表配置。 数字英文 示例数字“1024”的读法如下所示:
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。
5.使用RTMP推流至直播平台 视频直播 使用窗口捕获方式开播 00:51 6.使用窗口捕获方式开播 视频直播 直播高级配置策略 02:07 7.直播高级配置策略 智能交互 智能交互(科大讯飞) 智能交互全流程 03:17 智能交互全流程演示 智能交互(华为云CBS) 智能交互全流程
第十四次正式发布 本次变更如下: 语音合成管理接口组,新增接口:设置TTS租户级自定义读法配置、获取TTS租户级自定义读法配置、删除TTS租户级自定义读法配置、修改TTS租户级自定义读法配置。 2024-12-05 第十三次正式发布 本次变更如下: 新增接口组:分身数字人字幕文件生成管理。
单击界面右上方的“添加凭证”,弹出“购买序列号”对话框,如图11所示。 参数配置说明,如表1所示。 图11 购买序列号 表1 参数说明 参数 说明 主体 购买出门问问声音套餐中购买套餐包的归属主体,从下拉框中选择“出门问问”。 访问配置accessKey 出门问问需要配置为资源详情界面的“用户账号”,如获取第三方声音使用凭证-步骤2所示。
制作页面。 选择“第三方模型”页签的“出门问问声音制作”方式。 界面左侧是声音制作页面,右侧为声音制作流程,如图1所示。 图1 定制声音 配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 选择“出门问问声音制作”。音频时长为0.5~18
参数 是否必选 参数类型 描述 token 否 String 一次性token,获取方法请参考创建一次性鉴权码。 须知: 使用JavaScript开发时,请使用一次性鉴权码认证方式。 表4 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String
选择AI模型。不同模型需要配置的参数数量不同,其中,高阶模型需要配置的参数最多。 包含如下选项: 初阶模型 中阶模型 高阶模型 多轮对话 是否开启多轮会话。 如果开启,会根据上下文的信息进行语义理解,以生成连贯的对话。 业务ID 仅特殊定制的业务模型需要配置。 所在城市 智能交互面向的城市。
未来的使用中能够更加智能地完成任务。 212. 此外,这款家用机器人具备快速的通信和数据传输能力。 213. 它能够与其他智能设备或云端服务器进行快速的数据交换和信息共享。 214. 例如,您可以远程控制机器人执行任务并将结果实时传输给您,或者与其他智能设备进行协作完成更复杂的任务。
问答交互次数,请参考本节操作,订购套餐包。 操作步骤 在界面上方的主菜单中,单击“我的应用”。 单击应用所在行的图标,进入当前应用的“应用配置”页面。 在左侧导航栏中,单击“服务统计”,进入“服务统计”页面,如图1所示。 通过下图可以看出,科大讯飞免费赠送500次/天的问答交互。
great security risks. It is recommended that the AK and SK be stored in ciphertext in configuration files or environment variables and decrypted
创建智能交互数字人(华为云CBS) 配置对话机器人服务CBS 创建智能交互数字人 父主题: 智能交互