检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
直播控制RTSA Command命令说明 直播控制RTSA Command命令详细说明,如下所示: 数字人直播状态变化图 RTSA Command定义 数字人直播状态变化图 数字人直播状态变化流程图,如图1所示。 图1 直播状态变化流程图 流程图说明,如下所示: PREPROCESSIN
选择创建视频,可以设置每张幻灯片放映的时间等参数。 单击“创建视频”,在弹出的对话框中,选择本地存放目录,并设置视频名称。 单击“保存”,生成视频文件。 视频文件生成后,需要在视频制作界面的“视频”页签,导入使用。 请注意:视频中PPT每页播放的时间如果与对应音频的时长不匹配,需要将
排序字段,支持的排序方式有: 按创建时间排序:create_time 按更新时间排序:update_time 按资产排序:asset_order sort_dir 否 String 排序方式。 asc:升序 desc:降序 默认asc升序。 create_since 否 String 过滤创建时间>=输入时间的记录。
排序字段,支持的排序方式有: 按创建时间排序:create_time 按更新时间排序:update_time 按资产排序:asset_order sort_dir 否 String 排序方式。 asc:升序 desc:降序 默认asc升序。 create_since 否 String 过滤创建时间>=输入时间的记录。
UpdatePacifyWordsRequest request = new UpdatePacifyWordsRequest(); request.withPacifyWordsId("{pacify_words_id}"); UpdatePacifyWordsReq
其他数值:同一条达到互动条件的用户入场规则重复触发的间隔时间,每条规则的触发时间互不影响。 默认值:120。 点赞触发间隔时间 取值范围[-1,120],单位:秒。 取值含义如下所示: -1:只触发1次。 0:一直触发。 其他数值:同一条点赞规则重复触发的间隔时间,每条规则的触发时间互不影响。 默认值:120。
将鼠标放在需要停顿的文字右侧,单击“插入停顿”。在弹出的提示框中,选择“换气”或者停顿的时间,也支持自定义停顿时长。 连读 选中需要连读的文本内容,单击“连读”。 多音字 选中文本中的多音字,单击“多音字”,在弹出的提示框中,选择正确的发音或者自定义发音。 须知: 这里设置的多音字,仅对当前视频制作剧本有效,如需全局生效,可参考配置特殊词表配置。
单击webm2mov,将视频格式转换小工具webm2mov_20240814.rar下载至本地。 下载过程大约耗时3~5分钟,请耐心等待。 如果用户需要自定义工具,可以获取其源码。 本地解压工具包,得到ffmpeg目录和运行文件webm2mov.exe。 双击webm2mov.exe,弹出如图1所示的界面。
UpdateHotWordsReq{ SisHotWords: sisHotWordsbody, HotWordsType: &hotWordsTypeHotWordsType, } response, err := client.UpdateHotWords(request)
排序字段,支持的排序方式有: 按创建时间排序:create_time 按更新时间排序:update_time 按资产排序:asset_order sort_dir 否 String 排序方式。 asc:升序 desc:降序 默认asc升序。 create_until 否 String 过滤创建时间<=输入时间的记录。
产品优势 控制台自助服务,一站式快速生成所需内容 用户申请账号并上传相关授权,拍摄训练所需音视频素材,上传进行模型训练,生成自定义形象和声音。选择背景、声音、模特等内容,基于文本或语音智能驱动,实现视频制作、视频直播、智能交互等能力。 华为云盘古数字人大模型,赋能千行百业数字化营销新模式
10次/秒 10次/秒 设置TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 获取TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 删除TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 修改TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 3D数字人风格管理
创建声音制作任务(自研模型) MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用自研模型自定义生成声音。 操作限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。
声音制作 MetaStudio支持自定义生成声音。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 参考真人声音录制,提前录制一个WAV或MP3格式的长音频文件,每句之间需要有2~3秒的停顿。语料推荐使用文案样例(基础版)。 声音授权签署文件。 操作步骤 登录MetaStudio控制台。
修订记录 表1 修订记录 修改时间 修改说明 2024-12-30 第十四次正式发布 本次变更如下: 语音合成管理接口组,新增接口:设置TTS租户级自定义读法配置、获取TTS租户级自定义读法配置、删除TTS租户级自定义读法配置、修改TTS租户级自定义读法配置。 2024-12-05
MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用第三方模型“出门问问”自定义生成声音。第三方模型“出门问问”的详细说明,如下所示: 输入的语言不受限制。默认支持19种输入语言(中文、英文、粤语、德语、法语、土耳其语
0-2147483647 start_time String 数字人直播任务开始时间。格式遵循:RFC 3339 如“2021-01-10T08:43:17Z”。 end_time String 数字人直播任务结束时间。格式遵循:RFC 3339 如“2021-01-10T08:43:17Z”。
FAILED: 失败 CANCELED: 取消 BLOCK: 冻结 start_time String 数字人名片制作开始时间。 end_time String 数字人名片制作结束时间。 output_asset_config OutputAssetInfo object 输出资产信息配置。 error_info
DeletePacifyWordsRequest request = new DeletePacifyWordsRequest(); request.withPacifyWordsId("{pacify_words_id}"); try {
此操作。需要重新选择一个支持所需操作的声音模型进行设置。 表1 操作说明 操作 说明 插入停顿 在段落的某个位置,插入换气或者停顿时间,也支持自定义停顿时长。 多音字 选中文字,设置多音字的正确读音。 全局语速 设置全局语速,取值范围[0.5X,2X]。设置为0.5X时,声音放慢至0