检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
制过程中,每句之间有2~3秒的停顿。 其中,进阶版和高品质声音制作需要更多语料,训练时长更长,声音效果更佳。 请完善声音信息 输入声音名称。 示例:欢快女声。 须知: 声音训练完成后,可以在“我的创作 > 声音”页面,找到训练好的声音卡片,单击右下角的图标,从下拉框中选择“重命名”,修改声音名称。
发布成功后,自动跳转至与数字人智能互动页面,可以体验与数字人互动的效果。也可以复制数字人互动页面的网址,分享给其他用户使用。 获取数字人互动页面URL的方式还有:进入“我的创作 > 智能交互 > 对话项目”页面,单击智能交互对话项目右侧的“复制URL和激活码”,可以将URL和激活码分享给其他用户使用。 详细操作如下所示:
其他数值:同一条弹幕规则重复触发的间隔时间,每条规则的触发时间互不影响。 默认值:120。 用户入场触发间隔时间 取值范围[-1,120],单位:秒。 取值含义如下所示: -1:只触发1次。 0:一直触发。 其他数值:同一条达到互动条件的用户入场规则重复触发的间隔时间,每条规则的触发时间互不影响。
发布成功后,自动跳转至与数字人智能互动页面,可以体验与数字人互动的效果。也可以复制数字人互动页面的网址,分享给其他用户使用。 获取数字人互动页面URL的方式还有:进入“我的创作 > 智能交互 > 对话项目”页面,单击智能交互对话项目右侧的“复制URL和激活码”,可以将URL和激活码分享给其他用户使用。 详细操作如下所示:
发布成功后,自动跳转至与数字人智能互动页面,可以体验与数字人互动的效果。也可以复制数字人互动页面的网址,分享给其他用户使用。 获取数字人互动页面URL的方式还有:进入“我的创作 > 智能交互 > 对话项目”页面,单击智能交互对话项目右侧的“复制URL和激活码”,可以将URL和激活码分享给其他用户使用。 详细操作如下所示:
本地解压工具包,得到ffmpeg目录和运行文件webm2mov.exe。 双击webm2mov.exe,弹出如图1所示的界面。 图1 工具运行界面 单击“选择webm文件”,选择WEBM格式的视频。 等待视频格式转换完成。请注意,视频格式转换过程中,一定不能关闭如图2所示的2个窗口。 图2 工具运行界面
关闭:默认关闭,即当前账号下各IAM子账号的已购资源和资产均可共享使用。 开启:各IAM子账户在开启之前上传或制作的资产,在开启之后均无法查看和使用。开启之后上传和制作的资产,各自独立管理和使用。 须知: 无论开启或关闭IAM子账户隔离能力,下述能力不发生变化: 所有IAM子账户的已购资源,始终共享使用。
间内重复调用API,服务中断的情况。 如果调用API时,返回“APIGW.0308”错误信息,是触发了API流控限制。需要参考下述表格中的流控值,调整调用API的间隔时间,控制请求的发送速度;或者等待一段时间后,再发送API请求。 “APIGW”开头的错误码列表,详见错误码说明。
请选择输出模型语言 选择输出的声音模型支持的语言。 支持如下语言: 多语种:输出的声音模型,支持合成的语言类型包括中文、英文、德语、法语、土耳其语、菲律宾语、日语、意大利语、马来语、俄罗斯语、韩语、芬兰语、西班牙语、印尼语、阿拉伯语、葡萄牙语、荷兰语。 粤语 选择声音标签 声音的标签。作用为选择声音时,快速筛选领域。
Markup Language)标记语言。 需要使用的标签,如下所示: <speak>:此标签为所有文本的根节点。一切需要调用SSML标签的文本,都要包含在<speak> </speak>标记对中。 <emotion>:情感标签,对指定的一或多句话生效。标签开始在句子起始位置,标签结束在句子结尾。用法为:<emotion
表情驱动数据格式如何定义? MetaStudio表情驱动的表情基数据总共52个系数,每个系数的取值范围在0~1之间,表情基系数的顺序性定义如下: 序号 表情名称 0 mouthPucker 1 mouthPressLeft 2 mouthPressRight 3 mouthRollUpper
输入分身数字人的角色名称。 示例:云笙。 训练视频 从本地上传已录制好,且符合拍摄要求的人像视频。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄,人物须保持竖直。支持MP4、MOV格式的视频。 背景替换
租户的项目ID必须与SP用户申请成为SP用户时,提供的项目ID所在Region保持一致。 租户名称:输入自定义租户名称,方便SP用户识别租户身份。 图2 关联租户 单击“创建”,租户创建完成,如图3所示。 图3 租户列表 如需取消关联,可单击右侧的“取消关联”,在弹出的“取消关联租户提示”对话框中,单击“确定”。
资源类型 MetaStudio计费中涉及的资源类型,包括商用资源类型、POC测试用需管理员分配的资源类型。 表1 商用资源类型(租户订购) 类别 资源名称 单位 计费模式 资源类型编码 备注 分身数字人 形象制作 个 一次性 hws.resource.type.metastudio
x(包含图文)、txt和md格式,其他格式暂不支持。 docx格式说明:可以没有标题和分级标题, 如需添加标题和分级标题,请使用word标准格式,如图1和图2所示。 txt格式说明:文档内容当前仅支持纯文本,一行对应一条知识。 星火大模型会理解文档库文档的内容,重新组织语言来回答
设置完成后,单击“生成视频”,弹出如图2所示的对话框,显示照片数字人视频的生成进度。 可执行下述操作: 单击图中第一个链接“任务中心-视频”,可进入“任务中心 > 照片数字人”页面,查看任务进度,详情请参见查看任务。 单击图中第二个链接“我的创作-视频”,可进入“我的创作 > 视频”界面,查看已生成的视频,详情请参见查看视频。
单击界面左上角的图标,在弹出的浮动框中,搜索“对话机器人服务 CBS”。 单击“对话机器人服务 CBS”,进入控制台页面,如图1所示。 请确认当前页面,是否包含问答机器人列表。 如果包含,直接执行4。 如果不包含,请参考下述操作,购买问答机器人。 单击界面右上方的“购买问答机器人”,进入“购买问答机器人”页面。
新增智能直播间管理接口。 新增直播任务管理接口。 2023-08-07 第二次正式发布 本次变更如下: 更新3个接口的请求参数和响应参数,包括:查询资产列表、查询资产详情和获取语音驱动数据接口。 2022-12-27 第一次正式发布。
文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。
小窗口下方的“+”图标,新增场景,并参考前一个场景,设置生成下一个场景的画面布局和剧本内容。 图9 直播间界面 所有场景的画面布局和剧本设置完成后,单击界面右侧的“互动设置”页签,如图10所示。 图10 互动设置 单击“导入”,弹出“导入互动”对话框。 勾选需要使用的互动库及其互