检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
户进行问答。可通过界面右上方的语言切换图标,切换语言。 注意:科大讯飞场景下,如果选择“英文”,科大讯飞应用要新增English情景模式,详见创建智能交互数字人(科大讯飞)。 声音 单击声音右侧的图标,切换数字人声音。 这里选择的声音,需要与前面选择的语言匹配。如果是中文,则选择中文声音,否则数字人表达会有问题。
String 应用ID。从数字人互动页面URL中获取,URL的获取方式,请参见《用户指南》的“创建智能交互数字人”章节。 chat_id 是 String 对话ID。 command 是 String 操作命令。 包含如下命令: TEXT_DRIVE:文本驱动 INTERRUPT_CHAT:中断对话
照片建模任务出现异常问题怎么办? 若界面提示模型名重复 由于同一个账号下模型名称不可以重复,因此,您需要重新更换模型名称。 若界面提示照片太大 请您重新更换一个大小低于6MB照片。 父主题: 照片建模
INFO:获取任务中的房间信息。params结构定义:SmartLiveRoomInfo。 CLEAN_UP_INSERT_COMMAND:清理未播放的插入命令。params结构定义:CleanUpInsertCommand result String 命令执行结果 状态码: 400
初始化语音唤醒资源,不使用语音唤醒能力则忽略该接口。 3.0.1之后的websdk包里面有如下两个资源文件,如果不使用语音唤醒,可忽略这两个文件。 wasmData.js:语音唤醒的算法资源文件。 modelData.js:语音唤醒的模型资源文件。 SDK内置默认唤醒模型,支持定制唤醒词,并更新本地模型,详见Web语音唤醒。
字体。当前支持的字体请参考服务支持的字体 约束限制: 不涉及。 取值范围: 字符长度0-64位 默认取值: HarmonyOS_Sans_SC_Black font_size 否 Integer 参数解释: 字体大小(像素)。接口的取值范围为0-120,实际业务使用的取值范围要求为4-120,请以业务实际使用要求为准。
参数解释: 字体。当前支持的字体请参考服务支持的字体 约束限制: 不涉及。 取值范围: 字符长度0-64位 默认取值: HarmonyOS_Sans_SC_Black font_size 否 Integer 参数解释: 字体大小。接口的取值范围为0-120,实际业务使用的取值范围要求为24-120,请以业务实际使用要求为准。
第三方平台开播指南 MetaStudio直播功能的主要作用是生成数字人直播的音视频内容,并非直播平台。 可以通过下述2种方式在第三方平台开播: 窗口捕获方式开播:MetaStudio直播返回的窗口可供第三方直播平台(淘宝、抖音、拼多多等)抓取用于开播。 RTMP推流:即RTMP直
2024-11-30 第十二次正式发布 本次变更如下: 语音合成管理接口组,新增接口:创建TTS异步任务、获取TTS异步任务。 声音制作任务管理接口组,新增接口:查询用户配置的个性化音频时长、设置任务批次。 2024-10-30 第十一次正式发布 本次变更如下: 新增接口组:租户管理。 2024-08-20
字体。当前支持的字体请参考服务支持的字体 约束限制: 不涉及。 取值范围: 字符长度0-64位 默认取值: HarmonyOS_Sans_SC_Black font_size Integer 参数解释: 字体大小(像素)。接口的取值范围为0-120,实际业务使用的取值范围要求为4-120,请以业务实际使用要求为准。
推荐使用48kHz采样率录制音频。 安卓手机的超级录音机的采样率默认为高清 44100Hz,无需修改。 采样位 推荐使用48bit采样位录制音频。 安卓手机的超级录音机的采集位默认为16bit,无需修改。 声道 推荐使用单声道录制音频。 安卓手机的超级录音机默认为单声道录制,无需修改。
tudio资源的使用范围。 如果账号已经能满足您的要求,不需要创建独立的IAM用户进行权限管理,您可以跳过本章节,不影响您使用MetaStudio服务的其他功能。 IAM是华为云提供权限管理的基础服务,无需付费即可使用,您只需要为您账号中的资源进行付费。关于IAM的详细介绍,请参见《IAM产品介绍》。
双击webm2mov.exe,弹出如图1所示的界面。 图1 工具运行界面 单击“选择webm文件”,选择WEBM格式的视频。 等待视频格式转换完成。请注意,视频格式转换过程中,一定不能关闭如图2所示的2个窗口。 图2 工具运行界面 视频转换过程中,工具的同级目录下面会出现一些过程文件,请勿
20020011 上传的音频文件格式不正确,请按指导使用正确的音频格式 上传的音频文件格式不正确,请按指导使用正确的音频格式 上传的音频文件格式不正确,请按指导使用正确的音频格式 400 MSS.20020012 压缩包中的文件类型不符合任务要求 压缩包中的文件类型不符合任务要求
满足批量生成数字人诉求,平台支持几百到上千的并发模型训练任务。 大幅提升数字人生产质量 模型质量提升30%以上,数字人名片迅速引流新阵地直播产品,业务推广无后顾之忧。 解决产品端到端服务能力 可接入其他AIGC产品,打造AIGC数字人视频生成到剪辑端到端的解决方案能力。 多行业多场景广泛应用
字体。当前支持的字体请参考服务支持的字体 约束限制: 不涉及。 取值范围: 字符长度0-64位 默认取值: HarmonyOS_Sans_SC_Black font_size 否 Integer 参数解释: 字体大小(像素)。接口的取值范围为0-120,实际业务使用的取值范围要求为4-120,请以业务实际使用要求为准。
查询分身数字人模型训练任务列表 查询分身数字人模型训练任务详情 删除分身数字人模型训练任务 更新分身数字人模型训练任务 租户执行分身数字人模型训练任务命令
在特定场景中,可替代人快速生成视频内容,以提升内容生成的效率。 算法目的意图 通过学习语音与表情基系数的关系,实现使用语音生成视频的能力。在使用数据人形象生成视频的场景,包括短视频制作、直播、智能交互等,可快速生成不同台词的视频内容。
图2所示。 查看生成的分身数字人形象是否满足。用户可以在“定制任务详情”界面,执行下述操作。 如果训练生成的数字人形象满足需求,单击右下方的“通过”。在弹出的“确认”对话框中,单击“确认”,数字人形象生成完成。 如果训练生成的数字人形象不满足需求,单击右下方的“驳回”,进入“问题填写”界面。
面展示这里上传的图片或视频。 单击“保存”,一条互动规则新增完成。 用户可以根据实际情况,为当前互动库增加更多的互动规则,或者增加更多的互动库。 支持对互动规则执行下述操作: 单击互动规则右侧的“编辑”,在弹出的“互动编辑”对话框中修改互动规则。 单击互动规则右侧的“复制”,复制当前互动规则,生成一条新的互动规则。