检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
允许使用中文、英文录制。 录制全程眼睛需注视镜头,周围环境保持安静,脸部光照明亮且均匀。 拍摄完成后不要剪辑,整个视频一起上传至MetaStudio控制台。 注意事项 避免头部大幅度转动或者摆动,避免嘴巴被遮挡,可能造成口型异常。 视频中需保证仅出现录制者及其声音。如果出现其他人物形象或声音,将会影响口型生成效果和声音克隆效果。
> 查看详情”,再次进入“定制任务详情”页面。 此时任务状态为“算法训练完成”,用户可以预览Flexus分身数字人的生成效果,如果满意,单击“通过”,即可用于后续的视频制作。 如果不满意,可以单击“驳回”,在“问题填写”界面输入问题标题、描述、更新后的视频或其他问题描述附件,服
产品优势 控制台自助服务,一站式快速生成所需内容 用户申请账号并上传相关授权,拍摄训练所需音视频素材,上传进行模型训练,生成自定义形象和声音。选择背景、声音、模特等内容,基于文本或语音智能驱动,实现视频制作、视频直播、智能交互等能力。 华为云盘古数字人大模型,赋能千行百业数字化营销新模式
创建分身数字人定制任务 MetaStudio服务已预置多个数字人形象,可在视频制作界面或直播间界面查看。如果预置形象无法满足用户的需求,可以参考本节操作,自定义生成分身数字人。 注意事项 MetaStudio不支持个人用户定制形象,仅支持企业用户。 定制分身形象时,从平台下载的授
如果填写了script_id,model_asset_id、voice_config、scene_asset_id、video_config、shoot_scripts可以不填,以脚本中的配置为准。 如果填写了script_id,并且同时也填写了model_asset_id、voice_config、scen
的陪伴者。 家用机器人可以成为您的生活伴侣,与您进行互动和交流。 它们可以讲笑话、唱歌、讲故事,甚至能够跳舞和演奏乐器。 您可以通过语音与机器人交谈,并询问问题,例如天气预报、新闻资讯、菜谱等。 家用机器人可以帮助您监测健康数据并提供健康建议。 机器人可以成为您的学习伴侣,提供知识和教育支持。
room_type 否 String 参数解释: 直播间类型。 约束限制: 不涉及。 取值范围: NORMAL:普通直播间,直播间一直存在,可以反复开播 TEMP:临时直播间,直播任务结束后自动清理直播间。 TEMPLATE:直播间模板。 默认取值: NORMAL scene_scripts
注意:如果制作分身形象的时候,选择保留拍摄背景,则需要准备实景背景拍摄视频。 身份证正反面照片。 形象授权签署文件,如授权书所示。 操作步骤 登录MetaStudio控制台。 单击“分身形象制作”下方的“开始创建”,进入分身形象制作页面。 图1 定制数字人形象 上传分身数字人训练数据。 界面操作详情,如表1所示。
String 错误描述。 表8 VoiceConfig 参数 参数类型 描述 voice_asset_id String 参数解释: 音色资产ID,可以从资产库中查询。 音色ID的查询操作,详见查询预置音色ID。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。
华为云3D写实数字人能力展示 华为云首个数字员工云笙 主持华为云拉美Compass峰会 00:27 华为云首个数字员工云笙 台铃数字代言人AiLing 电动车科技创新与品牌升级 01:08 台铃数字代言人AiLing 十四届冬运动会数字人 3D数字人蒙古彩娃安达与赛努亮相 00:54 十四届全国冬运动会首次启用数字人
”,其余参数配置请参考确认文件已上传参数说明。 如果状态码返回200,说明确认文件已上传接口调用成功,可以在查询资产详情接口界面查看上传结果。也可以在MetaStudio控制台的“我的创作 > 资源 > 已激活”页签,查看上传的资产文件。 图4 接口页面 常见错误 上传资产失败的常见错误,如下所示:
拍摄脚本列表。 表4 VoiceConfig 参数 是否必选 参数类型 描述 voice_asset_id 是 String 参数解释: 音色资产ID,可以从资产库中查询。 音色ID的查询操作,详见查询预置音色ID。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。
言的翻译 像咱们国内的跨境卖家,就完全可以把国内已经录制好的视频,直接上传,就可以把视频翻译为多国籍的版本,口音也可以选择。 文案可以自己撰写,写好了可以直接上传到对话框,就可以直接生成口播介绍视频了,可以点预览,就能听语音效果。 或者你可以交给AI智能脚本,在万兴播爆智能脚本中
回调设置。 表4 VoiceConfig 参数 是否必选 参数类型 描述 voice_asset_id 是 String 参数解释: 音色资产ID,可以从资产库中查询。 音色ID的查询操作,详见查询预置音色ID。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。
websdk内置语音唤醒能力的)。预制的唤醒能力支持使用“你好云笙”、“稍等一下”、“谢谢再见”三个唤醒词,进行数字人唤醒、打断和退出。 可以通过调用create接口,设置接口参数param中config里的enableLocalWakeup参数来开启Web语音唤醒能力。 定制唤醒能力
开。 其他动作:可以录制您需要的任何动作,数量不限,只要保证动作前和动作后的初始位置是一致的即可。 请注意,动作编排的效果大幅度取决于录制时每个动作之间手部和身体初始位置的一致性,若录制效果不佳,则无法进行动作编排。请严格遵守录制要求进行录制,我们推荐一个动作可以重复录制2-3遍,来降低容错率。
false is_end_at_first_frame 否 Boolean 参数解释: 视频结束帧是否跟起始帧相同。需要多个数字人视频无缝拼接时设置成true。 约束限制: 仅分身数字人视频制作支持,当视频制作时插入动作标签后此设置将失效。 取值范围 true: 开启 false: 不开启
用户使用视频直播或智能交互API调用音色时,需要先确认在MetaStudio控制台的视频直播间编辑界面或智能交互对话设置页面,能否选到当前音色。如果界面可以正常展示音色并且能够选择使用,说明接口可以正常调用该音色,否则无法通过API调用此音色。 智能交互接口 下述三个智能交互接口
4e5f6。 注意:robotId和taskUrl必须至少设置一个参数。 taskUrl 否 - string 在MetaStudio控制台创建生成的数字人互动任务页面URL。URL获取方式,请参见创建智能交互数字人。 注意:robotId和taskUrl必须至少设置一个参数。 containerId