正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
视频采样格式为YUV420。 视频素材总大小小于1GB。 同时叠加的视频总数量为3,包含互动时配置的视频。 音频格式 音频支持的格式为:MP3、M4A、WAV。 音频要求如下所示: 仅提取单声道音频。 音频素材总大小小于500MB。 图片格式 图片支持的格式为:PNG、JPG、JPEG。 图片要求如下所示:
在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“互动管理”,进入如图3所示的页面。 图3 互动管理页面 在左侧“互动库”区域,单击下方的“新增互动库”,上方新增一条横线,如图4所示。 输入互动库的名称。 图4 互动库 选中左侧的互动库,单击界面右侧的“新建”,弹出“新建互动”对话框,如图5所示。
选中需要连读的文本内容,单击“连读”。 多音字 选中文本中的多音字,单击“多音字”,在弹出的提示框中,选择正确的发音或者自定义发音。 别名 选中需要通过别名播报的文本内容 ,单击“别名”,设置为实际播报的内容。 数字英文 示例数字“1024”的读法如下所示: 数字:一零二四 数值:一千零二十四
满足批量生成数字人诉求,平台支持几百到上千的并发模型训练任务。 大幅提升数字人生产质量 模型质量提升30%以上,数字人名片迅速引流新阵地直播产品,业务推广无后顾之忧。 解决产品端到端服务能力 可接入其他AIGC产品,打造AIGC数字人视频生成到剪辑端到端的解决方案能力。 多行业多场景广泛应用
(华为云CBS)。 用户购买非华为的LLM或者大模型,当前支持科大讯飞AIUI通用语义模型及星火大模型、出门问问的数字人平台。 科大讯飞对接至智能交互服务,开发者基于SDK完成web界面开发,操作请参考创建智能交互数字人(科大讯飞)。 出门问问的数字人平台对接至智能交互服务,开发
面展示这里上传的图片或视频。 单击“保存”,一条互动规则新增完成。 用户可以根据实际情况,为当前互动库增加更多的互动规则,或者增加更多的互动库。 支持对互动规则执行下述操作: 单击互动规则右侧的“编辑”,在弹出的“互动编辑”对话框中修改互动规则。 单击互动规则右侧的“复制”,复制当前互动规则,生成一条新的互动规则。
true boolean 是否启用任务缓存。如果用户希望每次修改任务配置后能快速生效,可不启用缓存。 启用任务缓存,可加快数字人的启动速度。 关闭任务缓存,每次调用create创建任务时,都会创建新任务,不使用上次缓存的任务。 useDefaultBackground 否 true boolean
G和BMP格式的图片上传。 也支持直接拖拽本地图片至图片列表区域,完成上传操作。 关键词搜索框,可输入图片名称进行精准搜索。 示例:科技。 筛选条件 支持通过背景图片来源的维度,筛选展示下方的图片。 图片列表 默认展示全量图片。选中场景,单击图片,可以替换当前场景的背景。 第一张
etaStudio控制台,根据开通引导完成服务开通。 IAM权限管理 如果华为云账号无法满足用户的使用诉求,可参考创建用户并授权使用MetaStudio,创建IAM用户,进行精细化的权限管理。 推荐浏览器 推荐使用Chrome浏览器访问MetaStudio控制台。
问答机器人ID CBS控制台的“智能问题机器人”页面中,问题机器人列表中“问题机器人名称/ID”列的ID值。界面详情请参见图3。 委托站点 从下拉框中选择用户购买CBS服务的问答机器人所在Region。 委托 需要授予MetaStudio服务CBS服务的访问权限。 首次委托的站点,需要开启委托开关。详细操作如下所示:
机录制音频。 具体的录音注意事项,如表2所示。 表2 录音注意事项 录音事项 说明 话筒间距 调整与麦克风之间的距离,以一拳距离为宜。不宜离麦太近,防止喷麦或录入呼吸声。 录音内容 每句文案起始数字编号无需阅读。 示例:4. 它不仅拥有出色的功能,还具备卓越的性能,序号4无需阅读。
String 输出数据的格式版本,如请求中无此参数,则输出数据格式为1.0,可选值有: 1.0: 对应的输出为: 动作数据:75个骨骼旋转值 表情数据:52ARkit表情及参数 2.0: 对应的输出为: 动作数据:55个骨骼旋转值+骨骼3D坐标 表情数据:178个控制器的数据 状态码: 400
String 输出数据的格式版本,如请求中无此参数,则输出数据格式为1.0,可选值有: 1.0: 对应的输出为: 动作数据:75个骨骼旋转值 表情数据:52ARkit表情及参数 2.0: 对应的输出为: 动作数据:55个骨骼旋转值+骨骼3D坐标 表情数据:178个控制器的数据 状态码: 400
1080P:1080P。支持1080P及720P的视频输出。 4K:4K。支持4K、1080P及720P的视频输出。 app_user_id String 自定义用户id(如创建任务时设置了X-App-UserId则会携带)。 is_flexus Boolean 是否是基础版的形象训练 状态码: 400
1080P:1080P。支持1080P及720P的视频输出。 4K:4K。支持4K、1080P及720P的视频输出。 默认取值: 1080P app_user_id String 自定义用户id(如创建任务时设置了X-App-UserId则会携带)。 is_flexus Boolean 是否是基础版的形象训练 tr
String 输出数据的格式版本,如请求中无此参数,则输出数据格式为1.0,可选值有: 1.0: 对应的输出为: 动作数据:75个骨骼旋转值 表情数据:52ARkit表情及参数 2.0: 对应的输出为: 动作数据:55个骨骼旋转值+骨骼3D坐标 表情数据:178个控制器的数据 响应参数 状态码:
获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 X-Project-Id 否 String