检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
华为云MetaStudio分身数字人驱动算法 备案编号 网信算备520111252474601240045号 算法基本原理 分身数字人驱动算法是指通过深度学习生成数字人驱动模型,模型生成后,输入音频来合成数字人视频的一种技术。 其基本情况包括: 输入数据:真人视频、音频。 算法原理:通过深度学习算法来学习真人视频
新增接口组:智能交互数字人知识库技能管理。 新增接口组:智能交互数字人知识库意图管理。 新增接口组:智能交互数字人知识库问法管理。 新增接口组:智能交互数字人欢迎词管理。 新增接口组:智能交互数字人热点问题管理。 新增接口组:智能交互数字人热词记录管理。 新增接口组:智能交互数字人委托管理。
直播任务管理 启动数字人智能直播任务 查询某个智能直播间下直播任务列表 查询数字人智能直播任务详情 结束数字人智能直播任务 控制数字人直播过程 查询租户所有数字人直播任务列表 上报直播间事件 父主题: 分身视频直播
分身数字人直播资料概览 智能交互 智能交互(科大讯飞) 智能交互全流程 03:17 智能交互全流程演示 智能交互(华为云CBS) 智能交互全流程 01:46 智能交互全流程演示 智能交互(奇妙问) 智能交互全流程 01:40 智能交互全流程演示 智能交互(热词) 热词配置 00:54 智能交互热词配置流程演示
查询照片检测任务详情 智能直播间管理 表8 智能直播间管理接口 接口 说明 POST /v1/{project_id}/smart-live-rooms 创建智能直播间 GET /v1/{project_id}/smart-live-rooms 查询智能直播间列表 GET /v
MetaStudio提供分身数字人形象定制、声音定制、视频制作、视频直播、智能交互等功能。 定制分身数字人形象 拍摄真人视频 定制形象 定制分身数字人声音 声音录制 定制声音 分身数字人视频制作 界面说明 视频制作 分身数字人视频直播 界面说明 视频直播 分身数字人智能交互 场景说明 华为云CBS服务场景 科大讯飞场景
频制作”,详见计费说明。 系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明。 系统声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。
视频直播 视频直播界面说明 视频直播 互动管理 商品管理 直播任务管理 智能交互设置 视频直播素材操作详情
用户在控制台进行数字人名片制作制作,生成的数字人名片,会展示在“我的创作 > 分身名片”页面。 用户在控制台进行智能交互操作,生成的对话项目和技能,会展示在“我的创作 > 智能交互”页面。 一类是通过本地上传或者接收资产管理员转移的资产生成的,会展示在“我的创作 > 资源”页面。 父主题:
区域限制 预置模特使用限制 API使用限制 形象制作限制 声音制作限制 视频制作限制 视频直播限制 Flexus形象制作限制 照片数字人限制 智能交互限制 资产管理说明 SP用户限制
示例5:视频制作剧本管理 示例6:视频直播 示例7:视频直播对接实时音视频客户端SDK 示例8:资产管理 示例9:数字人名片制作 示例10:智能交互
分身视频直播 智能直播间管理 直播任务管理 直播商品管理
点预览,就能听语音效果。 或者你可以交给AI智能脚本,在万兴播爆智能脚本中,支持“扩写、精简、专家、开心、吸引力”五种文案改写方式,支持多次重写,挑选一款适合的就可以了~ 想要海外本地化视频,文案翻译也不用去第三方网站,在文案上方的智能翻译按钮,点中以后就可以选择翻译语种 我们提
用户如何举报平台违规内容? 如何调用MetaStudio接口? 第三方直播平台直播画面不清晰怎么办? 第三方平台直播画面突然中断是怎么回事? 如何实时切换智能交互的语言和声音? 如何接收并激活声音或分身模型资产? 父主题: 附录
说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 回复问题的时候,支持同时在直播画面中展示图片或者视频信息,以
视频直播不支持透明背景设置,仅视频制作和智能交互支持。 直播任务退出说明 直播任务退出说明,如表2所示。 表2 直播任务退出说明 直播任务退出场景 操作说明 租户自行退出直播任务 租户可通过下述方式,退出直播任务。 在MetaStudio控制台开播页面,停止直播任务。 调用结束数字人智能直播任务接口,停止直播任务。
单击“图片”,进入“图片上传”页面,如图3所示。 请根据实际情况,配置下述信息: 资产标题:图片的标题。 图片简介:图片的基本介绍,方便了解和使用。 风格:关键词标签,方便用户搜索此类型的资产。 基本信息:图片的用途。 图3 上传图片 单击“图片上传”区域,从本地选择需要上传的图片资产。 单击界面右上
20010075 智能交互配额不足 智能交互配额不足 请联系技术支持或购买智能交互套餐 403 MSS.20010076 智能交互任务过期 智能交互任务过期 当前任务已过期 403 MSS.20010082 系统模板编辑失败 系统模板编辑失败 请检查是否拥有系统管理员权限 403
wav 进阶版媒体2.wav 支持手机录制100条语料音频(15分钟),1-3天制作,获得高还原度音色,mos分4.0。 直播、培训视频、智能交互 高级版声音制作 女声 高级版媒体1.wav 高级版媒体2.wav 录音棚专业设备录制60分钟音频,3-5天制作,支持多轮人工调整,获得现场级高品质音色,mos分4
说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 素材绑定(可选) 从本地选择图片或视频上传。当直播间命中当前