检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
udio资源。 根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将MetaStudio资源委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,
获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。
parameter invalid. 音频采集设备不支持设置的采集约束,采集失败。 90100019 capture failed, requested device not found. 未找到请求的设备,采集失败。建议通话开始前,引导用户检查通话所需的麦克风等设备是否就绪。 90100020 capture
MetaStudio的计费项分为分身数字人费用、3D数字人费用和资产管理费用三类。 分身数字人费用:包括分身数字人形象制作、声音制作、分身数字人视频制作、分身数字人视频直播、照片数字人视频制作和分身数字人名片制作的费用。 3D数字人费用:包括照片建模、语音驱动和视觉驱动的费用。 资产管理费用:即服务资产管理的费用。
PREPROCESSING:MetaStudio直播服务启动加载形象模型的状态。 PLAY_READY:形象模型加载完成的状态。此时数字人处于静默状态,等待开始播放剧本的指令。 PROCESSING:数字人的工作状态。数字人会根据直播任务中预置的文本或音频进行直播。 PLAY_PAUSE:数字人直播
dio控制台查看已分配的资源列表,正常使用MetaStudio服务并消耗相应的资源。 前提条件 SP用户已关联当前租户,操作请参考关联租户。 SP用户已分配资源给当前租户,操作请参考分配资源。 操作步骤 租户登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线
单独上传语料包:单独录制音频文件,需要单击下方的“点击上传音频文件”,上传音频。 音频格式支持WAV、MP3,单段音频时长1~5分钟,建议1分钟。语料中的语言仅支持中文和英文。 视频中提取声音:直接提取训练视频中的声音,训练生成Flexus声音。 视频中的语言仅支持中文和英文。 须知:“单独上传语料包”的方式生成Flexus声音的效果会更好。
文本驱动 文本内容的操作说明如表1所示。 表1 操作说明 操作 说明 插入停顿 将鼠标放在需要停顿的文字右侧,单击“插入停顿”。在弹出的提示框中,选择“换气”或者停顿的时间,也支持自定义停顿时长。 连读 选中需要连读的文本内容,单击“连读”。 多音字 选中文本中的多音字,单击“多音
访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。 服务会在收到问题单后,联系您处理。 父主题:
访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。 服务会在收到问题单后,联系您处理。 父主题:
一个视频草稿的场景数量不能超过50个。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。 每个单场景如果包含语音合成标记语言SSML标签,文字数量需小于128K。 音频驱动 每个单场景上传音频的大小不超过100M。 视频格式 插入的视频素材支
接口参考 主入口(HwICSUiSdk) 事件通知(EventMap) 错误码(ICSError) 授权浏览器麦克风的访问权限 父主题: Web SDK
MetaStudio服务对租户资产内容的风险有一定连带责任。如果服务接收到资产内容投诉,按照国家相关部门要求,会冻结违规违规资产。情节严重的,还会冻结租户的全部资源。 被冻结的资产不能用作内容生成的素材。租户可以删除被冻结的资产或者申请解冻资产。 用户申请解冻资产 用户可以通过申诉的方式,申请解冻资产,解冻后资产会恢复至解冻前的状态。
角色名称 输入分身数字人的角色名称。 示例:云笙。 训练视频 从本地上传已录制好,且符合拍摄要求的人像视频。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄。支持MP4、MOV格式的视频。 背景替换 选择“
录制? 大部分相机内置麦克风的录制效果也能满足我们对声音的要求。我们对声音的清晰度可以有适度的妥协,但请务必保证底噪不能太大,且不能有其他人声出现,尤其是被拍摄模特正在说话的时候。 模特形象 分身数字人不支持替换衣服,因此,您在录制时的着装会决定您的数字人穿着。 在拍摄前,我们建议参照如下条目,对您的形象进行检查。
在服务主界面,单击左侧导航栏中的“任务中心”。 查看“分身数字人”页签的数字人定制任务列表,找到被驳回的数字人定制任务。 任务状态为“审核未通过”。 单击任务右侧的“查看原因”,在弹出的“审核未通过”对话框中,查看审核未通过的原因。 按照规范重新录制或提供符合规范的视频。 单击任务右侧的“重新上传”,上传更新后的视频。
提交工单申请开通,并提供需要使用的第三方应用名称。 单击“添加意图及话术”,新增“意图1”配置框。 需配置下述参数: 意图1:从下拉框中选择意图,这里展示的意图是服务预置的,不支持从当前界面增加新的意图名称。用户也可以在提交工单时,同步补充需要的意图列表,让服务进行预置。仅支持选
(可选)创建对话,操作请参考对话。 单击界面右上角的“发布”,发布数字人智能交互对话。 发布成功后,自动跳转至与数字人智能互动页面,可以体验与数字人互动的效果。也可以复制数字人互动页面的网址,分享给其他用户使用。 获取数字人互动页面URL的方式还有:进入“我的创作 > 智能交互 > 对话项目”页
常用概念 数字人 数字人是一种以数字形式存在于数字空间中的虚拟人物,它具有拟人或真人的外貌、行为特点,并具备一定的智能和情感,可以进行交互和表达。数字人也可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。
单击“完成”,会新增弹出如图2和图3所示的2个浏览器窗口。 MetaStudio控制台超过10分钟不操作,默认会退出登录,导致第三方直播平台的直播画面也中断。需要确保图3的窗口始终是打开的,直播过程中一定不能关闭,这样第三方直播平台的直播才能顺利完成。 图2 直播窗口 图3 确保直播过程不中断的窗口 父主题: