检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-traini
对接第三方大脑,通过数字人交互的方式与用户进行问答。场景应用广泛,包括智能导购、文旅导览、智能问答、营业厅客服等。 注意: 数字人回答的内容,是由对接的第三方大模型或知识库返回的答案决定的。 资产管理 支持从本地上传模型、PPT、动画、素材、视频、场景、图片、音乐等资产。 支持转移声音和模型资产给其他租户使用。
获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 X-Project-Id 否 String
证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购
数字人直播状态变化流程图,如图1所示。 图1 直播状态变化流程图 流程图说明,如下所示: PREPROCESSING:MetaStudio直播服务启动加载形象模型的状态。 PLAY_READY:形象模型加载完成的状态。此时数字人处于静默状态,等待开始播放剧本的指令。 PROCESSING:数字人的工作状
激活资源 目前支持购买的资源类型,如表1所示。 需激活“一次性计费”产品后使用,必须在一年内激活,否则无法再激活使用。从激活日期开始计算,产品有效期为一年。 按需套餐包和包年/包月产品,可直接使用,无需激活。必须在有效期内使用完成,超出有效期后,自动失效。 表1 资源类型 服务类型
用户制作视频直播时,可以优先了解下视频直播首页面和视频直播制作界面详情。 视频直播首页面 分身视频直播首页面,如图1所示。各个页签的说明,如下所示: 直播管理:使用数字人创建直播间。操作请参考视频直播。 互动管理:支持新增互动库,及其相应的互动规则。互动库可以直接在直播间中导入使用。操作请参考互动管理。
返回结果 状态码 请求发送以后,您会收到响应,其中包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于管理员创建IAM用户接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对
概览页面,如图1所示。 图1 服务概览页面 单击“购买资源”,进入“购买MetaStudio服务”页面,如图2所示。 “产品分类”中高亮展示的是SP用户可购买的资源包类型,置灰展示的是未对SP用户开放的资源包类型。 图2 购买页面 SP用户根据实际情况,选择需要的服务类型、产品分
行交互对话。相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。 图1 MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。 单击左侧导航栏中的“应用”,如图2所示。 参数配置说明,如表1所示。 图2 创建应用
三方应用”需要选择“华为云CBS”时,才需要执行本节操作,详情请参考表1。 操作步骤 登录MetaStudio控制台。 单击界面左上角的图标,在弹出的浮动框中,搜索“对话机器人服务 CBS”,如图1所示。 图1 CBS服务 单击“对话机器人服务 CBS”,进入控制台页面,如图2所示。
进行交互对话。相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。 图1 MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。 单击左侧导航栏中的“应用”,如图2所示。 参数配置说明如表1所示。 图2 创建应用
数字内容生产线的计费价格调整公告 随着数字人业务的发展,数字人市场已发生变化。华为云数字内容生产线为更好的提供服务,将从2024年9月27日起,对中国大陆分身数字人形象制作、声音制作进阶版、视频制作的按需计费及按需预付费套餐包,进行统一调价。调整后的价格如表1所示。 表1 中国大陆价格调整详情
做动作时可以选择静默或者同步读相关文本,根据我们的经验,边说边做会使动作更加自然,文本内容不限。 以下是参考流程和文本: 接下来开始动作编排的原子动作录制 <讲话但不做动作> 5,4,3,2,1。<静默位置,闭嘴默数> 请比个数字1的手势 <任意一只手做数字1的动作后回到静默动作> 5,4,3,2,1。<静默位置,闭嘴默数>
直播间配置约束 直播间配置限制,如表1所示。 表1 直播间限制 直播间配置 限制 文本驱动 每个单场景中所有段落输入文字的总量需大于200字。 每个段落的文本字符数量需小于2000,如果包含语音合成标记语言SSML标签,需小于3000。 整个直播间所有段落的文本总字符数,如果包含语音合成标记语言SSML标签时,需小于30万。
嗨,大家好!欢迎来到我们的直播间!我是今天的主播Lan。 非常高兴能够和各位在今晚的直播间相聚,希望今天在直播间里能和大家一起度过一段非常有意义的时光! 感谢每一位在直播间停留观看的朋友们,感谢大家进来咱们的直播间参与今天的互动、留言。 稍后我们的直播间不但会教学一些数字人视频的剪辑技巧,还会跟大家推荐一些AI剪辑的功能。
授权浏览器麦克风的访问权限 支持对Chrome浏览器和Mac系统的浏览器,授权麦克风的访问权限。 谷歌浏览器 打开Chrome浏览器,单击浏览器右上方的图标,从下拉框中选择“设置”。 进入“设置”页面。 在左侧导航栏中,选择“隐私设置和安全性”。 在右侧界面中,单击“网络设置”,进入“网络设置”页面。
获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 X-Project-Id 否 String
单击“完成”,会新增弹出如图2和图3所示的2个浏览器窗口。 MetaStudio控制台超过10分钟不操作,默认会退出登录,导致第三方直播平台的直播画面也中断。需要确保图3的窗口始终是打开的,直播过程中一定不能关闭,这样第三方直播平台的直播才能顺利完成。 图2 直播窗口 图3 确保直播过程不中断的窗口 父主题:
单击“完成”,会新增弹出如图2和图3所示的2个浏览器窗口。 MetaStudio控制台超过10分钟不操作,默认会退出登录,导致第三方直播平台的直播画面也中断。需要确保图3的窗口始终是打开的,直播过程中一定不能关闭,这样第三方直播平台的直播才能顺利完成。 图2 直播窗口 图3 确保直播过程不中断的窗口 父主题: