检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
常用概念 数字人 数字人是一种以数字形式存在于数字空间中的虚拟人物,它具有拟人或真人的外貌、行为特点,并具备一定的智能和情感,可以进行交互和表达。数字人也可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。
教育:数字人课件制作、虚拟老师教学。 政府及公共事业:数字人代言、数字人宣讲、数字人会议等。 医疗健康:智能医疗客服、虚拟医生培训等。 金融:数字人智能客服、数字人企业代言、数字人培训视频制作等。 文旅:智能客服、数字人导览、数字人讲解等。 广电传媒:虚拟综艺主持人、虚拟新闻主播等。 互
返回结果 状态码 请求发送以后,您会收到响应,其中包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于管理员创建IAM用户接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对
智能交互驱动任务结束流程图 流程图总体说明 流程图示例中详细的接口交互说明,如下所示: 用户请求建立WebSocket连接 用户发送文本驱动消息 用户发送中断对话的消息 用户发送结束对话的消息 用户发送心跳请求消息 用户与数字人对话超时断连 会话任务结束 用户请求建立WebSocket连接 用户请求建立W
属性类型 属性值 是否必选 描述 interpret-as String number:数字 date:日期 figure:数值 phone:电话号码 english:英文单词 spell:逐个字母读英文 是 将内容解释为给定类型读法。 标签关系 可以包含文本,不可以包含其他标签。 示例
播报发送的互动内容。 图4 音频驱动 音频上传完成后,单击“试听”,可试听音频。 开播后可单击如图5所示的图标,切换到全局主播或助播的声音,发送互动内容成功后,播报互动内容。 图5 开播页面 即兴直播 无需设置剧本,直接开播,界面如图6所示。开播后数字人保持静默,需要发送互动内容或者通过真人接管,驱动数字人说话。
人进行直播。 PLAY_END:退出直播任务状态。 RTSA Command定义 RTC User Render用户通过COMMAND通道发送服务端状态通知。 代码示例如下所示: { "message_type" : "state_notify", "state" : "PREPROCESSING"
能力,如表1所示。 表1 功能特性 功能名称 功能描述 应用场景 形象制作 拍摄真人视频,建模生成分身形象。 作为虚拟形象使用,如虚拟主播、虚拟主持、虚拟客服、虚拟老师等。 声音制作 录制真人声音,建模生成自定义声音,或直接购买第三方声音使用。 为数字人配音。 视频制作 使用数字人形象,设置画布、音频,合成视频。
hat-command/e37a28485f684769aa537466e719629d 等MetaStudio返回可以发送启动对话的消息时,如2所示。用户发送文本驱动消息。 代码示例如下所示: { "request_id": "d7aa08da33dd4a662ad5be508c5b77cf"
None 形象制作 分身数字人形象采集 拍摄指导视频 01:55 分身数字人形象采集指导视频 分身数字人形象采集 拍摄示例视频 01:27 分身数字人形象采集示例视频 Flexus数字人形象采集 拍摄示例视频 01:10 Flexus数字人形象采集示例视频 视频制作 视频制作 视频制作全流程
成长地图 | 华为云 数字内容生产线 数字内容生产线(MetaStudio)解决方案,提供数字人视频与直播、智能交互等服务,使能千行百业场景应用。 产品介绍 视频论坛 立即使用 立即使用 成长地图 由浅入深,带您玩转MetaStudio 弹性云服务器四 01 了解 了解数字内容生
header需要增加X-Auth-Token字段用于鉴权。获取认证鉴权的方式,详见认证鉴权。 发送请求 发送请求的流程如下所示: 建立WebSocket连接。 发送音色模型预加载请求。 发送TTS合成请求,详见请求参数。 请求参数 表1 请求Header参数 参数 是否必选 参数类型
内容编辑(Editor)、物理仿真(Simulation)、云渲染(Rendering)5大平台能力,帮助您快速构建高质量模型,用于虚拟直播、虚拟视频内容制作等适用于教育课件、电商带货、社交文娱等场景。 公测 什么是数字内容生产线
对算法输出系数进行平滑处理及异常数据过滤,返回结果。 算法应用场景 数字人视觉驱动算法可用于影视制作、虚拟人姿态控制等场景,加速影视制作的动画生成效率,提升虚拟人控制体验。 算法目的意图 视频驱动数字人动作,实现影视制作动画快速生成。 虚拟现实Avatar形象姿态控制。 其他需要通过表演者驱动数字人动作表情的领域,以提升形象动画生产效率。
直播计时,当前已直播1分20秒。 切换互动内容播报的声音。默认为主播声音,可切换为助播声音。 单击快捷图标,选择预置的互动内容发送播报。 请输入互动内容,回车发送内容 手工输入互动内容,发送成功后,主播或助播进行互动内容插播。插播结束后,继续播报原有内容。 真人接管 单击“真人接管”,开启真人接管
tags标签说明 tags取值类型 说明 数字人类型 取值如下: VIRTUAL_AVATARS:分身数字人 VIRTUAL_HUMANS:虚拟数字人 REALISTIC_VIRTUAL_HUMAN:写实数字人 性别 取值如下: MALE:男生 FEMALE:女生 姿势 取值如下:
起使用,对请求进行加密签名。 SK(Secret Access Key):私有访问密钥。与访问密钥ID结合使用,对请求进行加密签名,可标识发送方,并防止请求被修改。 使用AK/SK认证时,您可以基于签名算法使用AK/SK对请求进行签名,也可以使用专门的签名SDK对请求进行签名。详
API同时支持使用AK/SK认证,AK/SK认证使用SDK对请求进行签名,签名过程会自动往请求中添加Authorization(签名认证信息)和X-Sdk-Date(请求发送的时间)请求头。 AK/SK认证的详细说明请参见认证鉴权的“AK/SK认证”。 对于管理员创建IAM用户接口,使用AK/SK方式认证时,添加消息头后的请求如下所示。
de、interactionModeSwitch、sendTextQuestion,用来获取和设置当前交互模式(语音问答或文本问答),以及发送问题文本。 2024-10-08 本次变更如下: 新增发布2.0.3版本SDK,相比2.0.2版本,变更点如下所示: 新增接口startChat、stopChat。
文本驱动:输入文本,通过文本驱动数字人说话。 音频驱动:上传音频,通过音频驱动数字人说话。 即兴直播:无需设置剧本,直接开播。开播后数字人是不说话的,需要发送互动内容,或者开启真人接管,驱动数字人说话。 互动设置:支持弹幕、用户入场 、点赞和送礼设置。 直播配置:支持开播设置、输出设置、风控设置和更多设置。