检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用户请求建立WebSocket连接 用户发送文本驱动消息 用户发送中断对话的消息 用户发送结束对话的消息 用户发送心跳请求消息 用户与数字人对话超时断连 会话任务结束 用户请求建立WebSocket连接 用户请求建立WebSocket连接时,会调用接口智能交互驱动WebSocket
能呈现自定义表情&动作 剧本、画布和设置 视频制作、视频直播功能,都需要进行视频创作,下面以视频直播为例,进行说明。 视频素材:如图中1区域所示,包括模板、角色、背景、贴图、视频、商品、文本等素材。支持使用预置的,也支持自定义生成。 画面布局:简称“画布”,如图中2区域所示。可以在画布中插入
智能交互驱动 前提条件 智能交互驱动流程 智能交互驱动WebSocket接口 父主题: 智能交互
视频制作 无法保存剧本怎么办? 视频合成失败如何处理? 如何将WEBM视频转成MOV格式? PPT如何转为PDF文件? 如何在MetaStudio控制台呈现PPT的动画效果?
智能交互客户端SDK 操作前提 SDK概述 SDK下载 Web SDK 父主题: 智能交互
语音合成管理 创建TTS试听任务 获取TTS试听文件 创建TTS异步任务 获取TTS异步任务 语音同步合成WebSocket接口
分辨率最大支持1080P。 帧率小于等于30fps。 编码为AV1、VP8、VP9、H264或H265格式。 VP8、VP9编码仅WEBM视频支持。 WEBM视频如果为AV1编码格式,不支持合成视频。 AV1、H265编码格式目前支持Chrome浏览器,不支持Edge浏览器。 视频素材总大小小于1GB。
Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值 查询语音合成WebSocket接口使用的音色ID 预置音色ID列表 查询预置音色ID
管,让数字人直播更真实、更沉浸。 支持数字人直播矩阵式管理,高级策略配置管理直播更灵活。 实时智能交互,提升客户满意度和品牌形象 开放的Web SDK及API可快速集成到第三方业务系统,实现AI数字员工问答、服务、陪练等场景任务。 1.5秒超低时延交互 实时驱动极低延时,保障用户真实体验。
五官清晰无遮挡,目视前方。 良好的亮度,确保面部细节。 照片内不能出现多张人脸。 人像照片格式要求,如下所示: 支持的格式为:PNG、JPG、JPEG、WEBP。 大小不超过16MB。 分辨率最大支持1080P,如果超出,会自动缩放为1080P,且需保证分辨率大于等于80*80。 音频 音频录制要求,如下所示:
shared_state 否 String 参数解释: 共享状态。 约束限制: 该配置仅用于shared_type为SHARED的模板。 取值范围: PUBLISHED:发布。模板可用。 DRAFT:草稿。编辑态,仅拥有者可访问。 REVIEW:审核态。不可编辑,仅拥有者/审核人员可查看。 默认取值:
shared_state String 参数解释: 共享状态。 约束限制: 该配置仅用于shared_type为SHARED的模板。 取值范围: PUBLISHED:发布。模板可用。 DRAFT:草稿。编辑态,仅拥有者可访问。 REVIEW:审核态。不可编辑,仅拥有者/审核人员可查看。 默认取值:
card_templet_asset_id 是 String 数字人名片模板资产ID,可以从资产库中查询。 card_text_config 是 BusinessCardTextConfig object 用户输入的数字人名片信息。实际可以填写哪些字段取决于名片模板。 card_image_config 是
card_templet_asset_id String 数字人名片模板资产ID,可以从资产库中查询。 card_text_config BusinessCardTextConfig object 用户输入的数字人名片信息。实际可以填写哪些字段取决于名片模板。 card_image_url BusinessCardImageUrl
shared_state 否 String 参数解释: 共享状态。 约束限制: 该配置仅用于shared_type为SHARED的模板。 取值范围: PUBLISHED:发布。模板可用。 DRAFT:草稿。编辑态,仅拥有者可访问。 REVIEW:审核态。不可编辑,仅拥有者/审核人员可查看。 默认取值:
当前状态不允许进行文本问答 403 MSS.47015005 任务的websocket连接数超过最大值 任务的websocket连接数超过最大值 请联系技术支持 403 MSS.47015006 实例的websocket连接总数超过最大值 实例的websocket连接总数超过最大值 请联系技术支持 403
card_templet_asset_id 是 String 数字人名片模板资产ID,可以从资产库中查询。 card_text_config 是 BusinessCardTextConfig object 用户输入的数字人名片信息。实际可以填写哪些字段取决于名片模板。 card_image_config 是
单击“查看示范”,在弹出的“上传照片要求”对话框中,查看照片拍摄要求。 请严格按照要求拍摄并上传照片。照片格式必须为JPG、JPEG、PNG、WEBP,大小不超过16MB,照片比例推荐16:9或9:16。 视频名称 使用照片人像合成视频名称。 02 录入播报内容 选择一种方式,生成播报内容
不同资产类型主文件格式与大小约束如下 视频资产:资产类型为VIDEO,主文件格式(忽略大小写)为mp4、m4v、mkv、mov、flv、3gp、wmv、avi、webm,主文件大小不超过5G 图片资产:资产类型为IMAGE,主文件格式(忽略大小写)为jpeg、jpg、png、bmp、gif,主文件大小不超过50M
String 剧本类型。默认查询VIDEO_DRAFT。 VIDEO_DRAFT:视频草稿。 SYSTEM_VIDEO_TEMPLET: 系统视频模板。 view_mode 否 String 横竖屏类型(内部参数,不对外开放)。默认值是LANDSCAPE。 LANDSCAPE:横屏。 VERTICAL:竖屏。