检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择一张已授权的人像照片作为输入。 输入的人像照片经过安全过滤,判断是否通过安全筛选,若不通过则不进行数据生成和结果返回操作。 将人像照片输入至算法模型中,通过特征提取、人脸重建、素材特征匹配等进行人头重建,生成3D人头模型。 生成的人头模型通过配上默认身体素材配件,形成完整的3D数字人模型,并返回结果。
WebSocket接口驱动数字人方案,即文本驱动方案。 在调用create接口之前,必须要有用户点击集成WebSDK的页面的行为。 浏览器通过有上述点击的行为,才能获取采集声音的权限。否则无法采集声音,无法正常使用语音唤醒能力。 预制唤醒能力 自3.0.1版本开始,SDK支持唤醒
API使用 如何获取项目ID? 如何调用MetaStudio接口? Flexus支持通过API集成使用吗?
高度拟真的虚拟人。 具备如下特点: 2D模型,通过拍摄真人视频训练生成 无表情&骨骼数据 只能由AI驱动 使用既定表情&动作 IP型数字人:由计算机图形学技术创造出来的与人类形象高度接近的数字化形象。 具备如下特点: 3D模型,通过艺术设计生成 有表情、骨骼数据 可由真人动作驱动
关键词搜索框,可输入数字人名称进行精准搜索。 示例:yun lan。 刷新图标。如果有关键词,按照关键词进行刷新展示;如果没有关键词,恢复为默认展示。 筛选条件 支持通过角色、性别、姿势、行业、区域和分辨率的维度,筛选展示下方的数字人。 数字人列表 默认展示全量数字人。单击数字人形象,自动替换更新至视频直播的当前场景中。
示在“我的创作 > 分身名片”页面。 用户在控制台进行智能交互操作,生成的对话项目和技能,会展示在“我的创作 > 智能交互”页面。 一类是通过本地上传或者接收资产管理员转移的资产生成的,会展示在“我的创作 > 资源”页面。 父主题: 资产管理
training_input_source_url String 用户原始输入数据url。 create_type String 任务创建方式。 PACKAGE: 使用一个zip包包含所有数据 SEGMENT: 逐句上传数据 tag String 任务标签。 ECOMMERCE:
合适的灯光环境将大幅提升模特的拍摄效果,我们建议: 使用3~4台专业摄影灯进行打光,包括:主光、辅助光、产品光(若需要拍摄桌面产品)、背景光、轮廓光(可选),具体布光方式参考图3。 图3 布置灯光 录制保证过程中保证光线不发生显著变化。 确保背景上的绿幕均匀明亮,避免阴影或明暗不均的情况。同时确保演员或物体与绿幕背景之间没有阴影或反光。
创建任务),COMMIT_JOB(提交任务),SYSTEM_AUDIT_PASS(系统审核通过),ADMIN_AUDIT_PASS(管理员审核通过),AUDIT_NOT_PASS(审核未通过),TRAINING_FINISH(训练完成),UPLOADING_MODEL(上传语音模型)
用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。
leases。 ffmpeg解压后,将其下bin目录加入系统环境变量。 输入命令行ffmpeg后可以显示版本号,说明安装成功。 解决方法 通过剪映或者ffmpeg可以将H265(HEVC)视频的格式转码为H264,再上传至MetaStudio控制台,进行形象制作。 以ffmpeg为例,输入命令行:ffmpeg
Array of strings 音频上传的地址。 说明: 通过该obs地址上传时需要设置content-type为audio/wav txt_uploading_url Array of strings 文本上传的地址。 说明: 通过该obs地址上传时需要设置content-type为text/plain
关键词搜索框,可输入数字人名称进行精准搜索。 示例:yun lan。 刷新图标。如果有关键词,按照关键词进行刷新展示;如果没有关键词,恢复为默认展示。 筛选条件 支持通过角色、性别、姿势、行业、区域、分辨率和动作的维度,筛选展示下方的数字人。 数字人列表 默认展示全量数字人。单击数字人形象,自动替换更新至视频草稿的所有场景中。
关键词搜索框,可输入数字人名称进行精准搜索。 示例:云岚。 刷新图标。如果有关键词,按照关键词进行刷新展示;如果没有关键词,恢复为默认展示。 筛选条件 支持通过角色、性别、姿势、行业、区域和分辨率的维度,筛选展示下方的数字人。 数字人列表 默认展示全量数字人。单击数字人形象,自动替换至智能交互预览界面中。
产品介绍 什么是数字内容生产线 功能特性 产品优势 使用限制 计费说明 03 API 数字内容生产线服务提供了丰富的API和调用示例,您可以通过API实现分身数字人资产管理、视频制作、视频直播、智能交互等功能。 API文档 API概览 API接口 04 SDK 数字内容生产线服务提
端的音频,实时驱动数字人进行直播。 PLAY_END:退出直播任务状态。 RTSA Command定义 RTC User Render用户通过COMMAND通道发送服务端状态通知。 代码示例如下所示: { "message_type" : "state_notify", "state"
用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。
形成全社会共同参与的良好氛围。 利用现代科技手段,如GIS(地理信息系统)、无人机监测等,对西湖的自然环境和文化遗产进行实时监控和分析。 通过教育和推广活动,让更多的人了解西湖的价值,培养青少年对传统文化的兴趣和保护意识。 总结 杭州西湖,以其独特的自然风光、深厚的文化底蕴和现代
"00f1c200389e434485260777a2ad57bc", } } 用户发送结束对话的消息 文本驱动数字人讲话过程中,支持通过STOP_CHAT命令停止对话。对话停止后,数字人将停止说话,并不会再发送下一次对话的START_CHAT消息。 详细交互流程如下所示: 用户发送停止对话消息。
<word></word>标签用于设置选中文字为连读模式。 MetaStudio包含多种TTS音色,每种音色支持的SSML标签能力是有差异的,请通过“查询资产详情”接口,获取每个音色支持使用的标签。 speak标签 描述 <speak></speak>:SSML文本的根节点。 语法 1