检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建视频驱动任务 功能介绍 该接口用于创建视频驱动任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/video-motion-capture-jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
次数,从前往后依次命中答复,每次仅回复一条文本内容。 示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复
/v1/{project_id}/digital-human-chat/knowledge/intent-question 创建知识库意图和问法 智能交互数字人知识库问法管理 表18 智能交互数字人知识库问法管理接口 接口 说明 POST /v1/{project_id}/dig
查看角色信息:查看奇妙问创建的角色ID和角色密钥,即MetaStudio平台API调用所需的RoleId和AppSecret。 前提条件 使用奇妙问前,需提交工单申请使用手机号注册账号。 创建角色 访问奇妙问,输入有效手机号和验证码,或者通过密码方式登录。 图1 奇妙问 单击“登录”,进入奇妙问“创建角色”页面,如图2所示。
支持持物直播、实景直播、弹幕智能互动、真人随时接管,让数字人直播更真实、更沉浸。 支持数字人直播矩阵式管理,高级策略配置管理直播更灵活。 实时智能交互,提升客户满意度和品牌形象 开放的Web SDK及API可快速集成到第三方业务系统,实现AI数字员工问答、服务、陪练等场景任务。 1.5秒超低时延交互 实时驱动极低延时,保障用户真实体验。
查询视频驱动任务详情 功能介绍 该接口用于查询视频驱动任务详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/video-motion-capture-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
查询视频驱动任务列表 功能介绍 该接口用于查询视频驱动任务列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/video-motion-capture-jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
高品质:整段录制生成一个WAV或MP3格式音频,总时长1小时以上,建议1小时。 原声录制音频和其对应生成的音色播报示例,如客户声音制作案例所示。 录音准备 表1 录音准备 声音类型 录制设备和软件 录音环境 录音文案 基础版 优先使用专业录音设备录制音频,推荐使用Adobe Audition软件进行录音。
在接下来的直播中,我们将详细介绍万兴播爆和万兴喵影的强大功能和用法,以及如何在职场中充分发挥它们的价值。 我们会分享一些实用的技巧和窍门,帮助你更好地利用这些工具提升工作效率,减轻职场压力。 在直播过程中,如果大家有任何问题或疑虑,也都可以随时提出,我和小助手看到了也会尽力为大家解答。
智能交互驱动流程 流程图示例 用户与数字人进行智能交互的流程图示例,如下所示,对应流程的详细说明,如流程图总体说明所示。 智能交互非流式驱动流程图,如图1所示。 智能交互流式驱动流程图,如图2所示。 智能交互驱动打断对话流程图,如图3所示。 智能交互驱动停止对话流程图,如图4所示。
选择“使用系统回复”或者“自定义”。如果选择“自定义”,需要输入自定义的回复内容;如果选择“使用系统回复”,均已预置回复内容,不支持编辑和修改。 图12 人设信息配置页面 人设信息设置完成后,单击界面右上方的“构建”。界面提示“构建成功”,说明人设新增完成。 回到“我的应用 >
单击“分身形象制作”下方的“开始创建”,进入分身形象制作页面。 界面左侧是定制分身数字人的数据上传界面。 界面右侧上方,展示分身数字人定制流程。下方展示训练视频拍摄指导和样例视频,包括:拍摄前准备、拍摄中操作和拍摄后处理,有效指导用户拍摄生成一段完整可用的训练视频,用于训练生成分身数字人。 图1 定制数字人形象
在“所有项目”中设置权限,则该权限在所有区域项目中都生效。访问MetaStudio时,需要先切换至授权区域。 权限根据授权精细程度分为角色和策略。 角色:IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该机制以服务为粒度,提供有限的服务相关角色用于授权。由于各服务
虚拟人物,它具有拟人或真人的外貌、行为特点,并具备一定的智能和情感,可以进行交互和表达。数字人也可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。 服务型数字人:利用深度神经网络进行图像合成、高度拟真的虚拟人。
该字段无需填写。 取值范围: 字符长度0-1024位。 默认取值: 不涉及。 dh_id 否 String 参数解释: 数字人ID。对应形象和音色组合。 约束限制: 该字段暂未启用,无需填写。 取值范围: 字符长度0-64位。 默认取值: 不涉及。 model_asset_id 否
Flexus分身数字人制作任务会同时生成一个Flexus形象和一个Flexus声音,所以也需要提供音频。 单独上传语料包:单独录制音频文件,需要单击下方的“点击上传音频文件”,上传音频。 音频格式支持WAV、MP3,单段音频时长1~5分钟,建议1分钟。语料中的语言仅支持中文和英文。 视频中提取声音:直接提取
约束限制: 该字段无需填写。 取值范围: 字符长度0-1024位。 默认取值: 不涉及。 dh_id String 参数解释: 数字人ID。对应形象和音色组合。 约束限制: 该字段暂未启用,无需填写。 取值范围: 字符长度0-64位。 默认取值: 不涉及。 model_asset_id String
所示。 输入如下参数的值: 技能名称:技能名称。必须与科大讯飞创建的技能一一对应,如在科大讯飞创建同名技能后,导入技能文件所示。为方便识别和记忆,两边的技能名称可以设置成一样的。 技能标识:技能标识。必须与科大讯飞创建的技能标识,保持一致,如在科大讯飞创建同名技能后,导入技能文件
URI /v1/{project_id}/digital-human-chat/chat-command/{job_id} 表2、表3和表4是WebSocket建连时携带的参数。 表2 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。
更新智能交互对话信息 功能介绍 该接口用于智能交互对话信息。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/smart-chat-rooms/{room_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String