检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
批量修改知识库问法 功能介绍 该接口用于批量修改知识库问法。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/digital-human-chat/knowledge/question-batch 表1 路径参数 参数 是否必选 参数类型 描述
单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作: 单击商品所在行的“查看”,进入商品详情界面,支持单击“编辑”,修改商品信息。 单击商品所在行的“编辑”,进入商品修改页面,修改商品信息后,单击“保存”。 单击商品所在行的“删除”,删除当前商品。 新增互动库
统计时间段内过期的资源数量 功能介绍 统计指定时间段内即将过期的包周期与一次性资源数量。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/tenants/resources-count 表1 路径参数 参数 是否必选 参数类型 描述 project_id
租户执行分身数字人模型训练任务命令 功能介绍 该接口用于租户执行分身数字人模型训练任务命令,如提交训练审核等。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-training-manage/user/jobs/{job_id}/command
speakingStop 数字人结束讲话事件。 speechRecognized ASR对提问进行语音识别后输出为文本的事件。 semanticRecognized LLM对提问进行语义识别后输出回复文本的事件。speechRecognized和semanticRecognize
用户可以使用SP账号购买资源包。对SP账号开放购买的资源包,普通用户不可见。 所有资源的购买操作均相同,下面以“分身数字人形象制作”为例,进行操作演示。 前提条件 当前用户已拥有SP账号。 操作步骤 使用SP用户登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线
手机录制音频 请根据手机类型,执行相应操作: 苹果手机操作 安卓手机 苹果手机操作 苹果手机推荐下载软件“简易录音机(Easy Voice Recorder)”进行录音,如图1所示。 图1 简易录音机 音频录制说明,如表1所示。 表1 音频录制说明 音频录制 说明 采样率 推荐使用48kHz采样率录制音频。
分身数字人声音制作基础版 分身数字人声音制作进阶版 分身数字人声音制作高级版 一次性计费 分身数字人视频直播 按需计费 包年/包月 分身数字人视频直播行业版 按需计费 包年/包月 照片数字人视频制作 按需计费 按需套餐包 分身数字人名片制作 按需计费 按需套餐包 操作步骤 使用SP用户登录华
提交语音训练任务 功能介绍 提交训练任务,执行该接口后,任务会进入审核状态,审核完成后会等待训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/jobs/{job_id} 表1 路径参数
MetaStudio语音驱动采用语音合成标记语言(SSML,Speech Synthesis Markup Language)来控制数字人的行为,包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。MetaStudio在此基础上,扩展了一些字段用于实现数字人的控制。
基于图片URL创建照片建模任务 功能介绍 该接口用于从URL中获取图片进行照片建模任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human/stylized/picture-modelings-by-url 表1 路径参数
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。
任务分身数字人训练耗时约3小时,请耐心等待。 单击任务所在行的“查看详情”,进入“定制任务详情”页面。 查看分身数字人定制任务审核进展。系统会自动审核任务,并提交训练任务。 等待Flexus分身数字人训练完成后,单击任务行右侧的“更多 > 查看详情”,再次进入“定制任务详情”页面。
详细操作为:单击“声音合成”卡片中的“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。 如需使用第三方声音进行语音合成,请购买出门问问声音套餐,操作请参考《用户指南》的“购买出门问问声音套餐”章节。 调用方法 请参见如何调用API。 URI POST
俗话说得好:读万卷书,不如行万里路。 “课本游”作为一种旅游新模式,不仅能丰富旅游内涵、提高旅游质量; 更能让孩子切身实地的感受到学习与实践的知行合一,提高学习兴趣与效率, 同时也能在他们心里埋下一颗文化传承的种子, 有助于我国优秀传统文化的弘扬与传播。 黑猩猩是与人类一样能够直立行走的动物,
中国正在加快高速公路的建设和升级,让出行更加方便。 政府努力维护高速公路,推广电子不停车收费系统,提高出行效率。 同时,加大对高速公路安全管理和规范运营的力度,确保道路安全。 城市化进程加快,城市交通拥堵问题也越来越严重。 政府采取了多项措施来缓解交通拥堵,包括推广公共交通、限制机动车行驶和提高道路交通规划建设水平等。
智能交互第三方LLM回调接口 功能介绍 MetaStudio智能交互服务支持开发者自定义数字人大脑(即第三方LLM)。当用户与数字人对话时,将触发调用该接口,由该接口返回问题对应的答案文本内容。 签名计算方法 第三方LLM自定义接口,使用HMACSHA256签名模式,需要在URL
开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。开通后的效果如图1所示。 如需使用第三方声音进行语音合成,请购买出门问问声音套餐。 图1 声音合成 功能介绍 该接口用于TTS流式合成音频,用于文本转化为语音,并实时返回合成的音频数据。 调用方法
定义新增分身数字人,背景、PPT、贴图、视频和音乐还可以从本地导入使用。 从视频素材区域添加到画布区域中的PPT、贴图、视频和数字人支持进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。 可以单击画布区域上方的图标,切换视频画面比例为横屏“16:9”或竖屏“9:16”。
技能管理”页面。 单击技能右侧的“导出”,如图6所示。 将技能文件下载至本地,待后续使用。 图6 导出技能 在科大讯飞创建同名技能后,导入技能文件 执行本操作前,需要在科大讯飞平台完成账号注册操作。 访问科大讯飞的AIUI开放平台。 单击界面上方的“技能工作室”。进入“技能控制台”页面,如图7所示。