检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
支持持物直播、实景直播、弹幕智能互动、真人随时接管,让数字人直播更真实、更沉浸。 支持数字人直播矩阵式管理,高级策略配置管理直播更灵活。 实时智能交互,提升客户满意度和品牌形象 开放的Web SDK及API可快速集成到第三方业务系统,实现AI数字员工问答、服务、陪练等场景任务。 1.5秒超低时延交互 实时驱动极低延时,保障用户真实体验。
的SDK代码,如图1 获取SDK代码示例所示。 图1 获取SDK代码示例 SDK列表 目前MetaStudio提供了Java、Python和Go语言SDK供开发者使用,如表1所示。您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。 SDK已知安全漏洞及修复版
视频制作 使用数字人形象,设置画布、音频,合成视频。 适用于各类培训、宣讲、知识分享等场景。 视频直播 使用数字人形象,设置画布、剧本、互动和开播配置,生成直播视频。 可在合作的第三方平台进行数字人视频直播,如淘宝、拼多多、抖音等。 智能交互 包含下述功能实现场景: 支持开箱即用的智能交互数字人。
1小时以上,建议1小时。 每种声音制作方式后面都会展示剩余次数,需要保证剩余次数充足。录制过程中,每句之间有2~3秒的停顿。 其中,进阶版和高品质声音制作需要更多语料,训练时长更长,声音效果更佳。 请完善声音信息 输入声音名称。 示例:欢快女声。 请选择声音性别 声音的性别,如下所示:
这个麻辣香锅是我吃过所有香锅中最让我惊艳的。 今天给大家准备了两种不同口味,有酱香味的和麻辣味的。 想吃麻辣香锅但又不太能吃辣的宝宝们有口福了。 不能吃辣的宝宝,等会下单的时候选酱香口味。 辣的和不辣的都想尝试的宝宝可以分别选择哈,喜欢哪个就选哪个。 他家麻辣香锅的特点就是: 第一、麻辣鲜香,香而不咸
这里配置的是MetaStudio服务调用第三方语言模型的API地址。 流式响应 MetaStudio智能交互服务提供流式问答(响应更快)和非流式问答两种方式,第三方语言模型可以选择其中一种响应方式。 多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。
rar下载至本地。 下载过程大约耗时3~5分钟,请耐心等待。 如果用户需要自定义工具,可以获取其源码。 本地解压工具包,得到ffmpeg目录和运行文件webm2mov.exe。 双击webm2mov.exe,弹出如图1所示的界面。 图1 工具运行界面 单击“选择webm文件”,选择WEBM格式的视频。
“产品分类”中高亮展示的是SP用户可购买的资源包类型,置灰展示的是未对SP用户开放的资源包类型。 图2 购买页面 SP用户根据实际情况,选择需要的服务类型、产品分类、计费模式和购买数量,单击“加入清单”,依次添加至右侧的“购买清单”中。 待购买清单全部添加完成后,单击“确认订单”,进入“规格详情”页面,如图3所示。
单击“分身形象制作”下方的“开始创建”,进入分身形象制作页面。 界面左侧是定制分身数字人的数据上传界面。 界面右侧上方,展示分身数字人定制流程。下方展示训练视频拍摄指导和样例视频,包括:拍摄前准备、拍摄中操作和拍摄后处理,有效指导用户拍摄生成一段完整可用的训练视频,用于训练生成分身数字人。 图1 定制数字人形象
妙问)。 开发者自己提供LLM或者大模型,调用智能交互的文本驱动数字人能力。智能交互服务不感知用户自己的LLM或者大模型,只提供API接口和Web SDK。操作请参考创建智能交互数字人(二次开发场景)。 父主题: 智能交互
操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。 图1 MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。 单击左侧导航栏中的“应用”,如图2所示,请参考表1进行配置。 配置完成后,还需执行下述操作,对应的操作流程图,如图3所示。 下载并集成智能交互Web
获取项目ID的接口为“GET https://{Endpoint}/v3/projects/”,其中{Endpoint}为IAM的终端节点可以从地区和终端节点获取。接口的认证鉴权请参见认证鉴权。 响应示例如下,其中projects下的“id”即为项目ID。 { "projects":
所示。 输入如下参数的值: 技能名称:技能名称。必须与科大讯飞创建的技能一一对应,如在科大讯飞创建同名技能后,导入技能文件所示。为方便识别和记忆,两边的技能名称可以设置成一样的。 技能标识:技能标识。必须与科大讯飞创建的技能标识,保持一致,如在科大讯飞创建同名技能后,导入技能文件
表示用于传输请求的协议,当前所有API均采用HTTPS协议。 Endpoint 指定承载REST服务端点的服务器域名或IP,不同服务不同区域的Endpoint不同,您可以从地区和终端节点获取。 例如IAM服务在“华北-北京四”区域的Endpoint为“iam.cn-north-4.myhuaweicloud.com”。
需要图片资源才能展示更好的效果。所以智能交互Web SDK为了方便用户集成使用,会同时包含UI相关资源。 speechRecognized和semanticRecognized通知的流式返回有什么差异? 差异如下所示: speechRecognized的流式返回是覆盖式返回。后一
MOV、FLV、3GP、WMV和AVI。 说明: 在直播间制作界面,如果添加视频,且视频格式为FLV、3GP、WMV、AVI时,无法展示视频播放效果,仅能图片展示。这是浏览器不兼容导致的,但是不影响直播效果。直播过程中,这些插入的视频可以正常播放和展示。 视频要求如下所示: 分辨率最大支持1080P。
务适配的功能。 产品介绍 什么是数字内容生产线 功能特性 产品优势 使用限制 计费说明 03 API 数字内容生产线服务提供了丰富的API和调用示例,您可以通过API实现分身数字人资产管理、视频制作、视频直播、智能交互等功能。 API文档 API概览 API接口 04 SDK 数
操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。 图1 MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。 单击左侧导航栏中的“应用”,如图2所示。 参数配置说明如表1所示。 图2 创建应用 表1 创建应用 参数 说明 第三方应用 从下拉框中选择“奇妙问”。
k time="停顿时长"/>。time的单位为毫秒,最小值为200毫秒。 <phoneme>:多音字标签,可指定单个汉字的读音。标签起始和结束中间只能有1个汉字。属性可取值为汉语拼音,声调用1、2、3、4来表示。用法为:<phoneme ph="拼音"/>字</phoneme>。
00020006 token和path中的projectId不匹配 token和path中的projectId不匹配 请检查使用的token和接口调用中的projectId是否为同一个用户项目 403 MSS.00020009 无效参数 非法参数 请检查接口文档和接口参数 403 MSS