检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何获取项目ID? 登录管理控制台。 鼠标悬停在右上角的用户名,选择下拉列表中“我的凭证”。 图1 管理控制台 在“API凭证”页面的项目列表中查看项目ID。 图2 获取项目ID 父主题: API和SDK使用
0-7200 root Array of floats root 3维坐标。 joints Array of floats 75个关节点,四元数。 eyes Array of floats 眼动数据 状态码: 400 表8 响应Body参数 参数 参数类型 描述 error_code
文档中心。 创建应用:在科大讯飞的AIUI开放平台创建应用。 配置应用:应用需要使用AIUI通用语义模型,并启用创建技能中已创建的技能。 查看应用信息:在MetaStudio服务创建“科大讯飞AIUI通用语义模型”智能交互对话项目时,需要使用这里的应用信息,包括:应用名称、APP
开启:各IAM子账户在开启之前上传或制作的资产,在开启之后均无法查看和使用。开启之后上传和制作的资产,各自独立管理和使用。 须知: 无论开启或关闭IAM子账户隔离能力,下述能力不发生变化: 所有IAM子账户的已购资源,始终共享使用。 华为云账号始终可以查看和使用所有IAM子账户的所有资源和资产。 父主题:
风格参考 voice_capability 否 VoiceCapability object 音色资产支持的能力集。 说明: 音色能力集只允许查询,不允许设置 external_voice_meta 否 ExternalVoiceAssetMeta object 第三方TTS音色元数据。
forms 查询直播平台列表 GET /v1/{project_id}/live-platforms/platforms/{platform_id} 查询第三方直播平台信息 GET /v1/{project_id}/live-platforms/products 查询第三方直播平台商品列表
导出为:输入导出文件的名称。 画质增强:开启后将提升视频清晰度,合成时间相应变长。请根据实际情况确定是否开启。 单击“确定”,弹出“视频制作任务中心”对话框。 可查看视频合成任务的进度,直至合成成功。 单击“合成成功”状态右侧的图标,进入视频详情页面,如图3所示。 单击“预览”,可以看到合成的视频。预览过程中,可全屏播放,或下载视频到本地。
MetaStudio有哪些计费项? 如何购买第三方音色? 第三方声音AK/SK如何填写? 购买语音包后试听一直转圈圈是为什么? 多语言的计费规则? 如何查看已购声音套餐明细? 分身形象或声音制作的不好,可以使用原有资源重新制作吗? 形象制作和声音制作支持退订吗? 制作好数字人后,可以不购买路数进行直播吗?
对提供的答案去答复。 图1 标题 图2 分级标题 配置应用:应用先开启“星火大模型”,再开启文档问答库,然后启用创建技能中已创建的技能。 查看应用信息:在MetaStudio服务创建“科大讯飞星火交互认知大模型”智能交互对话项目时,需要使用这里的应用信息,包括:应用名称、APPID、APPKEY和APISECRET。
直播剧本中的素材已被删除。需要在“我的创作 > 回收站”界面,找到素材并恢复。 直播剧本中的素材可能涉及敏感内容,在“我的创作 > 资源 > 已冻结”界面,查看已冻结的资产。如需解冻,需要提交工单申请人工复审。 父主题: 视频直播
预置音色ID列表 系统预置自研音色ID列表,如表1所示。 表1 预置音色ID列表 音色名称(中文) 资产ID(华东-上海一) 资产ID(华北-北京四) 音色名称(英文) 资产ID(亚太-新加坡) 云歌 075494c45b5aef529d55cd2a456e6076 0a4b54
智能交互第三方LLM回调接口 功能介绍 MetaStudio智能交互服务支持开发者自定义数字人大脑(即第三方LLM)。当用户与数字人对话时,将触发调用该接口,由该接口返回问题对应的答案文本内容。 签名计算方法 第三方LLM自定义接口,使用HMACSHA256签名模式,需要在URL
高品质 制作声音模型 准备好音频文件后,就可以上传至MetaStudio控制台,进行声音训练。详细操作如下所示: 创建声音制作任务(自研模型) 查看声音 声音模型制作耗时,如下所示: 基础版:约1~3个工作日。 进阶版:约1~3个工作日。 高品质:约5个工作日。 自定义声音应用方式,如下所示:
下载SDK安装包 表1 SDK下载 SDK名称 SDK包 开发者 个人信息处理规则 合规使用指南 HwICSUiSDK 参见表2下载链接 华为云计算技术有限公司 SDK如何处理个人信息请参见SDK隐私声明 您集成和使用我们的SDK时需要遵从个人信息保护基本要求,详情请参见SDK合规使用指南。
音色资产ID,可以从资产库中查询。 introduction_audio_asset_id 否 String 自我介绍语音资产ID,用于驱动数字人口型。 说明: 介绍语音需要作为asset_type=AUDIO资产先上传至资产库。 使用时从资产库中查询。 video_asset_name
需要修改为一致后再直播。 图2 桌面音频属性设置 检查Windows系统的声音输出设备 在Windows系统的系统设置中,找到声音设置,查看输出设备,示例如图3所示。 图3 声音输出设备 父主题: 视频直播
系统资产标签定义 查询资产列表接口支持使用“tags”标签对分身数字人模型进行分类。 “tags”取值及其含义,如表1所示。 表1 tags标签说明 tags取值类型 说明 数字人类型 取值如下: VIRTUAL_AVATARS:分身数字人 VIRTUAL_HUMANS:虚拟数字人
9d9af9e0f743"/>,非常高兴给大家介绍MetaStudio。</speak> insert-action id通过查询资产列表接口获取,查询时asset_type=ANIMATION 多音字标签:<phoneme ph="拼音">汉字</phoneme>,南京<phoneme
VoiceConfig 参数 是否必选 参数类型 描述 voice_asset_id 是 String 参数解释: 音色资产ID,可以从资产库中查询。 音色ID的查询操作,详见查询预置音色ID。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 speed 否 Integer
选择“未激活”页签,单击已接收资产卡片中的“激活”,在弹出的“提示”对话框中,单击“确认”。 界面提示“资产已激活”,说明资产已激活成功。用户可以在“已激活”页签中查看已激活的分身模型资产。 图4 激活资产 完成上述操作后,声音和分身模型资产已经在当前账号下生效,用户可以使用已激活的资产进行视频制作或视频直播。