检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ig object 对话字幕配置 video_config SmartChatVideoConfig object 视频输出配置。 voice_config_list Array of SmartChatVoiceConfig objects 语音配置参数列表。 chat_video_type
第十四次正式发布 本次变更如下: 语音合成管理接口组,新增接口:设置TTS租户级自定义读法配置、获取TTS租户级自定义读法配置、删除TTS租户级自定义读法配置、修改TTS租户级自定义读法配置。 2024-12-05 第十三次正式发布 本次变更如下: 新增接口组:分身数字人字幕文件生成管理。
在左侧导航栏中,选择“我的创作”。 选择“智能交互 > 技能管理”,如图1所示。 图1 智能交互页面 单击右上方的“创建技能”,弹出“创建技能”对话框,如图2所示。 参数配置说明,如表1表1所示。 支持用户最多创建100个技能。 图2 创建技能 表1 创建技能 参数 说明 技能名称 技能名称,必须与科大讯飞创建
这里设置的多音字,仅对当前视频制作剧本有效,如需全局生效,可参考配置特殊词表配置。 别名 选中需要通过别名播报的文本内容 ,单击“别名”,设置为实际播报的内容。 须知: 这里设置的别名,仅对当前视频制作剧本有效,如需全局生效,可参考配置特殊词表配置。 数字英文 示例数字“1024”的读法如下所示:
10次/秒 10次/秒 设置TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 获取TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 删除TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 修改TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 3D数字人风格管理
ig object 对话字幕配置 video_config SmartChatVideoConfig object 视频输出配置。 voice_config_list Array of SmartChatVoiceConfig objects 语音配置参数列表。 chat_state
制作页面。 界面左侧是声音制作页面,右侧为声音制作流程。声音制作录制教程,可以帮助用户快速制作声音。 图1 定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 MetaStudio提供下述声音制作方式: 基础
//IAM用户名 "password": $ADMIN_PASS, //IAM用户密码,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全 "domain": {
设置TTS租户级自定义读法配置 GET /v1/{project_id}/ttsc/vocabulary-configs 获取TTS租户级自定义读法配置 DELETE /v1/{project_id}/ttsc/vocabulary-configs 删除TTS租户级自定义读法配置 PUT /v
制作页面。 选择“第三方模型”页签的“出门问问声音制作”方式。 界面左侧是声音制作页面,右侧为声音制作流程,如图1所示。 图1 定制声音 配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 选择“出门问问声音制作”。音频时长为0.5~18
其中“X-Subject-Token”就是需要获取的用户Token。有了Token之后,您就可以使用Token认证调用其他API。 建议在配置文件或者环境变量中密文存放,使用时解密,确保安全。 图1 管理员创建IAM用户响应消息头 响应消息体(可选) 该部分可选。响应消息体通常以
IAM权限管理 创建用户并授权使用MetaStudio 子账户隔离配置
直播商品管理 创建商品 查询商品列表 更新商品 查询商品详情 删除商品 商品资产组合配置 父主题: 分身视频直播
视频直播 视频直播界面说明 视频直播 互动管理 商品管理 直播任务管理 智能交互设置 视频直播公共配置
智能交互数字人热词记录管理 创建热词记录 查询热词记录列表 查询配置热词记录详情 修改热词记录 删除热词记录 修改热词功能开关 查询热词功能开关 父主题: 智能交互管理
创建智能交互数字人(科大讯飞) 创建智能交互数字人(奇妙问) 创建智能交互数字人(第三方语言模型) 创建智能交互数字人(二次开发场景) 智能交互公共配置
操作前提 注册操作 注册华为账号:单击进入注册页面。 完成实名认证:单击进入实名认证。 账户充值:为确保正常使用MetaStudio,您需要进行账户充值。 开通MetaStudio服务:单击进入MetaStudio控制台,根据开通引导完成服务开通。 推荐浏览器 推荐使用Chrom
声音制作任务管理 查询用户配置的个性化音频时长 创建基础版语音训练任务 创建进阶版语音训练任务 创建高级版语音训练任务 查询语音训练任务列表 提交语音训练任务 查询语音训练任务详情 删除语音训练任务 查询任务操作日志 获取语音文件上传地址 获取语音训练任务审核结果 设置任务批次 确认在线录音结果
不同资产类型主文件格式与大小约束如下 视频资产:资产类型为VIDEO,主文件格式(忽略大小写)为mp4、m4v、mkv、mov、flv、3gp、wmv、avi、webm,主文件大小不超过5G 图片资产:资产类型为IMAGE,主文件格式(忽略大小写)为jpeg、jpg、png、bmp、gif,主文件大小不超过50M
xxxxxxx6526" } 响应示例 状态码:200 处理成功返回。 { "url" : "https://x.x.x.x/icswebclient?robot_id=4d54xxxxxxc446249xxxxxxxxxx6526" } 状态码:400 请求传参异常,包含错误码及对应描述。