检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
获取TTS租户级自定义读法配置 功能介绍 该接口用于获取TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/ttsc/vocabulary-configs 表1 路径参数 参数 是否必选 参数类型 描述 project_id
查询用户配置的个性化音频时长 功能介绍 查询用户配置的个性化音频时长 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/tenant-duration-cfg 表1 路径参数 参数 是否必选 参数类型
修改TTS租户级自定义读法配置 功能介绍 该接口用于修改TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/ttsc/vocabulary-configs/{vocabulary_id} 表1 路径参数 参数 是否必选
视频直播公共配置 视频直播界面支持添加角色、背景、贴图、视频、商品、文本等视频直播素材。本节提供各类素材的详细操作过程。 角色 角色界面详情,如图1所示。 图1 角色界面 角色界面说明,如表1所示。 表1 界面元素说明 界面元素 说明 定制数字人 单击“定制数字人”,跳转至形象制
选择AI模型。不同模型需要配置的参数数量不同,其中,高阶模型需要配置的参数最多。 包含如下选项: 初阶模型 中阶模型 高阶模型 多轮对话 是否开启多轮会话。 如果开启,会根据上下文的信息进行语义理解,以生成连贯的对话。 业务ID 仅特殊定制的业务模型需要配置。 所在城市 智能交互面向的城市。
智能交互限制 智能交互对硬件设备的最低配置要求,如表1所示。 表1 硬件设备要求 硬盘配置 最低配置 CPU i5及以上版本。 内存 8G以上。 硬盘 128G及以上。 操作系统 Windows或Android系统。 麦克风 需要有麦克风,且要保障1米以内的拾音效果。 扬声器 需要有扬声器。
这里设置的多音字,仅对当前视频草稿有效,如需全局生效,可参考配置特殊词表配置。 别名 选中需要通过别名播报的文本内容 ,单击“别名”,设置为实际播报的内容。 须知: 这里设置的别名,仅对当前视频草稿有效,如需全局生效,可参考配置特殊词表配置。 数字英文 示例数字“1024”的读法如下所示:
常见问题 智能交互SDK安装包里为什么有图片资源? SDK里面包含图片资源,是因为智能交互的动效、背景可能需要图片资源才能展示更好的效果。所以智能交互Web SDK为了方便用户集成使用,会同时包含UI相关资源。 speechRecognized和semanticRecognized通知的流式返回有什么差异?
应用创建成功,自动进入新增应用的“应用配置”页面。 配置应用 在界面上方的主菜单中,单击“我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 图3 应用配置页面 配置“自然语言模型”,保持默认值“AIUI通用语义模型”。 单击“管理技能配置”,弹出“配置应用需要的技能”对话框,如图4所示。
如图8所示。 图8 构建发布 配置应用 在界面上方的主菜单中,单击“我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 图9 应用配置页面 配置“自然语言模型”,从下拉框中选择“星火交互认知大模型”。 单击“管理技能配置”,弹出“配置应用需要的技能”对话框,如图10所示。
视频直播限制 分身数字人直播限制,如下所示: 直播间配置约束 直播任务退出说明 直播播放说明 直播内容审核说明 直播间配置约束 直播间配置限制,如表1所示。 表1 直播间限制 直播间配置 限制 文本驱动 每个单场景中所有段落输入文字的总量需大于200字。 每个段落的文本字符数量需
全部启用:可以直接“全部启用”所有规则。 :设置单规则使用的场景。 :启用或关闭当前规则。 :删除规则。 单击界面右侧的“直播配置”页签,如图10所示。 直播配置说明,如表2所示。 图10 我的视频 表2 直播配置 区域 参数 说明 开播设置 选择开播方式(二选一) 请根据实际情况,选择一种开播方式,并按照界面提示进行操作。
单击界面右上方的“添加凭证”,弹出“购买序列号”对话框,如图11所示。 参数配置说明,如表1所示。 图11 购买序列号 表1 参数说明 参数 说明 主体 购买出门问问声音套餐中购买套餐包的归属主体,从下拉框中选择“出门问问”。 访问配置accessKey 出门问问需要配置为资源详情界面的“用户账号”,如获取第三方声音使用凭证-步骤2所示。
配置特殊词表 支持全局设置多音字或者别名,设置完成后,所有视频草稿自动生效。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“声音”页签,单击界面右侧的“特殊词表”,进入如图1所示的界面。 图1 特殊词表 单击“新建词表”,界面新增一行特殊词,如图2所示。
操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“照片数字人”,进入照片数字人制作页面,如图1所示。 界面左侧展示配置项,右侧展示预览效果。配置操作,请参考表1。 图1 照片数字人制作页面 表1 界面操作说明 区域 参数 说明 01 请上传您的照片 人像照片 单击“查看
接口,实现智能交互能力。 这里配置的是MetaStudio服务调用第三方语言模型的API地址。 流式响应 MetaStudio智能交互服务提供流式问答(响应更快)和非流式问答两种方式,第三方语言模型可以选择其中一种响应方式。 多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。
服务提供了名片模板,用户可以基于模板制作名片。 图1 选择名片模板 选择一款名片模板,单击“开始制作”,进入名片制作页面,如图2所示。 界面左侧为名片配置内容,右侧为名片预览效果图。参数配置说明如表1所示。 图2 制作名片 表1 参数说明 区域 参数 说明 请填写数字人信息 上传头像 需提前准备一张正面清晰且
询问是否可以使用您的麦克风或摄像头,允许使用即可。 Mac系统的浏览器 在Mac程序坞中,单击“系统偏好设置”图标,打开“系统偏好设置”界面。 单击“安全性与隐私”图标,如图1所示。进入“安全性与隐私”界面。 图1 系统偏好设置 选择“隐私”页签。在左侧目录树中,单击“麦克风”,如图2所示。
视频素材区域 设置视频的场景,包括如下内容。视频素材的操作详情,请参考视频制作公共配置。 模板:系统预置视频模板列表。支持基于系统预置模板,一键快速制作数字人视频。 注意:只有管理员可以自定义新增模板。 角色:自动展示系统预置的分身数字人列表,用户可以直接使用已有的数字人去创作生成视频。如果
如表1所示,包括了MetaStudio的所有系统策略。 表1 MetaStudio系统权限 策略名称 描述 策略类别 策略内容 MetaStudio FullAccess MetaStudio管理员权限,拥有该权限的用户可以拥有MetaStudio支持的全部权限。 系统策略 MetaStudio FullAccess策略内容