检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
录音环境 录音文案 基础版 优先使用专业录音设备录制音频,推荐使用Adobe Audition软件进行录音。 如果不具备专业录音设备,可使用手机录制音频,详情请参见手机录制音频。 录音环境安静,无回音、混响、噪声,避免出现汽车鸣笛、他人说话、走动等杂声。 可使用“分贝仪”应用来测试录音环境的底噪,建议底噪低于0dB。
静音时长超过500ms,会结束语音识别。建议该值大于500ms。 委托语言交互服务(SIS) 如需使用热词功能,请开启委托授权。SIS服务用于将用户口述音频转换为文本。 热词 仅开启“委托语言交互服务(SIS)”后,才会展示“热词”配置。 数字人与用户进行智能交互对话时,语音识别
所有问答对录入完成后,单击“导出”,将技能文件下载至本地,待后续使用。 也可以使用下述方式,导出技能文件。 所有问答录入完成后,单击左上方的“返回”,回到“智能交互 > 技能管理”页面。 单击技能右侧的“导出”,如图5所示。 将技能文件下载至本地,待后续使用。 图5 导出技能 在科大讯飞创建同名技能并导入技能文件
用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。
创建应用 参数 说明 第三方应用 配置说明如下所示: 如果科大讯飞AIUI开放平台应用使用AIUI通用语义模型,则从下拉框中选择“科大讯飞AIUI通用语义模型”。 如果科大讯飞AIUI开放平台应用应用使用星火大模型,则从下拉框中选择“科大讯飞星火交互认知大模型”。 应用名称 与AIUI开放平台应用的“应用名称”保持一致。
支持创建文档问答库。非必须创建,可根据实际情况选择使用。 MetaStudio服务目前仅支持读取docx(包含图文)、txt和md格式,其他格式暂不支持。 docx格式说明:可以没有标题和分级标题, 如需添加标题和分级标题,请使用word标准格式,如图1和图2所示。 txt格式说
请求requestId,用来标识一路请求,用于问题跟踪定位,建议使用uuId,若不携带,则后台自动生成 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。
和私有访问密钥一起使用,对请求进行加密签名。 SK(Secret Access Key):私有访问密钥。与访问密钥ID结合使用,对请求进行加密签名,可标识发送方,并防止请求被修改。 使用AK/SK认证时,您可以基于签名算法使用AK/SK对请求进行签名,也可以使用专门的签名SDK对
数字内容生产线的计费价格调整公告 随着数字人业务的发展,数字人市场已发生变化。华为云数字内容生产线为更好的提供服务,将从2024年9月27日起,对中国大陆分身数字人形象制作、声音制作进阶版、视频制作的按需计费及按需预付费套餐包,进行统一调价。调整后的价格如表1所示。 表1 中国大陆价格调整详情
配置对话机器人服务CBS 在对话机器人服务配置问答机器人。MetaStudio创建对话时,如果“第三方应用”需要选择“华为云CBS”时,才需要执行本节操作,详情请参考表1。 操作步骤 登录MetaStudio控制台。 单击界面左上角的图标,在弹出的浮动框中,搜索“对话机器人服务 CBS”。
单击WebSDK界面自带的“开始对话”按钮。 使用Web语音唤醒能力唤醒数字人时。 【回调参数】 无。 enterSleep 【事件说明】 数字人自动休眠事件。 【回调参数】 无。 jobInfoChange 【事件说明】 变更交互任务信息的事件。交互任务状态发生变化时,会通知使用方。如果交互任务就绪,
创建应用:在科大讯飞的AIUI开放平台创建应用。 配置应用:应用需要使用AIUI通用语义模型,并启用创建技能中已创建的技能。 查看应用信息:在MetaStudio服务创建“科大讯飞AIUI通用语义模型”智能交互对话项目时,需要使用这里的应用信息,包括:应用名称、APPID、APPKEY和APISECRET。
台查看已分配的资源列表,正常使用MetaStudio服务并消耗相应的资源。 前提条件 SP用户已关联当前租户,操作请参考关联租户。 SP用户已分配资源给当前租户,操作请参考分配资源。 操作步骤 租户登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线
视频制作界面说明 用户启动制作视频时,可以先了解下视频制作界面详情。 视频制作界面如图1所示。各区域详细说明,如表1所示。 用户使用数字人形象创作的视频,都会自动保存在MetaStudio控制台首页“最近项目”区域的“视频项目”页签中。用户可以根据实际情况,进行二次创作。 图1 视频制作界面
也可以复制数字人互动页面的网址,分享给其他用户使用。 获取数字人互动页面URL的方式还有:进入“我的创作 > 智能交互 > 对话项目”页面,单击智能交互对话项目右侧的“复制URL和激活码”,可以将URL和激活码分享给其他用户使用。 详细操作如下所示: 复制URL至浏览器中,进入“智能交互激活”页面。
用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。
ID对应Region保持一致。 操作步骤 使用SP用户登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线 MetaStudio”服务,进入MetaStudio服务概览页面,如图1所示。 图1 服务概览页面 在左侧导航栏中,选择“租户管理”,进入“租户列表”页面。
MetaStudio的使用权限,但是不希望他们拥有删除MetaStudio等高危操作的权限,那么您可以使用IAM为开发人员创建用户,通过授予仅能使用MetaStudio,但是不允许删除MetaStudio的权限策略,控制他们对MetaStudio资源的使用范围。 如果账号已经能满
直接上传,无需压缩,无需携带文案txt文件。 如果未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景。 请选择声音性别 声音的性别,用于匹配声音模型的精准度。 如下所示: 男生 女生 请选择原始输入语言 上传语料所使用的语言。 包含19种语言:中文、英文、粤语、德语、法语
智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交互服务定义的API接口结构,自主开发第三方语言模型API,对接第三方语言模型到智能交互服务,实现智能交互能力。操作请参考创建智能交互数字人(第三方语言模型)。 场景三:用户使用智能交互API或SDK,自主开发实现与数字人对话场景。