检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
获取语音训练任务审核结果 20次/秒 10次/秒 10次/秒 设置任务批次 10次/秒 3次/秒 3次/秒 确认在线录音结果 10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件
2024-08-20 第十次正式发布 本次变更如下: 新增接口:查询任务操作日志。 2024-06-01 第九次正式发布 本次变更如下: 新增接口:批量资产操作。 新增接口组:直播商品管理。 2024-05-15 第八次正式发布 本次变更如下: 新增接口组:智能交互数字人知识库技能管理。
文件总的大小,最小1,最大536870912000。 取值范围: 1-536870912000 file_type 是 String 文件类型(默认提取文件后缀)。 asset_id 是 String 资产ID。 asset_file_category 是 String 文件在资产中的分类。每种资产类型包含的文件分类不同。
THIRD_PARTY: 第三方出门问问训练版 THIRD_PARTY_LJZN: 第三方逻辑智能训练版 FLEXUS: Flexus版---用的是大模型特征提取 job_id String 任务id。 app_user_id String 用户id。 voice_name String 音色名称。该名称会作为资产库中音色模型资产名称。
-manage/user/training-segment 确认在线录音结果 GET /v1/{project_id}/voice-training-manage/user/training-segment 获取在线录音确认结果 语音合成管理 表27 语音合成管理接口 接口 说明
开启AM子账户隔离能力后,华为云账号可以在资产归属分配页面,修改所有资产的归属。 注意事项 开启AM子账户隔离能力后,各IAM子账户历史上传或制作的资产归属均已自动变更为华为云账号。 视频制作剧本、直播间、智能交互对话项目,暂不支持修改资产归属。 企业联邦虚拟用户,不支持修改资产归属。 操作步骤 登录MetaStudio控制台。
在左侧导航栏中,单击“任务中心”。 在“分身数字人”页签,单击数字人定制任务右侧的“查看详情”,进入“定制任务详情”页面。 审核通过后,任务状态变更为“算法训练中”,如图1所示。 单击右上角的“编辑”,可以为数字人添加标签。标签添加完成后,单击“保存”,保存修改。 图1 数字人定制任务
声音更新记录 2025年1月 表1 声音更新记录 发音人名称 性别 TTS版本 风格 语言 变更方式 云海 男 TTS V7 营销 中文 新增 云佳 女 TTS V7 客服 中文 新增 云辉 男 TTS V7 直播 中文 新增 云英 女 TTS V9 直播 中文 新增 云薇 女 TTS
在科大讯飞平台创建应用(AIUI通用语义模型) 在科大讯飞AIUI开放平台,创建AIUI通用语义模型的应用。 AIUI通用语义模型应用,不支持直接切换为星火交互认知大模型。因为已配置内容不适用,建议参考在科大讯飞平台创建应用(星火交互认知大模型)单独为其创建应用。 详细操作如下所示,具体的操作步骤请参见科大讯飞的文档中心。
在科大讯飞平台创建应用(星火交互认知大模型) 在科大讯飞AIUI开放平台,创建星火交互认知大模型的应用。 星火交互认知大模型应用,不支持直接切换为AIUI通用语义模型。因为已配置内容不适用,建议参考在科大讯飞平台创建应用(AIUI通用语义模型)单独为其创建应用。 详细操作如下所示,
行信息交互和协同工作,以实现更强大而智能的烹饪模式。 84. 例如,如果智能灶台识别到您正在烹饪汤类菜肴,智能机器人会自动将正常的烹饪程序转换为煮沸程序,从而获得更好的效果。 85. 智慧厨房的出现不仅提高了烹饪的效率和质量,还提供了一个新的健康饮食的理念。 86. 借助智能厨房
如何自定义域名方式访问智能交互页面? 智能交互业务媒体流如何应对防火墙限制? 智能交互界面报错“MSS.20010135”如何处理? 如何实时切换智能交互的语言和声音?
如何调用MetaStudio接口? 数字人相关问题 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 如何实时切换智能交互的语言和声音? 父主题: 附录
enterActive 数字人激活事件。 × √ enterSleep 数字人自动休眠事件。 × √ jobInfoChange 交互任务信息变更事件。 √ √ speakingStart 数字人开始讲话事件。 × √ speakingStop 数字人结束讲话事件。 × √ speechRecognized
Flexus形象和声音使用限制 Flexus分身数字人目前仅支持视频制作,不支持视频直播和智能交互。 视频制作限制 Flexus数字人采用实景拍摄,视频制作时不支持切换背景。 Flexus分身数字人左上角会有标识。未带有标识的数字人均为标准版形象。 需注意Flexus视频制作和标准版视频制作分开计费,从各自的套餐包中扣除费用。
wav~19.wav;文本文件命名规则:0.txt~19.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
wav~99.wav;文本文件命名规则:0.txt~99.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
开始说话(注:接口已重命名为startUserSpeak,请直接切换至新接口)。 × √ startUserSpeak 用户开始提问。 × √ stopChat 结束对话。 × √ stopSpeak 停止说话(注:接口已重命名为stopUserSpeak,请直接切换至新接口)。 × √ stopUserSpeak
音频录制说明 音频录制 说明 采样率 推荐使用48kHz采样率录制音频。 苹果手机设置简易录音机录音参数的操作如下所示: 打开简易录音机软件,切换至设置“Settings”页面。 选择“Format”,进入“Format”页面。 设置如下选项: 文件格式:选择“.wav (PCM)”或MP3格式。
中设置相关权限,并且该权限仅对此项目生效;如果在“所有项目”中设置权限,则该权限在所有区域项目中都生效。访问MetaStudio时,需要先切换至授权区域。 权限根据授权精细程度分为角色和策略。 角色:IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该机制以服务为粒