检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
String 上传训练数据的地址。训练数据需打包成zip文件后,上传至该url。 create_type取值为package时设置。 说明: 通过该obs地址上传时,需设置content-type为application/zip。 segment_uploading_url segment_uploading_url
本次变更如下: 语音合成管理接口组,新增接口:创建TTS异步任务、获取TTS异步任务。 声音制作任务管理接口组,新增接口:查询用户配置的个性化音频时长、设置任务批次。 2024-10-30 第十一次正式发布 本次变更如下: 新增接口组:租户管理。 2024-08-20 第十次正式发布 本次变更如下:
该配置仅用于shared_type为SHARED的模板。 格式遵循:RFC 3339,示例“20210110T08:43:17Z”。 取值范围: 字符长度0-20位 默认取值: 不涉及。 allowed_project_ids Array of strings 参数解释: 允许访问本资产的租户列表。
安卓手机的超级录音机的录音参数设置方式,如下所示: 打开超级录音机软件。 为了能正常录音和保存文件,需要先授权给软件录音和存储权限,即允许“超级录音机”访问媒体。 进入软件设置页面。 设置如下选项: 录制设置 > 录音音质:选择“高清”。 录制设置 > 录音保存格式:选择“WAV”或“MP3”。
选择“闲聊语料”类别,在右侧界面,单击“新建”,弹出“新建知识”对话框。 请根据实际情况输入问答内容,配置示例如图6所示。其中,“答案”必须选择“纯文本”。 图6 新建知识 设置完成后,单击“确定”。一条语料新增完成。 方式二:批量导入问题类别及其语料。 用户也可以使用批量导入的方式,一次性添加完成问题类别及其所有问答对。操作方式如下所示:
如果还需要制作更多场景,可单击“场景”区域的“+”图标,新增场景。制作过程参考第一个场景即可。 图3 场景区域 所有场景设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。 参数设置说明如下所示: 分辨率:根据实际情况,选择视频的分辨率。 导出为:输入导出文件的名称。 画质增强:开启
PPT,再插入需要分享的PPT页,详情请参见PPT。每页PPT会对应生成一个场景,依次设置完成所有场景即可。 所有场景设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。 参数设置说明如下所示: 分辨率:根据实际情况,选择视频的分辨率。 导出为:输入导出文件的名称。
答案是否采用流式响应方式。默认值:false。 表3 Message 参数 是否必选 参数类型 描述 content 是 String 对话内容。 取值最小长度1,最大长度4096。 响应参数 状态码: 200 表4 非流式响应Header参数 参数 参数类型 描述 Content-Type String
支持文本问答。 startChat新增入参,参考表15,用来设置交互模式(语音问答/文本问答)。 新增接口activeInteractionMode、interactionModeSwitch、sendTextQuestion,用来获取和设置当前交互模式(语音问答或文本问答),以及发送问题文本。
文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。 4 视频场景区域
播画面中。 在左侧的“文本设置”界面,设置文本内容和字体样式,如图7所示。 在视频直播画面预览区域,如果存在多种视频直播素材,支持对文本进行图层管理,如:上移一层、下移一层、置顶、置底、复制、应用到全局、删除等。还支持设置大小,拖动位置。 图7 文本设置 父主题: 视频直播
的视频画面中。 在左侧的“文本设置”界面,设置文本内容和字体样式,如图9所示。 在视频画面预览区域,如果存在多种视频素材,支持对视频进行图层管理,如:上移一层、下移一层、置顶、置底、复制、应用到全局、删除等。还支持设置大小,拖动位置。 图9 文本设置 父主题: 视频制作
理: 在开始对话时设置。使用startChat接口开启对话时,设置成文本问答模式,如下所示: const { result } = await HwICSUiSdk.startChat({ interactionMode: 'TEXT' }); 在对话过程中设置。如果已经调用st
回到“应用配置”页面,开启“兜底设置”及其下的“讯飞闲聊”,如图8所示。 讯飞闲聊能够完成基本的问答,或者委婉表达自己不知道答案。 图8 兜底设置 单击“应用配置”界面右上方的“保存修改”。 界面提示“保存成功”,说明应用配置页面的修改已生效。 配置热词。 展开“语音识别”下方的“高级设置”,如图9所示。
输入如下参数的值: 技能名称:技能名称。必须与科大讯飞创建的技能一一对应,如在科大讯飞创建同名技能后,导入技能文件所示。为方便识别和记忆,两边的技能名称可以设置成一样的。 技能标识:技能标识。必须与科大讯飞创建的技能标识,保持一致,如在科大讯飞创建同名技能后,导入技能文件所示。否则用户命中问题,也无法获取到对应的答案。
音频上传的地址。 说明: 通过该obs地址上传时需要设置content-type为audio/wav txt_uploading_url Array of strings 文本上传的地址。 说明: 通过该obs地址上传时需要设置content-type为text/plain 表4
MetaStudio控制台的视频直播间编辑界面或智能交互对话设置页面,选到当前音色。 如果界面正常展示且可以选择此音色使用,说明接口可以正常调用此音色,否则接口无法调用。 API流控 数字内容生产线服务对服务端API设置了调用次数限制,避免出现短时间内重复调用API,服务中断的情况。
多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。 配置说明,如下所示: 如果设置为“1”,则问答请求时,不支持携带历史会话。 如果设置为非“1”,则问答请求时,携带历史会话。示例:取值为“3”时,问答请求中会携带1个最新问题,和历史最新的2个问题
视频直播 视频直播界面说明 视频直播 互动管理 商品管理 直播任务管理 智能交互设置 视频直播公共配置
用户可以单击“查看制作任务列表”,进入“任务中心 > 分身数字人”页面。 查看生成的Flexus分身数字人训练任务,其“服务类型”为“Flexus版”,任务名称为设置的“数字人名称”。这里的任务分身数字人训练耗时约3小时,请耐心等待。 单击任务所在行的“查看详情”,进入“定制任务详情”页面。 查看分身数