检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
设置TTS租户级自定义读法配置 功能介绍 该接口用于设置TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsc/vocabulary-configs 表1 路径参数 参数 是否必选 参数类型 描述 project_id
在“直播管理”页签,单击“创建直播间”,进入视频直播制作界面。 选择“互动设置”,单击右侧的“设置”,弹出“智能交互”对话框,如图1所示。 参数配置说明,如表1所示。 图1 智能交互设置 表1 参数说明 参数 说明 应用 请先参考后续步骤5,创建完成应用后,再从下拉框中选择此应用。 弹幕触发间隔时间
tudio服务概览页面。 在左侧导航栏中,选择“子账户隔离配置 > 账户设置”,进入“账户设置”页面,如图1所示。 图1 账户设置 参数配置说明,如表1所示。 表1 参数配置 区域 参数 说明 IAM用户设置 IAM子账户隔离能力 支持开启IAM子账号隔离能力。 取值如下所示:
设置任务批次 功能介绍 用户设置任务批次,该接口用于批量任务管理场景,设置任务的批次 需要开通NA租户权限后才能正常调用 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/voice-training-manage/user/batch 表1 路径参数
PPT转视频的操作如下所示: 本地打开PPT文件,在左上方的导航栏中,选择“文件 > 导出”。 选择创建视频,可以设置每张幻灯片放映的时间等参数。 单击“创建视频”,在弹出的对话框中,选择本地存放目录,并设置视频名称。 单击“保存”,生成视频文件。 视频文件生成后,需要在视频制作界面的“视频”页签,导入使用。
本地打开OBS视频采集工具。 在界面上方的导航栏中,选择“文件 > 设置”,弹出“设置”对话框。 在左侧导航栏中,选择“视频”,检查基础分辨率和输出分辨率的取值是否一致。 如果不一致,需要修改为相同的取值。 图1 视频设置 父主题: 视频直播
频属性设置对话框,如图2所示。 需要确认这里的“设备”与Windows系统的声音输出设备是否一致。如果不一致,会导致OBS无法成功捕获声音给第三方直播平台。需要修改为一致后再直播。 图2 桌面音频属性设置 检查Windows系统的声音输出设备 在Windows系统的系统设置中,找
谷歌浏览器 打开Chrome浏览器,单击浏览器右上方的图标,从下拉框中选择“设置”。 进入“设置”页面。 在左侧导航栏中,选择“隐私设置和安全性”。 在右侧界面中,单击“网络设置”,进入“网络设置”页面。 在“权限”区域,单击“麦克风”,进入麦克风授权页面。 选择“网站可以请
、复制、应用到全局、删除等。还支持设置大小,拖动位置。 视频 视频界面详情,如图6所示。 上传后的视频不支持修改。如需修改视频内容,需本地修改完成后,再上传至控制台使用。 插入的视频不支持单独调节宽或高,仅支持宽高等比例缩放。如需调节视频的宽和高,请本地调整好后再导入至平台使用。
京四”区域。 在界面右侧,选择“对话配置”页签,如图1所示。 配置说明如下所示,其他配置请参见智能交互。 语言:支持同时添加中文和英文,并设置其中一种语言为默认语言。 在数字人智能交互界面,自动展示默认语言,并用默认语言与用户进行问答。可通过界面右上方的语言切换图标,切换语言。
、复制、应用到全局、删除等。还支持设置大小,拖动位置。 视频 视频界面详情,如图4所示。 上传后的视频不支持修改。如需修改视频内容,需本地修改完成后,再上传至控制台使用。 插入的视频不支持单独调节宽或高,仅支持宽高等比例缩放。如需调节视频的宽和高,请本地调整好后再导入至平台使用。
如果用户使用软件的帧率为30,需要插帧至数字人视频中,才能达到30,这样就导致插帧后的口型对不上了。所以用户对视频进行二次剪辑时,帧率必须设置为25的整数倍,才不会影响数字人的口型效果。 父主题: 视频制作
配置特殊词表 支持全局设置自定义读法,设置完成后,所有视频制作剧本自动生效。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“声音”页签,单击界面右侧的“特殊词表”,进入如图1所示的界面。 图1 特殊词表 单击“新建词表”,界面新增一行自定义读法,如图2所示。
'modelData.js', initModel: true, }); 注意:如果未设置wasmPath和dataPath或设置的不对,会报类似下面的异常。 此时语音唤醒是无法正常使用的,需要将路径设置为正确的才行。 图1 异常报错 interactionModeSwitch (static)
)。预制的唤醒能力支持使用“你好云笙”、“稍等一下”、“谢谢再见”三个唤醒词,进行数字人唤醒、打断和退出。 可以通过调用create接口,设置接口参数param中config里的enableLocalWakeup参数来开启Web语音唤醒能力。 定制唤醒能力 如果客户希望使用体现企
MetaStudio控制台的视频直播间编辑界面或智能交互对话设置页面,选到当前音色。 如果界面正常展示且可以选择此音色使用,说明接口可以正常调用此音色,否则接口无法调用。 API流控 数字内容生产线服务对服务端API设置了调用次数限制,避免出现短时间内重复调用API,服务中断的情况。
还可以根据实际情况,设置语速、音量和音高。 语速:设置语速,取值范围[0.5X,2X]。设置为0.5X时,声音放慢至0.5倍速播放;设置为2X时,声音加速至2倍速播放。 音量:设置声音大小,取值范围[90,240]。为保证播放音量适中,建议用户调大初始音量。 音高:设置声音高低,取值范围[50
时,“作用范围”需要选择“区域级项目”,然后在指定区域(如华北-北京四)对应的项目(cn-north-4)中设置相关权限,并且该权限仅对此项目生效;如果在“所有项目”中设置权限,则该权限在所有区域项目中都生效。访问MetaStudio时,需要先切换至授权区域。 权限根据授权精细程度分为角色和策略。
本根节点。 <break/>标签用于静音停顿,可设置停顿时长。 <phoneme></phoneme>标签,用于标记多音字发音。 <say-as></say-as>标签用于指定数字或英文的读法。 <sub></sub>标签用于设置当前标记文字的别名,即替代读法。 <prosody
支持文本问答。 startChat新增入参,参考表16,用来设置交互模式(语音问答/文本问答)。 新增接口activeInteractionMode、interactionModeSwitch、sendTextQuestion,用来获取和设置当前交互模式(语音问答或文本问答),以及发送问题文本。