检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。 4 视频场景区域
需计费。 如需使用第三方声音进行语音合成,请购买出门问问声音套餐,操作请参考《用户指南》的“购买出门问问声音套餐”章节。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsc/async-jobs 表1 路径参数 参数 是否必选 参数类型
需授权给公司使用。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备完成如下内容: “语料上传”方式制作声音时,需要参考声音制作页面的“录音指导”录制音频。 签署声音授权文件,如授权书所示。 购买小语种克隆套餐包并激活使用,操作请参考购买出门问问声音套餐。 操作步骤 登录MetaStudio控制台。
子账户隔离配置 账户设置 资产归属分配 父主题: IAM权限管理
视频直播 视频直播界面说明 视频直播 互动管理 商品管理 直播任务管理 智能交互设置 视频直播公共配置
语音合成管理 创建TTS试听任务 获取TTS试听文件 创建TTS异步任务 获取TTS异步任务 设置TTS租户级自定义读法配置 获取TTS租户级自定义读法配置 删除TTS租户级自定义读法配置 修改TTS租户级自定义读法配置 语音同步合成WebSocket接口
本根节点。 <break/>标签用于静音停顿,可设置停顿时长。 <phoneme></phoneme>标签,用于标记多音字发音。 <say-as></say-as>标签用于指定数字或英文的读法。 <sub></sub>标签用于设置当前标记文字的别名,即替代读法。 <prosody
查询语音训练任务列表 提交语音训练任务 查询语音训练任务详情 删除语音训练任务 查询任务操作日志 获取语音文件上传地址 获取语音训练任务审核结果 设置任务批次 确认在线录音结果 获取在线录音确认结果
修订记录 表1 修订记录 修改时间 修改说明 2024-12-30 第十四次正式发布 本次变更如下: 语音合成管理接口组,新增接口:设置TTS租户级自定义读法配置、获取TTS租户级自定义读法配置、删除TTS租户级自定义读法配置、修改TTS租户级自定义读法配置。 2024-12-05
算错误,且没有进行Base64编码。 3中可能错误,如下所示: Content-MD5设置错误,因为文件的MD5计算错误,且没有进行Base64编码。 Content-Type设置错误,格式设置的不对。 使用OBS的PUT上传接口上传资产文件时,没有以二进制流binary方式上传。
信息。 重命名资产 单击资产卡片区域的图标,从下拉框中单击“重命名”,对资产进行重命名。 取消激活 单击资产卡片区域的“取消激活”,将资产设置为“未激活”状态。未激活状态的资产在控制台不可用。 查看详情 单击资产卡片,进入资产详情界面,查看资产的全部信息,图片资产详情示例如图2所示。
SDK下载 SDK名称 SDK包 开发者 个人信息处理规则 合规使用指南 HwICSUiSDK 参见表2下载链接 华为云计算技术有限公司 SDK如何处理个人信息请参见SDK隐私声明 您集成和使用我们的SDK时需要遵从个人信息保护基本要求,详情请参见SDK合规使用指南。 表2 Web SDK下载
不能吃辣的宝宝,等会下单的时候选酱香口味。 辣的和不辣的都想尝试的宝宝可以分别选择哈,喜欢哪个就选哪个。 他家麻辣香锅的特点就是: 第一、麻辣鲜香,香而不咸 第二、里面的配菜非常丰富量也很足,有乌冬面、蔬菜、鱼丸、素毛肚…… 第三、蔬菜非常新鲜,藕片什么的吃起来还是很脆的口感 给大家来看看我们麻辣香锅里面都有什么东西。
需要接收资产的租户,其所在Region的项目ID,获取方法请参见获取项目ID。 备注 转移资产的备注信息。 接收方式 租户接收资产的方式。 包含如下设置: 资产转移后用户自动接收:建议勾选,这样资产转移后,租户无需再执行接收资产的操作,否则需要参考接收资产进行操作。 是否自动激活:建议勾选
重命名资产:单击资产卡片区域的图标,从下拉框中单击“重命名”,对资产进行重命名。 取消激活:资产上传完成后,默认是激活状态,可以单击资产卡片区域的“取消激活”,将资产设置为“未激活”状态。未激活状态的资产在控制台不可用。 查看详情:单击资产卡片,进入“图片详情”界面,查看资产的全部信息,如图5所示。 编辑资
单击“闲聊语料”,在右侧界面,单击“新建”,弹出“新建知识”对话框。 请根据实际情况输入问答内容,配置示例如图4所示。其中,“答案”必须选择“纯文本”。 图4 新建知识 设置完成后,单击“确定”。一条语料新增完成。 方式二:批量导入问题类别及其所有问答对。 在左侧导航栏中,选择“知识库 > 问答管理”。 单击界
的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考购买出门问问声音套餐。 设置完成后,单击“生成视频”,弹出如图2所示的对话框,显示照片数字人视频的生成进度。 可执行下述操作: 单击图中第一个链接“任务中心-视频”,可进入“任务中心
问权限。 90100018 capture failed, Constraint parameter invalid. 音频采集设备不支持设置的采集约束,采集失败。 90100019 capture failed, requested device not found. 未找到请
支持流式文本消息。seq为流式文本序号,从1开始计数;is_last用于判断流式文本的最后一包数据。如果不使用流式文本消息,seq设置为“1”,is_last设置为“true”。 建议每个分包数据长度大于6个字,否则可能会导致数字人说话卡顿。 详细交互流程如下所示: 用户发送文本驱动消息。
S_FAILED、JOB_SUCCESS、WAIT_USER_CONFIRM、JOB_REJECT、JOB_FINISH 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/digital-human-training-manage/user/jobs/{job_id}