检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
语音驱动时的动作配置。 audio_drive_file_external_url String 语音驱动音频文件外部下载URL。 说明: 需要先申请开通白名单后,才允许通过外部URL的音频文件来驱动分身数字人视频。 background_config Array of BackgroundConfigInfo
获取语音训练任务审核结果 20次/秒 10次/秒 10次/秒 设置任务批次 10次/秒 3次/秒 3次/秒 确认在线录音结果 10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件
reply_audios 否 Array of ReplyAudioInfo objects 参数解释: 回复音频集。填写audio_url。 约束限制: 不涉及 取值范围: 最大支持5条预置音频。 默认取值: 不涉及 reply_order 否 String 参数解释: 回复话术选择次序。 约束限制:
本次变更如下: 语音合成管理接口组,新增接口:创建TTS异步任务、获取TTS异步任务。 声音制作任务管理接口组,新增接口:查询用户配置的个性化音频时长、设置任务批次。 2024-10-30 第十一次正式发布 本次变更如下: 新增接口组:租户管理。 2024-08-20 第十次正式发布
因素。这个改革是想减轻学生的学业压力,让他们能更全面地发展。 因为互联网技术的发展,网络教育在中国越来越受欢迎。 更多的学校和教育机构提供在线课程和远程学习平台,让学生能灵活选择时间和地点学习。 网络教育还给偏远地区和弱势群体提供了更多平等的教育机会。 STEM教育是中国教育改革的重要话题。
能力开放可集成 智能交互端侧Web SDK 形象驱动API 数字人大脑API 数字人能力开放,多种合作模式灵活选择 实名安全认证后,可使用控制台在线自助完成内容制作。 集成数字人API、SDK至企业自建平台。 联合专业直播服务伙伴,定制场景化解决方案,实现数字人直播系统交付和运营专业支持。
签,导入使用。 请注意:视频中PPT每页播放的时间如果与对应音频的时长不匹配,需要将完整的PPT视频按页切割成独立的子视频,一一上传至视频制作界面,按场景依次添加使用。添加后的视频支持仅播放一次,或者循环播放,直至音频播报结束。 父主题: 视频制作
获取语音训练任务审核结果 20次/秒 10次/秒 10次/秒 设置任务批次 10次/秒 3次/秒 3次/秒 确认在线录音结果 10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件
界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 选择“出门问问声音制作”。音频时长为0.5~180分钟,建议5分钟。音频格式为WAV或MP3文件,支持19种语言的声音制作。 音频总时长,建议5分钟;单段不低于5秒 如果剩余次数为0,可单击“立即购买”,参考购买出门问
调整段落在场景中的位置。 :新增1个空白段落。 图3 开播界面 音频驱动 单击“上传音频”,从本地上传已录制好的音频,如图4所示。 每个音频不能超过100M,支持WAV、M4A和MP3格式,每个场景的音频总时长不能低于1分钟。 开播后会直接播放音频,声音是音频原有声音。用户也可以设置主播和助播的声音,
Flexus分身数字人制作任务会同时生成一个Flexus形象和一个Flexus声音,所以也需要提供音频。 单独上传语料包:单独录制音频文件,需要单击下方的“点击上传音频文件”,上传音频。 音频格式支持WAV、MP3,单段音频时长1~5分钟,建议1分钟。语料中的语言仅支持中文和英文。 视频中提取声音:直
动解析输入内容。 直播剧本包含下述设置: 剧本驱动 支持下述三种方式任选其一: 文本驱动:输入文本,通过文本驱动数字人说话。 音频驱动:上传音频,通过音频驱动数字人说话。 即兴直播:无需设置剧本,直接开播。开播后数字人是不说话的,需要发送互动内容,或者开启真人接管,驱动数字人说话。
附录 授权书 手机录制音频 客户声音制作案例 第三方平台开播指南 FAQ
如何查看已购声音套餐明细? 访问云商店买家中心,进入“已购买的服务”界面,可以看到已购买的语音合成套餐信息。 父主题: 计费咨询
支持多选,支持添加新类别。 产品素材 合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作: 单击商品所在行的“查看
语音驱动时的动作配置。 audio_drive_file_external_url 否 String 语音驱动音频文件外部下载URL。 说明: 需要先申请开通白名单后,才允许通过外部URL的音频文件来驱动分身数字人视频。 background_config 否 Array of BackgroundConfigInfo
多语言的计费规则? 文本转语音是以字数来计费的,多语言不是计费项,无需另外付费。 自研声音目前只有中英文,声音合成按需计费标准为:¥200.00/百万字,可以在MetaStudio服务概览页面的“声音合成”卡片中查看,如图1所示。 图1 声音合成计费项 第三方声音的计费标准,详见云商店语音合成商品页面的价格表。
-manage/user/training-segment 确认在线录音结果 GET /v1/{project_id}/voice-training-manage/user/training-segment 获取在线录音确认结果 语音合成管理 表27 语音合成管理接口 接口 说明
按需计费 按需预付费套餐包 一次性计费 声音制作 按声音制作的个数计费。 包括如下类型: 基础版:20条语料音频 进阶版:100条语料音频 高级版:1小时以上的长音频WAV文件 每成功制作1个声音,从所购预付费资源包中扣除1个。 一次性计费 分身数字人视频直播 按数字人各路直播的总时长计费。
reply_audios 否 Array of ReplyAudioInfo objects 参数解释: 回复音频集。填写audio_url。 约束限制: 不涉及 取值范围: 最大支持5条预置音频。 默认取值: 不涉及 reply_order 否 String 参数解释: 回复话术选择次序。 约束限制: