检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
确认在线录音结果 功能介绍 确认在线录音结果。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/training-segment 表1 路径参数 参数 是否必选 参数类型 描述 project_id
获取在线录音确认结果 功能介绍 获取在线录音确认结果。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/training-segment 表1 路径参数 参数 是否必选 参数类型 描述 project_id
服务处理。 详细操作如下所示: 访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。 服务会在收到问题单后,联系您处理。
服务处理。 详细操作如下所示: 访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。 服务会在收到问题单后,联系您处理。
播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选
如何将WEBM视频转成MOV格式? 问题描述 视频制作时,如果使用透明背景合成视频,导出时仅支持生成WEBM格式视频。而常用的视频工具剪映、Premiere Pro等,不支持WEBM格式,需要先参考本节转为MOV格式。 解决方法 单击webm2mov,将视频格式转换小工具webm2mov_20240814
播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选
提交语音训练任务 查询语音训练任务详情 删除语音训练任务 查询任务操作日志 获取语音文件上传地址 获取语音训练任务审核结果 确认在线录音结果 获取在线录音确认结果
华为云提供了MetaStudio服务端SDK,您可以直接集成服务端SDK来调用MetaStudio的相关API,从而实现对MetaStudio服务的快速操作。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 您可以在API Explor
敏感词话术 数字人回复内容触发敏感信息时,使用的回复话术。 示例:哎呦,这个问题我没有听懂哦!请您重新提问。 单击“在线演示”,可以在界面右侧演示模型对话效果,如图4所示。 图4 在线演示 单击界面右上角的“保存”,在弹出的“保存成功”提示框中,单击“确定”。 角色创建完成。 查看角色信息
视频制作素材操作详情 视频制作界面支持添加角色、背景、PPT、贴图、视频、音乐、文本等视频制作素材。本节提供各类素材的详细操作过程。 角色 角色界面详情,如图1所示。 图1 角色界面 角色界面说明,如表1所示。 表1 界面元素说明 界面元素 说明 定制数字人 单击“定制数字人”,
因素。这个改革是想减轻学生的学业压力,让他们能更全面地发展。 因为互联网技术的发展,网络教育在中国越来越受欢迎。 更多的学校和教育机构提供在线课程和远程学习平台,让学生能灵活选择时间和地点学习。 网络教育还给偏远地区和弱势群体提供了更多平等的教育机会。 STEM教育是中国教育改革的重要话题。
照片数字人限制 照片数字人视频制作限制说明,如表1所示。 表1 照片数字人视频制作限制 照片数字人视频制作配置 限制 人像照片 制作照片数字人的人像照片拍摄要求,如下所示: 真人正面照,不支持动漫卡通形象;面部占比50%以上,侧脸俯仰角度不超过15度。 五官清晰无遮挡,目视前方。
能力开放可集成 智能交互端侧Web SDK 形象驱动API 数字人大脑API 数字人能力开放,多种合作模式灵活选择 实名安全认证后,可使用控制台在线自助完成内容制作。 集成数字人API、SDK至企业自建平台。 联合专业直播服务伙伴,定制场景化解决方案,实现数字人直播系统交付和运营专业支持。
智能交互支持富媒体吗? 支持的富媒体格式 用户与数字人进行智能交互问答时,支持展示如下格式的富媒体: 图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体。以奇妙问知识库为例,参考新增知识库,补充富媒体知识,示例如表1所示。 如
图片、产品视频、企业logo、添加文字贴图背景音乐等编辑功能。 目前已经支持桌面端、移动端安卓iOS都可以直接下载使用。 在九月,还将上线在线端,到时候只需要打开浏览器就可以制作数字人视频。 我们可以看一些视频案例,以下这是视频都是利用万兴播爆数字人生成的营销视频,大家可以看看,整体效果还是蛮不错的,我们边看边聊~
wav~99.wav;文本文件命名规则:0.txt~99.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
wav~19.wav;文本文件命名规则:0.txt~19.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
获取语音文件上传地址 20次/秒 10次/秒 10次/秒 获取语音训练任务审核结果 20次/秒 10次/秒 10次/秒 确认在线录音结果 10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件
获取语音文件上传地址 20次/秒 10次/秒 10次/秒 获取语音训练任务审核结果 20次/秒 10次/秒 10次/秒 确认在线录音结果 10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件