检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
标准版数字人可以用实景拍摄吗? 可以,详见拍摄真人视频中的“实景数字人拍摄要求”。 使用实景拍摄,不支持抠图和更换背景,后期使用数字人会一直带着拍摄的背景。只有绿幕素材后续可以更换背景,蓝幕也不支持更换背景。 父主题: 声音和形象制作
如果用户在第三方直播平台的直播画面不清晰,需排查是否是下述原因导致: 电脑是否有独立显卡。 OBS视频采集工具的基础分辨率配置是否与输出分辨率一致。 检查独立显卡 用户使用的第三方直播平台所在电脑,必须装有独立显卡。
如果用户在第三方直播平台的直播画面不清晰,需排查是否是下述原因导致: 电脑是否有独立显卡。 OBS视频采集工具的基础分辨率配置是否与输出分辨率一致。 检查独立显卡 用户使用的第三方直播平台所在电脑,必须装有独立显卡。
创建智能交互数字人(华为云CBS) 配置对话机器人服务CBS 创建智能交互数字人 父主题: 智能交互
视频直播间的场景布置好之后,可以通过捕捉网页画面或RTMP推流的方式向第三方直播平台传输画面。MetaStudio控制台的场景布置是免费的,生成并输出直播画面是付费的。且MetaStudio服务主要是生成数字人音视频内容,是直播内容输出源,不是直播平台。 父主题: 计费咨询
如果用户在第三方直播平台的直播画面没有声音,需排查是否是OBS工具设置的桌面音频设备与Windows系统的声音输出设备不一致导致。 检查方法如下所示: 检查OBS桌面音频设备 检查Windows系统的声音输出设备 检查OBS桌面音频设备 本地打开OBS视频采集工具。
集成WebSDK的网页加载时自动调用create接口创建数字人,但是后续的数字人播报为啥没有声音? 原因请参考媒体和Web Audio API 的自动播放指南,所以出现数字人没声音的问题时,建议按照下述步骤排查并做出相应处理。 添加按钮点击触发create接口后,测试是否有声音。
声音和形象制作 标准版数字人可以用实景拍摄吗? 分身数字人定制任务提交后,审核未通过怎么办? 模型审核和制作可以加快吗? 部分浏览器提交H265训练视频失败如何处理? 声音和形象模型支持在其他平台使用吗? 声音和形象模型和音视频内容的关系?
华为云数字内容生产线为更好的提供服务,将从2024年9月27日起,对中国大陆分身数字人形象制作、声音制作进阶版、视频制作的按需计费及按需预付费套餐包,进行统一调价。调整后的价格如表1所示。
图4 智能交互对话项目 父主题: 创建智能交互数字人(华为云CBS)
图7 对话体验 父主题: 创建智能交互数字人(华为云CBS)
声音制作 真人声音录制 声音录制指导文档下载 创建声音制作任务(自研模型) 创建声音制作任务(第三方模型) 查看声音 声音更新记录 购买声音套餐 文案样例(基础版) 文案样例(进阶版) 文案样例(高品质)
语料推荐使用文案样例(基础版)。 声音授权签署文件。 操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 图1 定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。
文案样例(进阶版) 直播带货风格文案 营销宣传风格文案 新闻播报风格文案 直播带货风格英文文案 营销宣传风格英文文案 新闻播报风格英文文案 父主题: 声音制作
文案样例(基础版) 直播带货风格文案 营销宣传风格文案 新闻播报风格文案 直播带货风格英文文案 营销宣传风格英文文案 新闻播报风格英文文案 父主题: 声音制作
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。
声音制作任务管理 查询用户配置的个性化音频时长 创建基础版语音训练任务 创建进阶版语音训练任务 创建高级版语音训练任务 查询语音训练任务列表 提交语音训练任务 查询语音训练任务详情 删除语音训练任务 查询任务操作日志 获取语音文件上传地址 获取语音训练任务审核结果 设置任务批次 确认在线录音结果
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。
2024-04-02 本次变更如下: 新增发布1.1.2版本SDK,相比1.1.1版本,修复如下问题: SDK不再设置document.title,避免影响网页title。 支持替换加载中背景图,图片所在路径为.