检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
音,全程手机录制无需专业相机和专业绿幕环境。 高性价比 不到千元即可完成形象、声音定制,性价比超越业界。 应用场景 华为云Flexus版数字人为中小企业提供了一种高效、经济的解决方案,覆盖了教育、医疗、广电传媒和电商等多个行业场景。中小企业对换背景诉求较低,Flexus版可短平快
分身数字人直播业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,防火墙需要放开如下限制: 解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。 表1 防火墙端口白名单 端口类型 端口
版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav 支持手机录制20条语料音频(5分钟),1-3天制作,快速获得类真人音色,mos分3.8。 短视频制作 进阶版声音制作 女声 进阶版媒体1.wav 进阶版媒体2.wav 支持手机录制100条语料音频(
录音准备 表1 录音准备 声音类型 录制设备和软件 录音环境 录音文案 基础版 优先使用专业录音设备录制音频,推荐使用Adobe Audition软件进行录音。 如果不具备专业录音设备,可使用手机录制音频,详情请参见手机录制音频。 录音环境安静,无回音、混响、噪声,避免出现汽车鸣笛、他人说话、走动等杂声。
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
400 Bad Request 非法请求。 建议直接修改该请求,不要重试该请求。 401 Unauthorized 在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。 403 Forbidden 请求被拒绝访问。 返回该状态码,表明请求能够到达服务
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
智能交互 智能交互管理 智能交互驱动 智能交互第三方LLM回调 智能交互客户端SDK
如果系统预置的MetaStudio权限,不满足您的授权要求,可以创建自定义策略。 目前华为云云服务平台支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作、资源、条件等策略内容,可自动生成策略。 JSON视图创建自定义策略:可以在选择策略模板
与健康设备连接后,它会实时传输数据并生成健康报告,让您全面了解自己的健康状况。 智慧管家还可以与智能家居设备进行连接,实现远程控制和自动化操作。 通过手机指令,您可以调节家居设备的亮度、颜色、音量。 智慧管家还能为您提供个性化的购物和外卖服务。 它会为您推荐合适的商品或菜品,并帮助您完成下单和支付。
SDK) 示例8:视频制作 示例9:视频制作剧本管理 示例10:视频制作素材图层管理 示例11:视频直播 示例12:视频直播对接实时音视频客户端SDK 示例13:数字人名片制作 示例14:智能交互
说明当前数字人支持添加动作。 Flexus分身数字人 分身数字人Flexus版针对中小企业客户,提供1080P的实景数字人、1分钟语料声音克隆能力和120分钟1080P视频制作能力,帮助客户通过手机拍摄即可轻松制作数字人。Flexus分身数字人不仅简化制作流程,还显著降低技术门
演讲过程中不限制说话的内容,出现失误可直接略过或从错误位置继续说话,无需打断拍摄。 背景尽量维持静态,不能出现规律性或大幅度的背景变化。 画面保持稳定,建议使用手机支架或手机稳定器。 在光线充足的地方拍摄,避免出现脸部光照不均匀或“阴阳脸”。 父主题: Flexus分身数字人
分身形象和声音制作的处理方式相同,均需根据实际情况进行处理。下面以形象制作为例,进行说明。 如果当前分身形象制作的素材质量不佳,管理员会通过用户提交训练任务时输入的手机号联系用户。用户可以在管理员驳回任务后重新提交训练视频,进行数字人形象训练。形象制作任务制作完成前,形象制作资源一直处于占用状态,并未真正扣除。
/> 富媒体展示效果(SDK默认展示方式) 用户与数字人进行智能交互的页面,富媒体展示效果支持使用SDK提供的默认展示方式。 下述智能交互客户端SDK的两个方法的配置字段enableCaption,默认值均为False,即用户自定义富媒体的展示效果。如果需要使用SDK提供的默认展示
附录 授权书 手机录制音频 客户声音制作案例 第三方平台开播指南 FAQ
京东购物卡、手机支架,还有超赞的万兴播爆和万兴喵影的月度会员卡。 首先是京东购物卡,只需要将其绑定到你的京东账号,你就可以直接在京东上购物,挑选自己喜欢的商品,不要错过这个机会哦! 接下来是我们公司定制的手机支架,它非常实用,无论是工作还是休闲时,都能帮助你固定手机,让你更方便地操作和观看。
表1 界面操作说明 区域 说明 声音制作方式 MetaStudio提供下述声音制作方式: 基础版声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长3~10分钟,建议5分钟。 进阶版声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长10~30分钟,建议15分钟。
在MetaStudio控制台开播,且没有配置RTMP推流时,用户关闭了视频播放窗口一段时间以后,约2~3分钟。 调用API开播,且没有配置RTMP推流时,客户端退出RTC房间一段时间以后,约2~3分钟。 特殊退出场景 如果直播内容涉及安全合规风险,服务运维人员,会通过运维界面,直接冻结直播任务。 直播播放说明