检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Flexus视频制作:必须使用Flexus形象,声音使用不受限制。 按视频制作时长计费,计费项为“Flexus分身数字人视频制作”,详见计费说明。 系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。
API和Java/Python/Go三种语言的SDK。API调用请参考《API参考》,SDK集成请参考API Explorer中的“代码示例”。 父主题: API使用
角色密钥,即MetaStudio平台API调用所需的RoleId和AppSecret。 前提条件 使用奇妙问前,需提交工单申请使用手机号注册账号。 创建角色 访问奇妙问,输入有效手机号和验证码,或者通过密码方式登录。 图1 奇妙问 单击“登录”,进入奇妙问“创建角色”页面,如图2所示。
使用Java代码生成文件内容的MD5值 生成文件内容的MD5值对应的Java代码示例,如下所示: import java.io.BufferedInputStream; import java.io.FileInputStream; import java.io.IOException;
新增知识库 可根据实际需要,上传外部知识库和问答库给大模型学习。 前提条件 使用奇妙问前,需提交工单申请使用手机号注册账号。 操作步骤 访问奇妙问,输入有效手机号和验证码,或者通过密码方式登录。 图1 奇妙问 单击“登录”,进入奇妙问“创建角色”页面,如图2所示。 图2 创建角色
演讲过程中不限制说话的内容,出现失误可直接略过或从错误位置继续说话,无需打断拍摄。 背景尽量维持静态,不能出现规律性或大幅度的背景变化。 画面保持稳定,建议使用手机支架或手机稳定器。 在光线充足的地方拍摄,避免出现脸部光照不均匀或“阴阳脸”。 父主题: Flexus分身数字人
附录 授权书 手机录制音频 客户声音制作案例 第三方平台开播指南 FAQ
钟语料声音克隆能力和120分钟1080P视频制作能力,帮助客户通过手机拍摄即可轻松制作数字人。Flexus分身数字人不仅简化制作流程,还显著降低技术门槛,且购买简单,为中小企业提供超简单、超高性价比数字人。 使用限制 Flexus分身数字人目前仅支持视频制作,不支持视频直播和智能交互。
录音环境 录音文案 基础版 优先使用专业录音设备录制音频,推荐使用Adobe Audition软件进行录音。 如果不具备专业录音设备,可使用手机录制音频,详情请参见手机录制音频。 录音环境安静,无回音、混响、噪声,避免出现汽车鸣笛、他人说话、走动等杂声。 可使用“分贝仪”应用来测试录音环境的底噪,建议底噪低于0dB。
满足用户需求,可使用自研模型自定义生成声音。 操作限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 使用“语料上传”方式上
动的效果。也可以复制数字人互动页面的网址,分享给其他用户使用。 获取数字人互动页面URL的方式还有:进入“我的创作 > 智能交互 > 对话项目”页面,单击智能交互对话项目右侧的“生成URL并复制”,将URL分享给其他用户使用。 图3 智能交互对话项目 复制URL至浏览器中,访问数字人互动页面。
女声 基础版媒体1.wav 基础版媒体2.wav 支持手机录制20条语料音频(5分钟),1-3天制作,快速获得类真人音色,mos分3.8。 短视频制作 进阶版声音制作 女声 进阶版媒体1.wav 进阶版媒体2.wav 支持手机录制100条语料音频(15分钟),1-3天制作,获得高还原度音色,mos分4
P怎么办? 若设备不支持,可尝试使用1080P(1080*1920)半身拍摄,以确保人脸区域的细节捕获。 我没有相机,能否使用手机拍摄 ? 目前我们不建议使用手机拍摄。若实在需要,请将手机录制规格调整为4K/30fps或者4K/60fps,并使用稳定器保证画面稳定。其他拍摄要求如
声音模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 视频制作 使用系统预置或自定义生成的数字人形象、声音,制作音视频内容。 制作的视频可应用于教学、培训等各类场景中。 视频直播 使用系统预置或自定义的数字人形象、声音,制作音视频直播内容。 可通过下述方式,在直播平台开播。
购买出门问问语音合成套餐的操作流程 如需使用系统预置的第三方声音,需要购买出门问问语音合成套餐包,详细的操作流程如下所示。第三方声音支持的语言类型,如第三方声音支持的语言类型所示。 购买出门问问语音合成套餐包:在云商店购买语音合成套餐包,用于激活和使用出门问问提供的第三方声音。 获取第三方声音使用凭证:查看已
竖屏),建议优先使用竖屏拍摄。支持MP4、MOV格式的视频。 训练生成的分身数字人形象与真人形象完全相同。 背景替换 分身数字人是否支持更换背景。 包含如下选项,请根据实际情况选择: 抠除拍摄背景:制作分身数字人视频时,可以更换背景。 保留拍摄背景:分身数字人使用拍摄时的原背景,不支持更换背景。
直接上传,无需压缩,无需携带文案txt文件。 如果未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景。 请选择声音性别 声音的性别,用于匹配声音模型的精准度。 如下所示: 男生 女生 请选择原始输入语言 上传语料所使用的语言。 包含19种语言:中文、英文、粤语、德语、法语
前提条件 需要申请开通智能交互权限后,才可以使用分身数字人智能交互功能。 智能交互对硬件设备的最低配置要求,如智能交互使用限制所示。 与数字人智能交互的界面,对浏览器的要求,如智能交互使用限制所示。 父主题: 智能交互
P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄。支持MP4、MOV格式的视频。 背景替换 选择“抠除拍摄背景”,制作分身数字人视频时,可以替换背景。 身份认证及授权数据上传 联系方式 请输入有效的11位手机号码。 身份证照片 需要分别上传身份证人像面和国徽面的照片。
视频直播 用户可以使用分身数字人,创建直播间。 操作前准备 如果系统预置的数字人形象不满足要求,请参考形象制作,提前定制符合要求的分身数字人形象。 推荐使用Chrome浏览器访问MetaStudio控制台。 操作限制 MetaStudio控制台预置形象的有效使用期为3年,在202