检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置说明如下所示,其他配置请参见智能交互。 语言:支持同时添加中文和英文,并设置其中一种语言为默认语言。 在数字人智能交互界面,自动展示默认语言,并用默认语言与用户进行问答。可通过界面右上方的语言切换图标,切换语言。 声音:单击声音右侧的图标,切换数字人声音。 这里选择的声音,需要与前面选择的语言匹配。如果是中
多语言的计费规则? 文本转语音是以字数来计费的,多语言不是计费项,无需另外付费。 自研声音目前只有中英文,声音合成按需计费标准为:¥200.00/百万字,可以在MetaStudio服务概览页面的“声音合成”卡片中查看,如图1所示。 图1 声音合成计费项 第三方声音的计费标准,详见云商店语音合成商品页面的价格表。
如图2所示。 图中标识“1”处为语言修改配置。请根据实际情况切换语言,目前仅支持中文和英文。 图中标识“2”处为声音切换入口。单击图标,弹出如图3所示的对话框,选择需要切换的声音。 请注意,切换后的声音必须与前面切换后的语言保持一致。如果语言选择英文,声音选择中文声音,那么界面交互时数字人会没有声音。
第三方声音支持的语言类型 第三方声音支持的语言类型,如表1所示。 表1 语言类型 语言类型 语种 出门问问(方言) 支持7种语言:东北话、广西话、湖北话、陕西话、四川话、粤语、港台。 出门问问(预置声音) 支持19种语言:中文、英文、德语、法语、韩语、葡萄牙语、日语、西班牙语、意
创建智能交互数字人(第三方语言模型) 创建智能交互数字人 父主题: 智能交互
API和SDK使用 如何获取项目ID? 如何调用MetaStudio接口? Flexus支持通过API集成使用吗? 为什么调用API时提示“APIG.0301”? 使用API时返回“APIGW”开头的错误码,该如何处理? 智能交互SDK从哪里下载?
需压缩,无需携带文案txt文件。 如果未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景。 请选择声音性别 声音的性别,用于匹配声音模型的精准度。 如下所示: 男生 女生 请选择原始输入语言 上传语料所使用的语言。 包含19种语言:中文、英文、粤语、德语、法语、土耳其语、
第三方应用 选择“第三方语言模型”。 应用名称 输入自定义的应用名称。 APPID MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPID信息。 APPKEY MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPKEY信息。 第三方语言模型地址 Met
使用限制 在使用数字内容生产线服务前,您需要了解本服务的使用限制信息。 区域限制 预置模特使用限制 API使用限制 形象制作限制 声音制作限制 视频制作限制 视频直播限制 Flexus分身数字人限制 照片数字人限制 智能交互限制 资产管理说明 SP用户限制
myhuaweicloud.com 配置用户信息 使用MetaStudio之前需配置用户信息,请您提交工单,并附上账号信息(projectId)联系华为云技术工程师为您配置相关账号的白名单。 使用API调用声音的限制说明 用户使用视频直播或智能交互接口调用音色时,需要先确认能否在
网信算备520111252474601240079号 算法基本原理 分身数字人声音制作算法是指使用深度学习算法生成数字人声音模型,再使用该模型通过输入文字生成数字人语音的一种技术。 其基本情况包括: 输入数据:真人语音音频 。 算法原理:通过深度学习算法,学习真人语音音频生成数字人声音模型,通过该模型,输入文本生成数字人语音。
购买出门问问语音合成套餐的操作流程 如需使用系统预置的第三方声音,需要购买出门问问语音合成套餐包,详细的操作流程如下所示。第三方声音支持的语言类型,如第三方声音支持的语言类型所示。 购买出门问问语音合成套餐包:在云商店购买语音合成套餐包,用于激活和使用出门问问提供的第三方声音。 获取第三方声音使用凭证:查看已
Flexus支持通过API集成使用吗? 支持,详见接口创建分身数字人模型训练任务的is_flexus字段。 父主题: API和SDK使用
API使用限制 使用API调用声音的限制说明 用户使用视频直播或智能交互接口调用音色时,需要先确认能否在MetaStudio控制台的视频直播间编辑界面或智能交互对话设置页面,选到当前音色。 如果界面正常展示且可以选择此音色使用,说明接口可以正常调用此音色,否则接口无法调用。 API流控
预置模特使用限制 MetaStudio控制台预置模特的有效使用期为3年,在2027年的年中前用户可以放心使用。具体下线时间请关注MetaStudio服务,会提前3个月在现网开放下线公告。 父主题: 使用限制
行百业场景应用。 主要功能如下所示,详见功能特性。 数字内容生产线Metastudio通过AI学习真人形象和声音,来生成数字人模型,相应功能为形象制作、声音制作和Flexus分身数字人。再将模型用于音视频内容的创作,相应功能为视频制作、视频直播和智能交互,主要是生成画面内容。也可
数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。 服务型数字人:利用深度神经网络进行图像合成、高度拟真的虚拟人。 具备如下特点: 2D模型,通过拍摄真人视频训练生成 无表情&骨骼数据 只能由AI驱动 使用既定表情&动作 IP型数字
MetaStudio提供RESTful API和Java/Python/Go三种语言的SDK。API调用请参考《API参考》,SDK集成请参考API Explorer中的“代码示例”。 父主题: API和SDK使用
为华为云客户应用提供数字人智能交互服务,如果您只使用部分SDK功能,则可以根据实际功能进行裁剪 SDK隐私声明 三、权限使用要求 我们SDK在提供服务时会最小化的使用系统权限,您需要根据实际使用的功能申请对应的系统权限并向用户告知征得其同意。 权限 权限描述 使用目的 获取麦克风权限 获取浏览器的麦克风设备权限
声音模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 视频制作 使用系统预置或自定义生成的数字人形象、声音,制作音视频内容。 制作的视频可应用于教学、培训等各类场景中。 视频直播 使用系统预置或自定义的数字人形象、声音,制作音视频直播内容。 可通过下述方式,在直播平台开播。