检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何集成MetaStudio服务? MetaStudio支持通过API方式被集成使用,详见API参考、SDK参考和应用示例。具体对接事宜,可以联系客户经理处理。 如需商务对接,请提供企业名、企业所在地域、联系方式等信息,简要说明需要集成MetaStudio的能力和用途,然后提交工单处理。
登录MetaStudio控制台。 在左侧导航栏中,选择“我的创作”。 选择“资源”页签,单击“声音”页签。 单击需要使用的声音卡片,进入“声音详情”界面。 这里的“资产编号”即语音同步合成WebSocket接口需要使用的音色ID。 图1 声音详情界面 在控制台查询音色ID(方式二) 支持在MetaStudi
家用机器人,是一款集合了众多顶尖科技的全新智能设备。 它不仅拥有出色的功能,还具备卓越的性能。 让您可以轻松体验畅快无比的运行速度和极致的使用感受。 这款家用机器人具备稳定的电力供应和支持系统。 这款家用机器人还具备精细化的动作控制与执行能力。 无论是行走、搬运物品还是执行其他动作,机器人都能轻松应对。
从本地上传已录制好,且符合拍摄要求的人像视频。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄,人物须保持竖直。支持MP4、MOV格式的视频。 背景替换 选择“抠除拍摄背景”,制作分身数字人视频时,可以替换背景。 身份认证及授权数据上传
如何将WEBM视频转成MOV格式? 问题描述 视频制作时,如果使用透明背景合成视频,导出时仅支持生成WEBM格式视频。而常用的视频工具剪映、Premiere Pro等,不支持WEBM格式,需要先参考本节转为MOV格式。 解决方法 单击webm2mov,将视频格式转换小工具webm2mov_20240814
租户操作 SP关联租户,并为租户分配资源后,租户可以在MetaStudio控制台查看已分配的资源列表,正常使用MetaStudio服务并消耗相应的资源。 前提条件 SP用户已关联当前租户,操作请参考关联租户。 SP用户已分配资源给当前租户,操作请参考分配资源。 操作步骤 租户登录
脑(即第三方LLM)。当用户与数字人对话时,将触发调用该接口,由该接口返回问题对应的答案文本内容。 签名计算方法 第三方LLM自定义接口,使用HMACSHA256签名模式,需要在URL中追加参数“secret”和“time_stamp”。 取值方式为:secret=hmac_sha256(URI(llm_url)
如果已开通按需,且直播并发路数超出套餐,那么超出套餐的路数自动走按需结算,费用从当前账户余额中扣除结算费用。 须知:按需计费开通后,目前不支持关闭,请谨慎确认后再开通使用。 父主题: 计费咨询
数字人定制任务提交成功后,会在1个工作日内完成审核。任务审核通过后,才能进行算法训练,会在3个工作日内训练完成并生成数字人。 Flexus分身数字人 数字人定制任务提交成功后,会在1个工作日内完成审核。任务审核通过后,才能进行算法训练,会在3个工作日内训练完成并生成数字人。 父主题: 声音和形象制作
直接上传,无需压缩,无需携带文案txt文件。 如果未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景。 请选择声音性别 声音的性别,用于匹配声音模型的精准度。 如下所示: 男生 女生 请选择原始输入语言 上传语料所使用的语言。 包含19种语言:中文、英文、粤语、德语、法语
ResourcePath): Promise<void> 【功能说明】 初始化语音唤醒资源,不使用语音唤醒能力则忽略该接口。 3.0.1之后的websdk包里面有如下两个资源文件,如果不使用语音唤醒,可忽略这两个文件。 wasmData.js:语音唤醒的算法资源文件。 modelData
智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交互服务定义的API接口结构,自主开发第三方语言模型API,对接第三方语言模型到智能交互服务,实现智能交互能力。操作请参考创建智能交互数字人(第三方语言模型)。 场景三:用户使用智能交互API或SDK,自主开发实现与数字人对话场景。
关联租户 SP用户可以将购买的资源分配给多个租户使用。分配资源前,需先参考本节,关联所有租户。 前提条件 关联租户已注册华为账号:单击进入注册页面。 关联租户已完成实名认证:单击进入实名认证。 关联租户提供项目ID给SP用户,获取项目ID的方法请参见获取项目ID。 关联租户提供的
Refresh the page. 请使用正确的任务ID查询或联系技术支持 MSS.47010066 Frequently asked question does not exist. No action is required. 请使用正确的热点问题ID查询或检查是否正确配置热点问题
直播业务媒体流如何应对防火墙限制? 分身数字人直播业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,防火墙需要放开如下限制: 解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。
如果用户在第三方直播平台的直播画面不清晰,需排查是否是下述原因导致: 电脑是否有独立显卡。 OBS视频采集工具的基础分辨率配置是否与输出分辨率一致。 检查独立显卡 用户使用的第三方直播平台所在电脑,必须装有独立显卡。 检查OBS视频分辨率配置 OBS视频采集工具的基础分辨率和输出分辨率的值需要保持一致。 检查方法如下所示:
请完善声音信息 输入声音名称,示例:欢快女声。 请制作声音 使用“语料上传”的方式,直接上传一个已录制好的长音频WAV或MP3文件,无需压缩,无需携带文案txt文件。 请选择声音性别 选择声音的性别,示例:女生。 原始输入语言 选择上传语料所使用的语言,示例:中文。 选择声音标签 声音的标签。
方法一:通过剪映将H265(HEVC)视频的格式转码为H264,再上传至MetaStudio控制台,进行形象制作。 详细操作如下所示: 方法二:通过ffmpeg将H265(HEVC)视频的格式转码为H264,再上传至MetaStudio控制台,进行形象制作。 详细操作如下所示: 输入命令行:ffmpeg -i 视频文件名
如果用户在第三方直播平台的直播画面不清晰,需排查是否是下述原因导致: 电脑是否有独立显卡。 OBS视频采集工具的基础分辨率配置是否与输出分辨率一致。 检查独立显卡 用户使用的第三方直播平台所在电脑,必须装有独立显卡。 检查OBS视频分辨率配置 OBS视频采集工具的基础分辨率和输出分辨率的值需要保持一致。 检查方法如下所示:
exus声音。 录制的视频时长1~5分钟,建议2分钟,分辨率需≥1080P(4K最佳),宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄。支持MP4、MOV格式的视频,推荐MP4格式。 训练生成的分身数字人形象与真人形象完全相同。 声音制作语料类型 Flexus分身