检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
手机录制音频 请根据手机类型,执行相应操作: 苹果手机操作 安卓手机 苹果手机操作 苹果手机推荐下载软件“简易录音机(Easy Voice Recorder)”进行录音,如图1所示。 图1 简易录音机 音频录制说明,如表1所示。 表1 音频录制说明 音频录制 说明 采样率 推荐使用48kHz采样率录制音频。
控制数字人驱动 功能介绍 该接口用于控制数字人驱动。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/video-motion-capture-jobs/{job_id}/command 表1 路径参数 参数 是否必选 参数类型 描述 project_id
控制数字人直播过程 功能介绍 该接口用于控制数字人直播过程。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/smart-live-rooms/{room_id}/smart-live-jobs/{job_id}/command 表1 路径参数
直播控制HTTP Command命令说明 分身数字人直播过程中,支持通过HTTP API的方式人工接管直播。人工接管以后,支持通过下述方式驱动数字人说话: 文本驱动方式:对应Command命令为“INSERT_PLAY_SCRIPT”,即插入表演脚本,用于互动回复。数字人不变时,
如何在MetaStudio控制台呈现PPT的动画效果? 在视频制作界面导入的PPT,不支持展示动画、视频、动图等动态元素。如需展示动态效果,需将PPT导出为视频后,再上传至MetaStudio控制台使用。 PPT转视频的操作方法,如下所示: 本地打开PPT文件,在左上方的导航栏中,选择“文件
直播控制RTSA Command命令说明 直播控制RTSA Command命令详细说明,如下所示: 数字人直播状态变化图 RTSA Command定义 数字人直播状态变化图 数字人直播状态变化流程图,如图1所示。 图1 直播状态变化流程图 流程图说明,如下所示: PREPROCE
第三方平台的直播画面不清晰怎么办? 如果用户在第三方直播平台的直播画面不清晰,需排查是否是下述原因导致: 电脑是否有独立显卡。 OBS视频采集工具的基础分辨率配置是否与输出分辨率一致。 检查独立显卡 用户使用的第三方直播平台所在电脑,必须装有独立显卡。 检查OBS视频分辨率配置 OBS视频采集工具的基础分辨率和输出分辨率的值需要保持一致。
录音文案 基础版 优先使用专业录音设备录制音频,推荐使用Adobe Audition软件进行录音。 如果不具备专业录音设备,可使用手机录制音频,详情请参见手机录制音频。 录音环境安静,无回音、混响、噪声,避免出现汽车鸣笛、他人说话、走动等杂声。 可使用“分贝仪”应用来测试录音环境的底噪,建议底噪低于0dB。
第三方平台的直播画面不清晰怎么办? 如果用户在第三方直播平台的直播画面不清晰,需排查是否是下述原因导致: 电脑是否有独立显卡。 OBS视频采集工具的基础分辨率配置是否与输出分辨率一致。 检查独立显卡 用户使用的第三方直播平台所在电脑,必须装有独立显卡。 检查OBS视频分辨率配置 OBS视频采集工具的基础分辨率和输出分辨率的值需要保持一致。
第三方平台的直播画面突然中断是怎么回事? 可能是MetaStudio控制台自动退出登录导致。 排查和修改方法,如下所示: 在MetaStudio控制台直播间开播成功时,需要参考图1,单击URL地址右侧的拦截图标,从下拉框中选择允许弹出窗口。 图1 直播间开播 单击“完成”,会新增弹出如图2和图3所示的2个浏览器窗口。
拍摄流程 支持手机或相机拍摄,需1080P或更高分辨率。 录制时长为2分钟,包含15秒静默转态和1分45秒的演讲过程。 允许使用中文、英文录制。 录制全程眼睛需注视镜头,周围环境保持安静,脸部光照明亮且均匀。 拍摄完成后不要剪辑,整个视频一起上传至MetaStudio控制台。 注意事项
Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能,可以帮助您安全地控制资源地访问。 通过IAM,您可以在账号中给员工创建IAM用户,并授权控制他们对资源的访问范围。例如您的员工中有负责软件开发的人员,您希望他们拥有MetaStud
账户充值:为确保正常使用MetaStudio,您需要进行账户充值。 开通MetaStudio服务:单击进入MetaStudio控制台,根据开通引导完成服务开通。 推荐浏览器 推荐使用Chrome浏览器访问MetaStudio控制台。
户使用。 使用限制 SP用户仅对大客户开放申请和使用。 SP用户不支持自己使用购买的资源包。 SP用户不支持访问MetaStudio控制台,进行控制台操作。 操作步骤 注册华为账号:单击进入注册页面。 完成实名认证:单击进入实名认证。 获取所在Region的项目ID,操作方法如获取项目ID所示。
管理资产 支持在MetaStudio控制台管理资产,包括查询、重命名、激活/取消激活、查看详情、编辑、删除、恢复等操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,选择“我的创作 > 资源”,如图1所示。 图1 资产 支持管理资产,详细操作如表1所示。 图2 资产详情
查询音色ID 支持在MetaStudio控制台或通过API接口查询音色ID,详情如下所示: 在控制台查询音色ID(方式一):仅支持查询自定义音色ID。 在控制台查询音色ID(方式二):支持查询全量音色ID。 使用接口查询音色ID:支持查询全量音色ID。 在控制台查询音色ID(方式一) 当前
庭保洁工作,而无需担心电量问题。 53. 同时,智能机器人还支持声控和远程控制。 54. 您可以通过语音指令来控制机器人的运行,也可以通过手机应用程序来进行远程控制。 55. 这意味着您可以随时随地调整或控制机器人的运行,以满足您的需求。 56. 最后,智能机器人有多种清洁模式可供选择。
Language)来控制数字人的行为,包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。MetaStudio在此基础上,扩展了一些字段用于实现数字人的控制。 MetaStudio SSML当前支持如下能力: TTS语音合成时,控制文字读音。
场景说明 智能交互包含如下场景: 场景一:用户开箱即用的智能交互数字人场景。 在MetaStudio控制台完成交互配置,包括LLM或者大模型配置,通过Web页面浏览,无需开发。 图1 智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交
用户资产如下所示: 一类是使用MetaStudio控制台功能生成的,如下所示: 用户在控制台进行形象制作,生成的数字人形象,会展示在“我的创作 > 分身形象”页面。 用户在控制台进行声音制作,生成的声音,会展示在“我的创作 > 声音”页面。 用户在控制台进行视频制作,合成的视频,会展示在“我的创作