检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
dio服务处理。 详细操作如下所示: 访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。
窗口捕获方式开播。 智能交互 对接第三方大脑,通过数字人交互的方式与用户进行问答。场景应用广泛,包括智能导购、文旅导览、智能问答、营业厅客服等。 注意: 数字人回答的内容,是由对接的第三方大模型或知识库返回的答案决定的。 资产管理 支持从本地上传模型、PPT、动画、素材、视频、场景、图片、音乐等资产。
大客户可以提交工单,或者联系大客户经理,并提供已获取的项目ID,申请开通SP模式。 获取项目ID 登录MetaStudio控制台。 将鼠标移至界面右上方的用户名称位置,在弹出的下拉框中选择“我的凭证”。 进入“我的凭证 > API凭证”页面,如图1所示。 图1 项目列表 父主题: SP用户
是 Integer 参数解释: 图层左上角像素点的X轴位置值(画布左上角坐标是0x0)。 横屏(16:9)画布像素为1920x1080;竖屏(9:16)画布像素为1080x1920。 约束限制: 该值为相对于画布的像素值,仅表示布局位置关系,与输出画面分辨率无关。 取值范围: -1920-3840
从下拉框中选择“奇妙问”。 应用名称 设置当前智能交互数字人应用的名称。 账号 注册奇妙问的账号,即用户的手机号。 APPSECRET 用户在奇妙问创建角色的AppSecret。 RoleId 用户在奇妙问创建角色的RoleId。 对话内容合规审核 开启后,自动审核用户提问内容。
输入分身数字人的角色名称。 示例:云笙。 训练视频 从本地上传已录制好,且符合拍摄要求的人像视频。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄,人物须保持竖直。支持MP4、MOV格式的视频。 背景替换
MetaStudio直播功能的主要作用是生成数字人直播的音视频内容,并非直播平台。 可以通过下述2种方式在第三方平台开播: 窗口捕获方式开播:MetaStudio直播返回的窗口可供第三方直播平台(淘宝、抖音、拼多多等)抓取用于开播。 RTMP推流:即RTMP直推(华为云服务器直接把画面传到直
制过程中,每句之间有2~3秒的停顿。 其中,进阶版和高品质声音制作需要更多语料,训练时长更长,声音效果更佳。 请完善声音信息 输入声音名称。 示例:欢快女声。 须知: 声音训练完成后,可以在“我的创作 > 声音”页面,找到训练好的声音卡片,单击右下角的图标,从下拉框中选择“重命名”,修改声音名称。
使用本接口前,需要在MetaStudio控制台服务概览页面,开通“声音合成”的按需计费。 详细操作为:单击“声音合成”卡片中的“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。开通后的效果如图1所示。 如需使用第三方声音进行语音合成,请购买出门问问声音套餐。
是 Integer 参数解释: 图层左上角像素点的X轴位置值(画布左上角坐标是0x0)。 横屏(16:9)画布像素为1920x1080;竖屏(9:16)画布像素为1080x1920。 约束限制: 该值为相对于画布的像素值,仅表示布局位置关系,与输出画面分辨率无关。 取值范围: -1920-3840
常用概念 数字人 数字人是一种以数字形式存在于数字空间中的虚拟人物,它具有拟人或真人的外貌、行为特点,并具备一定的智能和情感,可以进行交互和表达。数字人也可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。
dx Integer 参数解释: 图层左上角像素点的X轴位置值(画布左上角坐标是0x0)。 横屏(16:9)画布像素为1920x1080;竖屏(9:16)画布像素为1080x1920。 约束限制: 该值为相对于画布的像素值,仅表示布局位置关系,与输出画面分辨率无关。 取值范围: -1920-3840
dx Integer 参数解释: 图层左上角像素点的X轴位置值(画布左上角坐标是0x0)。 横屏(16:9)画布像素为1920x1080;竖屏(9:16)画布像素为1080x1920。 约束限制: 该值为相对于画布的像素值,仅表示布局位置关系,与输出画面分辨率无关。 取值范围: -1920-3840
华为云盘古数字人大模型,赋能千行百业数字化营销新模式 MetaStudio服务依托华为云基础设施、海量算力(CPU/GPU/NPU)、全球一张网(算网融合、超低时延),通过华为云盘古数字人大模型,训练生成数字人、数字物、数字空间,实现数字人视频制作、直播、智能交互和数字人IP代言等场景。
大家好,今天我很高兴能来到这里进行数字人形象和声音的采集。接下来,我将和大家一起复盘一下数字人的形象拍摄要求。 第一步,我们需要在拍摄前检查自己的穿着,在绿幕的拍摄环境下,不能穿绿色或者透明的衣服、也不要穿含有密集条纹的衣服。我们需要确保面部没有零散的发丝,尽量不要佩戴眼镜或者项链、耳环、手
参数解释: 字体。当前支持的字体请参考服务支持的字体 约束限制: 不涉及。 取值范围: 字符长度0-64位 默认取值: HarmonyOS_Sans_SC_Black font_size Integer 参数解释: 字体大小。接口的取值范围为0-120,实际业务使用的取值范围要求为24-120,请以业务实际使用要求为准。
选择“换气”或者停顿的时间,也支持自定义停顿时长。 连读 选中需要连读的文本内容,单击“连读”。 多音字 选中文本中的多音字,单击“多音字”,在弹出的提示框中,选择正确的发音或者自定义发音。 须知: 这里设置的多音字,仅对当前视频制作剧本有效,如需全局生效,可参考配置特殊词表配置。
是 Integer 参数解释: 图层左上角像素点的X轴位置值(画布左上角坐标是0x0)。 横屏(16:9)画布像素为1920x1080;竖屏(9:16)画布像素为1080x1920。 约束限制: 该值为相对于画布的像素值,仅表示布局位置关系,与输出画面分辨率无关。 取值范围: -1920-3840
购买出门问问声音套餐, 详见购买出门问问语音合成套餐的操作流程。 购买出门问问语音合成套餐的操作流程 如需使用系统预置的第三方声音,需要购买出门问问语音合成套餐包,详细的操作流程如下所示。第三方声音支持的语言类型,如第三方声音支持的语言类型所示。 购买出门问问语音合成套餐包:在云商
在服务主界面,单击左侧导航栏中的“任务中心”。 查看“分身数字人”页签的数字人定制任务列表,找到被驳回的数字人定制任务。 任务状态为“审核未通过”。 单击任务右侧的“查看原因”,在弹出的“审核未通过”对话框中,查看审核未通过的原因。 按照规范重新录制或提供符合规范的视频。 单击任务右侧的“重新上传”,上传更新后的视频。