正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
域间的资源(计算资源、存储资源和网络资源),以默认项目为单位进行授权,用户可以访问您账号中该区域的所有资源。如果您希望进行更加精细的权限控制,可以在区域默认的项目中创建子项目,并在子项目中购买资源,然后以子项目为单位进行授权,使得用户仅能访问特定子项目中资源,使得资源的权限控制更加精确。
播画面中。 在左侧的“文本设置”界面,设置文本内容和字体样式,如图7所示。 在视频直播画面预览区域,如果存在多种视频直播素材,支持对文本进行图层管理,如:上移一层、下移一层、置顶、置底、复制、应用到全局、删除等。还支持设置大小,拖动位置。 图7 文本设置 父主题: 视频直播
1~5分钟的真人实景拍摄视频,详见Flexus分身数字人形象采集指南。 身份证正反面照片。 形象授权签署文件,如授权书所示。 操作步骤 登录MetaStudio控制台。 单击“Flexus分身数字人”,进入Flexus分身数字人流程介绍页面,如图1所示。 请认真阅读界面上方的规范和避免出现的问题,并仔细观看下方的形象拍摄视频。
状态,都会决定数字人最终呈现时的姿态和动作。因此,我们希望模特在拍摄时尽可能保持自然,按照平时说话和表达的习惯进行录制。 为保证数字人的训练效果,请按照我们提供的流程进行录制,请根据实际需求评估录制流程: 不需要交互:15-30秒静默 + 4-5分钟演讲。 需要交互:15秒静默 +
新推送资产给当前租户。 声音和分身模型资产的接收、激活操作均相同,下面以分身模型资产的接收、激活操作为例演示。 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“资源”页签,如图1所示。 图1 资源页面 单击界面右上方的图标,进入“接收资产管理”页面,如图2所示。
新推送资产给当前租户。 声音和分身模型资产的接收、激活操作均相同,下面以分身模型资产的接收、激活操作为例演示。 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“资源”页签,如图1所示。 图1 资源页面 单击界面右上方的图标,进入“接收资产管理”页面,如图2所示。
客户声音制作案例 单击声音样例.zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav
产品优势 控制台自助服务,一站式快速生成所需内容 用户申请账号并上传相关授权,拍摄训练所需音视频素材,上传进行模型训练,生成自定义形象和声音。选择背景、声音、模特等内容,基于文本或语音智能驱动,实现视频制作、视频直播、智能交互等能力。 华为云盘古数字人大模型,赋能千行百业数字化营销新模式
输入命令行ffmpeg后可以显示版本号,说明安装成功。 解决方法 通过剪映或者ffmpeg可以将H265(HEVC)视频的格式转码为H264,再上传至MetaStudio控制台,进行形象制作。 以ffmpeg为例,输入命令行:ffmpeg -i 视频文件名 -c:v libx264 output.mp4。示例: ffmpeg
支持上传正面清晰的人像照片,生成会说话的照片数字人视频。 操作限制 照片数字人视频制作限制,如照片数字人限制所示。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“照片数字人”,进入照片数字人制作页面,如图1所示。 界面左侧展示配置项,右侧展示预览效果。配置操作,请参考表1。
本根节点。 <break/>标签用于静音停顿,可设置停顿时长。 <phoneme></phoneme>标签,用于标记多音字发音。 <say-as></say-as>标签用于指定数字或英文的读法。 <sub></sub>标签用于设置当前标记文字的别名,即替代读法。 <prosody
示例1:创建视觉驱动 若您需要进行数字人视觉驱动,可以通过API调用的方式创建视觉驱动任务。 前提条件 已获取需要使用MetaStudio服务的终端节点。 已获取需要创建视觉驱动所在区域的项目ID,具体获取方法请参见获取项目ID。 总体流程 获取用户Token 启动数字人视觉驱动
单击“管理技能配置”,在弹出的“配置应用需要的技能”对话框中,设置需要的系统预置技能,如图7所示。 示例:可以开启“生活”分类中的“天气”技能,这样用户就可以提问天气相关的问题。启用这类预置技能,可以支持用户进行闲聊。 图7 系统预置技能 全部设置完成后,单击对话框右上角的“保存配置”。 开启讯飞的闲聊功能。
SDK概述 数字人智能交互SDK是基于数字内容生产线服务提供的能力进行封装,以简化用户的开发工作。用户直接调用智能交互Web SDK提供的接口,即可实现使用数字人智能交互业务能力的目的。 智能交互提供了如下主流平台SDK供开发者使用。 表1 客户端SDK 客户端 集成SDK 接口参考
第三方平台开播指南 视频直播支持对接淘宝、抖音、拼多多等第三方平台进行直播,相关操作请提交工单或联系客户经理获取。 常见问题 第三方直播平台直播画面不清晰怎么办? 第三方平台直播画面突然中断是怎么回事? 父主题: 附录
方声音使用。 为数字人配音。 视频制作 使用数字人形象,设置画布、音频,合成视频。 适用于各类培训、宣讲、知识分享等场景。 视频直播 使用数字人形象,设置画布、剧本、互动和开播配置,生成直播视频。 可在合作的第三方平台进行数字人视频直播,如淘宝、拼多多、抖音等。 智能交互 包含下述功能实现场景:
193. 安全和隐私设置:您可以根据自己的需求对隐私设置进行个性化调整。 194. 例如,您可以设置是否允许机器人记录语音指令、保存个人信息等。 195. 总的来说,家用机器人的个性化定制可以从外观设计、语音助手设置、偏好设置、等多个方面进行。 196. 这些定制化的设置可以满足您和家
基于图片URL创建照片建模任务 功能介绍 该接口用于从URL中获取图片进行照片建模任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human/stylized/picture-modelings-by-url 表1 路径参数
单击“管理技能配置”,在弹出的“配置应用需要的技能”对话框中,设置需要的系统预置技能,如图13所示。 示例:可以开启“生活”分类中的“天气”技能,这样用户就可以提问天气相关的问题。启用这类预置技能,可以支持用户进行闲聊。 图13 系统预置技能 全部设置完成后,单击对话框右上角的“保存配置”。 开启讯飞的闲聊功能。
关联租户提供的项目ID对应Region,必须与SP用户申请成为SP用户时,提供的项目ID对应Region保持一致。 操作步骤 登录MetaStudio控制台,如图1所示。 图1 控制台页面 在左侧导航栏中,选择“租户管理”,进入“租户列表”页面。 单击“关联租户”,进入“关联租户”页面,如图2所示。 参数说明如下所示: