检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
客户声音制作案例 单击声音样例.zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav
查看名片 如果用户需要查看已生成的分身数字人名片,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“分身名片”页签,如图1所示。 在“分身名片”页面,可以看到已生成的名片列表,以卡片形式排列展示。 支持对名片进行如下操作: 单击
智能交互限制 智能交互对硬件设备的最低配置要求,如表1所示。 表1 硬件设备要求 硬盘配置 最低配置 CPU i5及以上版本。 内存 8G以上。 硬盘 128G及以上。 操作系统 Windows或Android系统。 麦克风 需要有麦克风,且要保障1米以内的拾音效果。 扬声器 需要有扬声器
制作名片 用户可以为分身数字人制作形象名片,且支持试听和查看数字人语音表达效果。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身数字人名片制作”,弹出“请选择您要使用的名片模板”对话框,如图1所示。 服务提供了名片模板,用户可以基于模板制作名片。 图1 选择名片模板
直播业务媒体流如何应对防火墙限制? 分身数字人直播业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,防火墙需要放开如下限制: 解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单
视频制作界面说明 用户启动制作视频时,可以先了解下视频制作界面详情。 视频制作界面如图1所示。各区域详细说明,如表1所示。 用户使用数字人形象创作的视频,都会自动保存在MetaStudio控制台首页“最近项目”区域的“视频项目”页签中。用户可以根据实际情况,进行二次创作。 图1 视频制作界面
常用概念 数字人 数字人是一种以数字形式存在于数字空间中的虚拟人物,它具有拟人或真人的外貌、行为特点,并具备一定的智能和情感,可以进行交互和表达。数字人也可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等
快速入门 环境要求 Web SDK运行环境要求,如表1所示。 表1 环境要求 环境项 使用限制 开发工具 Microsoft Visual Studio Code、WebStorm或其他Web IDE开发工具。 语言 Javascript或Typescript。 编译环境 建议Node
智能交互支持富媒体吗? 支持的富媒体格式 用户与数字人进行智能交互问答时,支持展示如下格式的富媒体: 图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体。以奇妙问知识库为例,参考新增知识库,补充富媒体知识,示例如表1所示。 如果使用服务提供
拍摄真人视频 您好!欢迎使用华为云数字人服务,本指南将协助您完成分身数字人形象的采集工作。 请注意,分身数字人形象制作的效果与您的录制效果有较大关联,为了获取更好的数字人效果,我们建议您使用以下标准进行拍摄。 以下是数字人拍摄标准概览,但是我们也建议您详细阅读每一块具体内容: 拍摄规格
修订记录 表1 修订记录 修改时间 修改说明 2024-12-30 第十四次正式发布 本次变更如下: 语音合成管理接口组,新增接口:设置TTS租户级自定义读法配置、获取TTS租户级自定义读法配置、删除TTS租户级自定义读法配置、修改TTS租户级自定义读法配置。 2024-12-05
更新智能直播间互动规则库 功能介绍 该接口用于更新智能直播间互动规则库。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/smart-live-interaction-rule-groups/{group_id} 表1 路径参数 参数 是否必选
创建智能直播间互动规则库 功能介绍 该接口用于创建智能直播间互动规则库。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/smart-live-interaction-rule-groups 表1 路径参数 参数 是否必选 参数类型 描述 project_id
查询智能直播间互动规则库列表 功能介绍 该接口用于智能直播间互动规则库列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/smart-live-interaction-rule-groups 表1 路径参数 参数 是否必选 参数类型 描述 project_id
新闻播报风格文案 我国是世界上首个国内发明专利有效量超三百万件的国家, 我国发明专利有效量已位居世界第一。 截至二零二二年底,高价值发明专利拥有量达到一百三十二点四万件, 占发明专利有效量的比重超过四成。 我国正在从知识产权引进大国向知识产权创造大国转变, 知识产权工作正在从追求数量向提高质量转变
查询音色ID 支持在MetaStudio控制台或通过API接口查询音色ID,详情如下所示: 在控制台查询音色ID(方式一):仅支持查询自定义音色ID。 在控制台查询音色ID(方式二):支持查询全量音色ID。 使用接口查询音色ID:支持查询全量音色ID。 在控制台查询音色ID(方式一
使用前必读 数字内容生产线(MetaStudio)解决方案,提供数字人视频与直播、智能交互等服务,使能千行百业场景应用。 您可以使用本文档提供的API对华为云MetaStudio服务进行相关操作,如形象制作、声音制作、视频制作等。支持的全部操作请参见API概览。 在调用华为云MetaStudio
稿二:数字人形象采集指南 大家好,今天我很高兴能来到这里进行数字人形象和声音的采集。接下来,我将和大家一起复盘一下数字人的形象拍摄要求。 第一步,我们需要在拍摄前检查自己的穿着,在绿幕的拍摄环境下,不能穿绿色或者透明的衣服、也不要穿含有密集条纹的衣服。我们需要确保面部没有零散的发丝
权限管理 如果您需要对购买的MetaStudio资源,给企业中的员工设置不同的访问权限,以达到不同员工之间的权限隔离,您可以使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能
视频制作 用户可以使用MetaStudio控制台首页的“分身视频制作”功能,制作数字人视频。 操作前准备 如果系统预置形象不满足要求,请参考形象制作,提前定制符合要求的分身数字人形象。 操作限制 MetaStudio控制台预置形象的有效使用期为3年,在2027年的年中前可放心使用。