检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
营销宣传风格文案 1. 掌握未来,尽在眼前——揭开全新智能科技产品的神秘面纱 2. 在这个快速变化的世界里,技术已经成为我们生活中不可或缺的重要元素。 3. 它不断推动着我们的社会进步,改变着我们的生活方式。 4. 而现在,一个引领科技浪潮,凝聚了众多顶尖科技的全新智能产品即将横空出世!
营销宣传风格文案 掌握未来,尽在眼前——揭开全新智能科技产品的神秘面纱 在这个快速变化的世界里,技术已经成为我们生活中不可或缺的重要元素。 它不断推动着我们的社会进步,改变着我们的生活方式。 现在,一个引领科技浪潮,凝聚了众多顶尖科技的智能产品即将横空出世! 家用机器人,是一款集合了众多顶尖科技的全新智能设备。
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。
客户声音制作案例 单击声音样例.zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav
常用概念 数字人 数字人是一种以数字形式存在于数字空间中的虚拟人物,它具有拟人或真人的外貌、行为特点,并具备一定的智能和情感,可以进行交互和表达。数字人也可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。
更新智能直播间互动规则库 功能介绍 该接口用于更新智能直播间互动规则库。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/smart-live-interaction-rule-groups/{group_id} 表1 路径参数 参数 是否必选
新闻播报风格文案 我国是世界上首个国内发明专利有效量超三百万件的国家, 我国发明专利有效量已位居世界第一。 截至二零二二年底,高价值发明专利拥有量达到一百三十二点四万件, 占发明专利有效量的比重超过四成。 我国正在从知识产权引进大国向知识产权创造大国转变, 知识产权工作正在从追求数量向提高质量转变。
认证鉴权 调用接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。推荐使用AK/SK认证,其安全性比Token认证要高。 Token认证:通过Token认证调用请求。
文本驱动SSML定义 MetaStudio语音驱动采用语音合成标记语言(SSML,Speech Synthesis Markup Language)来控制数字人的行为,包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。Meta
智能交互设置 直播间页面支持弹幕规则使用“智能交互”的方式,去回复直播间用户的提问。智能交互的方式相当于提供了一个第三方语言模型去答复用户问题。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 在“
查看租户资源用量信息 功能介绍 查询租户一次性和包周期(包年/包月)资源用量信息。 按需套餐包用量本接口无法查询,需要调用CBC接口查询。按需套餐包用量查询和查询资源包信息。 各种资源的计费方式请参考计费说明。 调用方法 请参见如何调用API。 URI GET /v1/{proj
创建知识库技能 功能介绍 该接口用于创建知识库技能。一个技能用于特定场景的交互问答,包含若干个意图等。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/knowledge/skill 表1 路径参数 参数
统计时间段内过期的资源数量 功能介绍 统计指定时间段内即将过期的包周期与一次性资源数量。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/tenants/resources-count 表1 路径参数 参数 是否必选 参数类型 描述 project_id
场景说明 智能交互包含如下场景: 场景一:用户开箱即用的智能交互数字人场景。 在MetaStudio控制台完成交互配置,包括LLM或者大模型配置,通过Web页面浏览,无需开发。 图1 智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交
第三方平台的直播画面突然中断是怎么回事? 可能是MetaStudio控制台自动退出登录导致。 排查和修改方法,如下所示: 在MetaStudio控制台直播间开播成功时,需要参考图1,单击URL地址右侧的拦截图标,从下拉框中选择允许弹出窗口。 图1 直播间开播 单击“完成”,会新增弹出如图2和图3所示的2个浏览器窗口。
产品优势 控制台自助服务,一站式快速生成所需内容 用户申请账号并上传相关授权,拍摄训练所需音视频素材,上传进行模型训练,生成自定义形象和声音。选择背景、声音、模特等内容,基于文本或语音智能驱动,实现视频制作、视频直播、智能交互等能力。 华为云盘古数字人大模型,赋能千行百业数字化营销新模式
区域和可用区 什么是区域、可用区? 区域和可用区用来描述数据中心的位置,您可以在特定的区域、可用区创建资源。 区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Re
第三方平台的直播画面突然中断是怎么回事? 可能是MetaStudio控制台自动退出登录导致。 排查和修改方法,如下所示: 在MetaStudio控制台直播间开播成功时,需要参考图1,单击URL地址右侧的拦截图标,从下拉框中选择允许弹出窗口。 图1 直播间开播 单击“完成”,会新增弹出如图2和图3所示的2个浏览器窗口。
创建智能直播间互动规则库 功能介绍 该接口用于创建智能直播间互动规则库。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/smart-live-interaction-rule-groups 表1 路径参数 参数 是否必选 参数类型 描述 project_id