检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
语音同步合成WebSocket接口 前提条件 本接口目前仅支持“华北-北京四”和“华东-上海一”区域使用,且必须提交工单申请开通后才能使用。 使用本接口前,需要在MetaStudio控制台服务概览页面,开通“声音合成”的按需计费。 详细操作为:单击“声音合成”卡片中的“去开通”,
音色ID,详情如下所示: 在控制台查询音色ID(方式一):仅支持查询自定义音色ID。 在控制台查询音色ID(方式二):支持查询全量音色ID。 使用接口查询音色ID(方式三):支持查询全量音色ID。 在控制台查询音色ID(方式一) 当前方式仅支持查询用户自定义音色ID,不支持查询系统预置音色ID。
产线 MetaStudio”服务,进入MetaStudio服务概览页面,如图1所示。 图1 服务概览页面 MetaStudio服务概览页面一共包含3块区域,详细说明如下所示: 服务介绍 我的资源(租户) 我的资源(SP用户) 快速指南 服务介绍 界面最上方提供MetaStudio服务介绍和下述操作入口:
MetaStudio控制台超过10分钟不操作,默认会退出登录,导致第三方直播平台的直播画面也中断。需要确保图3的窗口始终是打开的,直播过程中一定不能关闭,这样第三方直播平台的直播才能顺利完成。 图2 直播窗口 图3 确保直播过程不中断的窗口 父主题: 视频直播
域。 在界面右侧,选择“对话配置”页签,如图1所示。 配置说明如下所示,其他配置请参见智能交互。 语言:支持同时添加中文和英文,并设置其中一种语言为默认语言。 在数字人智能交互界面,自动展示默认语言,并用默认语言与用户进行问答。可通过界面右上方的语言切换图标,切换语言。 声音:单击声音右侧的图标,切换数字人声音。
涉黄、涉赌、涉毒、涉诈、侵权内容 盗版游戏/软件/盗版视频 P2P类金融诈骗信息 彩票类信息 违规医院和药品类信息 无法正常访问或内容不含有任何实质信息 可第一时间拨打华为云电话、提交工单,或者直接在举报中心举报违规内容。我们收到用户反馈后,会立即响应处理,共同维护合法合规的安全环境。 父主题: 产品咨询
等待视频格式转换完成。请注意,视频格式转换过程中,一定不能关闭如图2所示的2个窗口。 图2 工具运行界面 视频转换过程中,工具的同级目录下面会出现一些过程文件,请勿移动或删除,待视频格式转换完成后,会自动删除。 图3 工具目录 视频格式转换完成后,WEBM视频文件的同级目录下面会生成一个同名带时间戳的MOV文件。
仅回复一条文本内容。 示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。
语音合成管理 创建TTS试听任务 获取TTS试听文件 创建TTS异步任务 获取TTS异步任务 设置TTS租户级自定义读法配置 获取TTS租户级自定义读法配置 删除TTS租户级自定义读法配置 修改TTS租户级自定义读法配置 语音同步合成WebSocket接口
视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作: 单击商品所在行的“查看”,进入商品详情界面,支持单击“编辑”,修改商品信息。 单击商品所在行的“编辑”,
建”,进入分身数字人直播首页面。 单击“直播任务管理”,进入如直播任务管理所示的页面。 可以看到用户创建的所有直播间的开播任务列表。如果同一个直播间,开播多次,则生成对应个数的开播任务。 可以查看任务ID、直播名称、封面、创建时间、开播时间、结束时间和当前的直播状态(直播中或直播结束)。
涉黄、涉赌、涉毒、涉诈、侵权内容 盗版游戏/软件/盗版视频 P2P类金融诈骗信息 彩票类信息 违规医院和药品类信息 无法正常访问或内容不含有任何实质信息 可第一时间拨打华为云电话、提交工单,或者直接在举报中心举报违规内容。我们收到用户反馈后,会立即响应处理,共同维护合法合规的安全环境。 父主题: FAQ
资产范围说明 用户资产如下所示: 一类是使用MetaStudio控制台功能生成的,如下所示: 用户在控制台进行形象制作,生成的数字人形象,会展示在“我的创作 > 分身形象”页面。 用户在控制台进行声音制作,生成的声音,会展示在“我的创作 > 声音”页面。 用户在控制台进行视频制作,合成的视频,会展示在“我的创作
Flexus分身数字人 按Flexus数字人生成个数和声音克隆个数计费。 须知: 每提交一个Flexus分身数字人定制任务,会同时生成一个Flexus形象和一个Flexus声音,对应消耗一个形象资源和一个声音资源。 按需预付费套餐包 一次性计费 Flexus分身数字人视频制作 按Flexus数字人视频制作时长计费。
声音制作 MetaStudio支持自定义生成声音。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 参考真人声音录制,提前录制一个WAV或MP3格式的长音频文件,每句之间需要有2~3秒的停顿。语料推荐使用文案样例(基础版)。 声音授权签署文件。 操作步骤 登录MetaStudio控制台。
图1 选择名片模板 选择一款名片模板,单击“开始制作”,进入名片制作页面,如图2所示。 界面左侧为名片配置内容,右侧为名片预览效果图。参数配置说明如表1所示。 图2 制作名片 表1 参数说明 区域 参数 说明 请填写数字人信息 上传头像 需提前准备一张正面清晰且无遮挡的数字人形象照片,并满足如下要求:
可能原因如下所示: 人证校验时识别不到人脸,确保身份证照片无反光导致的内容或人像不清晰。 确保视频中的人脸清晰且与提交身份证中的人像保持一致。 视频方向可能不对,竖屏横拍的素材需要旋转,确保被拍摄对象为竖向。 视频为非主流编码格式,可能是相机拍摄的视频采用了厂商的特定编码。需确
拼多多等)抓取用于开播。 RTMP推流:即RTMP直推(华为云服务器直接把画面传到直播平台服务器,不需要用户一直打开控制台),从直播平台获取推流地址。获取方式各平台入口不一,建议咨询对应的直播平台。在MetaStudio服务这里仅需输入推流地址,即可直推平台。 需要注意: 使用R
Flexus分身数字人形象采集指南 本节将协助您完成Flexus分身数字人形象的采集工作。请注意,您的数字人形象会与录制效果保持一致,包括服装、手部动作、面部表情以及各方面的姿态等。所以我们希望您在拍摄时尽可能保持自然,按照平时的说话习惯录制。 拍摄流程 支持手机或相机拍摄,需1080P或更高分辨率。
账户设置 默认情况下,同一华为云账号下的IAM子账户资源共享,如下所示: 各IAM子账户的已购资源共享:即每个IAM用户看到的可用资源总量是所有IAM用户已购资源可用数量的总和,所有IAM用户都可以使用。所以即使当前IAM用户没有消耗资源,如果其他IAM用户在消耗资源,也会看到资源数量在减少。