检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
贴图支持动态图片吗? PPT如何转为PDF文件? 如何呈现PPT的动画效果? PPT文件解析失败,无法上传怎么办? 上传的PPT支持编辑吗? 视频合成失败如何处理? 如何将WEBM视频转成MOV格式? 合成的视频可以下载至本地吗? 合成视频二次剪辑后,数字人口型效果变差? 如何生成视频制作模板?
计费咨询 MetaStudio有哪些计费项? 如何购买第三方音色? 第三方声音AK/SK如何填写? 购买语音包后试听一直转圈圈是为什么? 多语言的计费规则? 如何查看已购声音套餐明细? 分身形象或声音制作的不好,可以使用原有资源重新制作吗? 形象制作和声音制作支持退订吗? 制作好数字人后,可以不购买路数进行直播吗?
000字的要求。 段落1.1:大家好,今天欢迎来到会议室,我们今天讨论的主题是:如何更好的学习和工作。 段落1.2:我们每个人都有自己的学习和工作,难免会遇到一些问题。当我们遇到问题的时候,应该如何解决的呢? 图2 文本驱动 文本内容的操作说明如表1所示。 不同声音模型对表1中操
20050004 获取资产信息失败 获取资产信息失败 请联系技术支持 400 MSS.20050005 获取资产信息失败, 资产ID或项目ID无效 获取资产信息失败, 资产ID或项目ID无效 请检查携带的资产ID或项目ID 400 MSS.20050013 获取任务信息失败,任务ID或项目ID无效
照片建模任务出现异常问题怎么办? 风格化照片建模的照片有什么要求? 风格化照片建模生成的模型文件是什么格式? 表情驱动数据格式如何定义? 肢体驱动数据格式如何定义?
<word></word>标签用于设置选中文字为连读模式。 MetaStudio包含多种TTS音色,每种音色支持的SSML标签能力是有差异的,请通过“查询资产详情”接口,获取每个音色支持使用的标签。 speak标签 描述 <speak></speak>:SSML文本的根节点。 语法 1 <speak>这里输入SSML标签的文本</speak>
操作前提 前提条件 需要申请开通智能交互权限后,才可集成智能交互SDK使用。 WebSDK使用限制 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 父主题: 智能交互客户端SDK
资产管理 如何接收并激活声音和分身模型资产?
前提条件 MetaStudio控制台默认不展示“子账户隔离配置”菜单,需提交工单,并提供当前华为云账号所在Region的项目ID(详见获取项目ID),申请开通后展示。 开通成功后,仅华为云账号下展示“子账户隔离配置”菜单,IAM子账户均不展示。 注意事项 如果华为云账号已通过
视频直播(英文) 视频直播全流程 01:46 视频直播英文界面全流程演示 视频直播 如何访问MetaStudio服务 00:26 1.如何访问MetaStudio服务 视频直播 如何搭建直播间 00:46 2.如何搭建直播间 视频直播 直播剧本设置 01:16 3.直播剧本设置 视频直播 使用RTMP推流至直播平台
视频直播 直播剧本保存失败怎么办? 提示模板不可用怎么办? 直播业务媒体流如何应对防火墙限制? 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 第三方平台的直播画面没有声音怎么办?
标准版数字人可以用实景拍摄吗? 分身数字人定制任务提交后,审核未通过怎么办? 模型审核和制作可以加快吗? 部分浏览器提交H265训练视频失败如何处理? 声音和形象模型支持在其他平台使用吗? 声音和形象模型和音视频内容的关系? Flexus数字人在走动录制时需要注意什么?
频直播内容。 可通过下述方式,在直播平台开播。 RTMP直推方式,即华为云MetaStudio直接把画面传输给第三方直播平台,需从直播平台获取推流地址。如果直播平台无法提供推流地址,可通过窗口捕获方式开播。 智能交互 对接第三方大脑,通过数字人交互的方式与用户进行问答。场景应用广
智能交互限制 智能交互对硬件设备的最低配置要求,如表1所示。 表1 硬件设备要求 硬件配置 最低配置 CPU i5及以上版本。 内存 8G以上。 硬盘 128G及以上。 操作系统 Windows或Android系统。 麦克风 需要有麦克风,且要保障1米以内的拾音效果。 扬声器 需要有扬声器。
说明 开播设置 选择开播方式(二选一) 请根据实际情况,选择一种开播方式,并按照界面提示进行操作。 提供下述2种方式开播: 从直播平台获取推流地址。获取方式各平台入口不一,建议咨询对应的直播平台。在MetaStudio服务这里仅需输入推流地址,即可直推平台。 推流即RTMP直推,华为
容生成的效率。 算法运行机制 训练阶段输入预先获取的高质量语音及其表情基系数,通过学习获得语音特征与表情基系数的关系。 用户使用时,输入音频流或音频文件。 音频经过安全审核后,进入下一步操作,否则不返回结果。 对音频特征提取后,获取音频特征,再通过算法将音频特征转换为表情基系数。
新增接口activeInteractionMode、interactionModeSwitch、sendTextQuestion,用来获取和设置当前交互模式(语音问答或文本问答),以及发送问题文本。 2024-10-08 本次变更如下: 新增发布2.0.3版本SDK,相比2.0
一致,建议将PPT转存为PDF文件后再导入。 操作详情请参考PPT如何转为PDF文件?。 如果PPT中有动画、动效,是不支持在MetaStudio控制台展示的,建议将PPT导出为视频后再导入。 操作详情请参考如何在MetaStudio控制台呈现PPT的动画效果?。 父主题: 使用限制
不超过100M 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-assets 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。 请求参数 表2 请求Header参数
<insert-action id="动作资产ID" name="动作名称" tag="动作标识"/>。动作资产信息是通过资产库接口查询获取的。 <break>:停顿标签,可在文本的指定位置插入停顿。用法为:<break time="停顿时长"/>。time的单位为毫秒,最小值为200毫秒。