检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用户限制 MetaStudio不支持个人用户定制形象,仅支持企业用户。 定制分身形象时,从平台下载的授权书中有明确说明,定制分身形象需授权给公司使用。 使用限制 制作好的数字人模型不支持下载或导出至本地。 数字人模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。
提供下述2种方式开播: 从直播平台获取推流地址。获取方式各平台入口不一,建议咨询对应的直播平台。在MetaStudio服务这里仅需输入推流地址,即可直推平台。 推流即RTMP直推,华为云服务器直接把画面传到直播平台服务器,不需要用户一直打开控制台。 如果直播平台无法提供推流地址,可通过窗口捕获方式开播。
期间我们一直在分享万兴科技的各种AI产品,包括万兴播爆、万兴喵影、万兴PDF、墨刀、亿图等等。 今年,随着AI技术的迅速发展,几乎所有产品都嵌入了AI的元素,这让我们在职场里的工作变得更轻松更高效。 相信大家对万兴的一些AI产品已经有所了解了。 先来简单介绍一下这些非常实用的AI工具吧。 你想制
案,提供数字人视频与直播、智能交互等服务,使能千行百业场景应用。 主要功能如下所示,详见功能特性。 数字内容生产线Metastudio通过AI学习真人形象和声音,来生成数字人模型,相应功能为形象制作、声音制作和Flexus分身数字人。再将模型用于音视频内容的创作,相应功能为视频制
提供下述2种方式开播: 从直播平台获取推流地址。获取方式各平台入口不一,建议咨询对应的直播平台。在MetaStudio服务这里仅需输入推流地址,即可直推平台。 推流即RTMP直推,华为云服务器直接把画面传到直播平台服务器,不需要用户一直打开控制台。 如果直播平台无法提供推流地址,可通过窗口捕获方式开播。
任务已被删除或不存在 确认任务信息是否正确 400 MSS.20020004 训练数据有些问题,请检查并重新提交 训练数据有些问题,请检查并重新提交 检查训练数据是否符合要求 400 MSS.20020005 任务训练失败 任务训练失败 请联系技术支持 400 MSS.20020007 文件格式非法
选中所有的音频文件,单击“分享”,可选择隔空投送或其他第三方应用导出音频文件至PC中。 一个长音频文件无需压缩,可直接上传至MetaStudio控制台,进行声音训练。 安卓手机 安卓手机推荐下载软件“超级录音机”进行录音,如图2所示。 图2 超级录音机 音频录制说明,如表2所示。 表2 音频录制说明 音频录制
(可选)提升问答交互次数 科大讯飞免费赠送500次/天的问答交互次数,如需提升问答交互次数,需订购套餐包。 操作步骤 在AIUI开放平台界面上方的主菜单中,选择“产品接入 > 我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 在左侧导航栏中,选择“应用数据统计 >
而不是直接播报问题。 为什么要定制语音唤醒模型? 根据唤醒词定制的唤醒模型,可以提升唤醒词的准确率。 能否直接在本地修改唤醒词? 不行。模型和唤醒词是绑定的,不支持本地修改唤醒词。 集成WebSDK的网页加载时自动调用create接口创建数字人,但是后续的数字人播报为啥没有声音?
在“视频”页面,可以看到已生成的视频列表,以卡片形式排列展示。 支持对视频进行如下操作: 单击播放图标,播放照片数字人视频。 单击,在弹出的下拉框中,可下载视频至本地、查看详情、重命名或删除视频。 图1 照片数字人视频 父主题: 照片数字人
背景界面详情,如图2所示。 上传后的背景图片不支持修改。如需修改图片内容,需本地修改完成后,再上传至控制台使用。 图2 背景界面 背景界面说明,如表2所示。 表2 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择PNG、JPG、JPEG和BMP格式的图片上传。也可直接将图片拖拽至图片列表区域。
现象。 操作步骤 参考下载SDK安装包,下载SDK安装包至本地。 打开本地命令运行程序,输入如下命令,在本地生成SDK安装包的SHA256值。 其中,“D:\HwICSUiSdk-1.0.0.zip”为SDK安装包的本地存放路径及安装包名称,请根据实际情况修改。 certutil
上传后的视频不支持修改。如需修改视频内容,需本地修改完成后,再上传至控制台使用。 插入的视频不支持单独调节宽或高,仅支持宽高等比例缩放。如需调节视频的宽和高,请本地调整好后再导入至平台使用。 图6 视频界面 视频界面说明,如表5所示。 表5 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择MOV
阴影。在灯光设备有限的情况下,优先打亮被拍摄主体,之后再去对绿幕进行补光。 收音 我们会使用视频中的语音和您口型变化的对应关系来训练口型驱动效果,训练结果还会经过专家的技术审核。 因此在收音这方面,我们建议: 保证视频音画同步。 确保环境安静无噪声,模特人声清晰,无其他人声干扰,尽量减少视频的底噪。
上传后的视频不支持修改。如需修改视频内容,需本地修改完成后,再上传至控制台使用。 插入的视频不支持单独调节宽或高,仅支持宽高等比例缩放。如需调节视频的宽和高,请本地调整好后再导入至平台使用。 图4 视频界面 视频界面说明,如表4所示。 表4 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择MOV
用户购买非华为的LLM或者大模型,当前支持科大讯飞AIUI通用语义模型及星火大模型、出门问问的数字人平台。 科大讯飞对接至智能交互服务,开发者基于SDK完成web界面开发,操作请参考创建智能交互数字人(科大讯飞)。 出门问问的数字人平台对接至智能交互服务,开发者基于SDK完成web界
角色:数字人形象列表,可选择需要使用的数字人形象,支持自定义。 背景:背景图片列表,支持本地导入。可选择需要使用的背景图。 贴图:各类贴图列表,支持本地导入。支持在当前画面基础上,增加贴图,丰富视频画面。 视频:无声音视频素材列表,支持本地导入,支持MOV、MP4、M4V、MKV、FLV、3GP、WMV
在“分身名片”页面,可以看到已生成的名片列表,以卡片形式排列展示。 支持对名片进行如下操作: 单击,查看分身数字人的语音表达形态。 单击“下载”,将名片下载至本地查看。下载后的文件为mp4格式。 单击,在弹出的下拉框中,可查看名片详情、重命名或删除名片。 图1 分身数字人名片 父主题: 数字人名片制作
表15 PlatformLiveDetailInfo 参数 参数类型 描述 platform_id String 直播平台ID。 platform String 直播平台。美团填写meituan account String 授权账号信息。 美团平台对应:opBizCode live_id
装,以简化用户的开发工作。用户直接调用智能交互Web SDK提供的接口,即可实现使用数字人智能交互业务能力的目的。 智能交互提供了如下主流平台SDK供开发者使用。 表1 客户端SDK 客户端 集成SDK 接口参考 Web Web SDK 接口参考 父主题: 智能交互客户端SDK