检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
型匹配准确率>95%,表情、动作更自然。 直播话术智能生成:基于十万级高质量直播话术的预训练,自动生成专业话术,精准驱动数字人准确、流利地介绍产品,让每个人都能成为专业的主播。 智能互动问答:基于盘古大模型能力,和直播间观众智能互动,大幅提升直播体验和商业转化率。 基于上述先进的
Flexus支持通过API集成使用吗? 为什么调用API时提示“APIG.0301”? 使用API时返回“APIGW”开头的错误码,该如何处理? 智能交互SDK从哪里下载? 通过API合成的视频封面为什么看不到插入的视频素材缩略图? 通过API上传的视频和图片素材,为啥视频制作时不可见?
示例9:视频制作剧本管理 示例10:视频制作素材图层管理 示例11:视频直播 示例12:视频直播对接实时音视频客户端SDK 示例13:数字人名片制作 示例14:智能交互
左下角展示用户当前剩余可用的视频直播路数,即用户还可以并发开启的视频直播数量。 分身数字人视频直播支持开通或关闭按需计费。 分身数字人智能交互 左下角展示用户当前剩余可用的智能交互路数,即用户还可以并发开启的数字人交互对话数量。 分身数字人名片制作 左下角展示用户已购买资源的剩余量。 分身数字人名片制作支持开通或关闭按需计费。
用户在控制台进行数字人名片制作制作,生成的数字人名片,会展示在“我的创作 > 分身名片”页面。 用户在控制台进行智能交互操作,生成的对话项目和技能,会展示在“我的创作 > 智能交互”页面。 一类是通过本地上传或者接收资产管理员转移的资产生成的,会展示在“我的创作 > 资源”页面。 父主题:
说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 素材绑定(可选) 从本地选择图片或视频上传。当直播间命中当前
视频直播不支持透明背景设置,仅视频制作和智能交互支持。 直播任务退出说明 直播任务退出说明,如表2所示。 表2 直播任务退出说明 直播任务退出场景 操作说明 租户自行退出直播任务 租户可通过下述方式,退出直播任务。 在MetaStudio控制台开播页面,停止直播任务。 调用结束数字人智能直播任务接口,停止直播任务。
TTS V7 营销 中文 新增 云佳 女 TTS V7 客服 中文 新增 云辉 男 TTS V7 直播 中文 新增 云英 女 TTS V9 直播 中文 新增 云薇 女 TTS V9 直播 中文 新增 云溪 女 TTS V9 客服 中文 新增 Daniel 男 TTS V9 - 英文
包年/包月 分身数字人智能交互 支持购买多路,每路按时长计费。 须知: 智能交互中数字人分身的动作是根据数字分身拍摄形象训练生成的,唇形和文字声音匹配,数字分身和背景融合自然,清晰度1080P。 智能交互根据客户需要,后台提供多种知识库配置,支持配置中英双语。 智能交互基于已有训练生
分身视频直播 智能直播间管理 直播任务管理 第三方直播平台管理 直播商品管理
视频直播 视频直播界面说明 视频直播 互动管理 商品管理 直播任务管理 智能交互设置 视频直播公共配置
使用限制 服务使用限制 API使用限制 形象制作限制 声音制作限制 视频制作限制 视频直播限制 Flexus分身数字人限制 照片数字人限制 智能交互限制 资产管理说明 SP用户限制
如何调用MetaStudio接口? 数字人相关问题 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 如何实时切换智能交互的语言和声音? 父主题: 附录
持文本驱动和语音驱动的方式说话。 5 数字人支持提供语义理解知识库吗? 不提供语义理解知识库。语义理解是知识库的能力,不是数字人的能力。 智能交互的主要功能是通过数字人与用户进行交互问答,也就是用户提问,数字人说出知识库返回的答案。数字人回答的内容,是由大模型或知识库返回的答案决定的。
持文本驱动和语音驱动的方式说话。 5 数字人支持提供语义理解知识库吗? 不提供语义理解知识库。语义理解是知识库的能力,不是数字人的能力。 智能交互的主要功能是通过数字人与用户进行交互问答,也就是用户提问,数字人说出知识库返回的答案。数字人回答的内容,是由大模型或知识库返回的答案决定的。
量在减少。 各IAM用户资产共享:即每个IAM用户上传的资产、制作的形象和声音资产(包括制作任务)、合成的视频(包括剧本和任务)、直播间,智能交互项目等,全部可共享使用。 前提条件 MetaStudio控制台默认不展示“子账户隔离配置”菜单,需提交工单,并提供当前华为云账号所在R
wav 进阶版媒体2.wav 支持手机录制100条语料音频(15分钟),1-3天制作,获得高还原度音色,mos分4.0。 直播、培训视频、智能交互 高级版声音制作 女声 高级版媒体1.wav 高级版媒体2.wav 录音棚专业设备录制60分钟音频,3-5天制作,支持多轮人工调整,获得现场级高品质音色,mos分4
查询接口中通过business_type来区分3种类型。 智能交互基础版 路 包年包月 hws.resource.type.metastudio.modeling.Interaction.basic.channel - 智能交互专业版 路 包年包月 hws.resource.type
Flexus分身数字人限制说明,如表1所示。 表1 声音制作限制 限制项 说明 Flexus形象和声音使用限制 Flexus分身数字人目前仅支持视频制作,不支持视频直播和智能交互。 视频制作限制 Flexus数字人采用实景拍摄,视频制作时不支持切换背景。 Flexus分身数字人左上角会有标识。未带有标识的数字人均为标准版形象。
著降低技术门槛,且购买简单,为中小企业提供超简单、超高性价比数字人。 使用限制 Flexus分身数字人目前仅支持视频制作,不支持视频直播和智能交互。 产品特性 轻量规格 购买简单,一次下单即可完成形象、声音和视频制作资源的购买。针对额外需求,支持客户选择不同档位套餐包进行充值。 极简体验