检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
分身视频直播 智能直播间管理 直播任务管理 第三方直播平台管理 直播商品管理
使用限制 服务使用限制 API使用限制 形象制作限制 声音制作限制 视频制作限制 视频直播限制 Flexus分身数字人限制 照片数字人限制 智能交互限制 资产管理说明 SP用户限制
直播话术智能生成:基于十万级高质量直播话术的预训练,自动生成专业话术,精准驱动数字人准确、流利地介绍产品,让每个人都能成为专业的主播。 智能互动问答:基于盘古大模型能力,和直播间观众智能互动,大幅提升直播体验和商业转化率。
智能交互SDK从哪里下载? 通过API合成的视频封面为什么看不到插入的视频素材缩略图? 通过API上传的视频和图片素材,为啥视频制作时不可见?
WebSocket接口(Android SDK) 示例7:语音同步合成WebSocket接口(iOS SDK) 示例8:视频制作 示例9:视频制作剧本管理 示例10:视频制作素材图层管理 示例11:视频直播 示例12:视频直播对接实时音视频客户端SDK 示例13:数字人名片制作 示例14:智能交互
如何实时切换智能交互的语言和声音? 父主题: 附录
系统会自动根据停顿做切割,自动识别文本内容。 音频文件命名无要求,可自定义,命名示例:Voice.wav。 进阶版 高品质 制作声音模型 准备好音频文件后,就可以上传至MetaStudio控制台,进行声音训练。
分身数字人智能交互 左下角展示用户当前剩余可用的智能交互路数,即用户还可以并发开启的数字人交互对话数量。 分身数字人名片制作 左下角展示用户已购买资源的剩余量。 分身数字人名片制作支持开通或关闭按需计费。 照片数字人视频制作 左下角展示用户已购买资源的剩余量。
智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 素材绑定(可选) 从本地选择图片或视频上传。当直播间命中当前互动内容进行答复时,同时会在直播画面展示这里上传的图片或视频。 单击“保存”,一条互动规则新增完成。
请联系管理员检查 语音识别服务欠费不可用,请联系管理员检查 语音识别服务欠费不可用,请联系管理员检查 403 MSS.47015017 第三方驱动不支持此操作请通过驱动接口控制 第三方驱动不支持此操作请通过驱动接口控制 第三方驱动不支持此操作请通过驱动接口控制 500 MSS.47010002
直播、培训视频、智能交互 高级版声音制作 女声 高级版媒体1.wav 高级版媒体2.wav 录音棚专业设备录制60分钟音频,3-5天制作,支持多轮人工调整,获得现场级高品质音色,mos分4.2。 父主题: 附录
智能交互基础版 路 包年包月 hws.resource.type.metastudio.modeling.Interaction.basic.channel - 智能交互专业版 路 包年包月 hws.resource.type.metastudio.modeling.Interaction.pro.channel
表1 声音制作限制 限制项 说明 Flexus形象和声音使用限制 Flexus分身数字人目前仅支持视频制作,不支持视频直播和智能交互。 视频制作限制 Flexus数字人采用实景拍摄,视频制作时不支持切换背景。 Flexus分身数字人左上角会有标识。
按需计费 包年/包月 分身数字人智能交互 支持购买多路,每路按时长计费。 须知: 智能交互中数字人分身的动作是根据数字分身拍摄形象训练生成的,唇形和文字声音匹配,数字分身和背景融合自然,清晰度1080P。 智能交互根据客户需要,后台提供多种知识库配置,支持配置中英双语。
智能交互的主要功能是通过数字人与用户进行交互问答,也就是用户提问,数字人说出知识库返回的答案。数字人回答的内容,是由大模型或知识库返回的答案决定的。 6 数字人支持TTS和ASR吗? 已支持TTS(文本转语音),详见创建TTS异步任务。
智能交互的主要功能是通过数字人与用户进行交互问答,也就是用户提问,数字人说出知识库返回的答案。数字人回答的内容,是由大模型或知识库返回的答案决定的。 6 数字人支持TTS和ASR吗? 已支持TTS(文本转语音),详见创建TTS异步任务。
(秒) 取值范围: 0-2147483647 ljzn_max Integer 逻辑智能最高时长(秒) 取值范围: 0-2147483647 ljzn_advice_value Integer 逻辑智能建议时长(秒) 取值范围: 0-2147483647 状态码:400 表3 响应
调用结束数字人智能直播任务接口,停止直播任务。 服务自动关停直播任务 下述场景下, 生成的直播视频流没有观看者,服务为保障租户利益,会自动关停直播任务。 在MetaStudio控制台开播,且没有配置RTMP推流时,用户关闭了视频播放窗口一段时间以后,约2~3分钟。
支持如下两种模式: 纯文本模式 使用纯文本,示例:大家好,我是人工智能小A,是位虚拟主播。 标签模式 标签模式使用SSML(Speech Synthesis Markup Language)标记语言。 需要使用的标签,如下所示: <speak>:此标签为所有文本的根节点。
各IAM用户资产共享:即每个IAM用户上传的资产、制作的形象和声音资产(包括制作任务)、合成的视频(包括剧本和任务)、直播间,智能交互项目等,全部可共享使用。