检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
作请参考直播任务管理。 直播平台对接:用户新增第三方平台配置,可以关联至直播间使用,实现MetaStudio对接第三方直播平台。操作请参考直播平台对接。 直播配置:租户级配置,包括直播最长时长、异常重连和直播中断通知。操作请参考直播配置。 图1 视频直播首页面 直播间界面 视频直
操作步骤如下所示: 新增商品 新增互动库 创建直播间 查看直播任务 注意事项 推荐使用Chrome浏览器访问MetaStudio控制台。 新增商品 分身视频直播首页面的“商品管理”页签,支持新增商品。商品会自动展示在直播间的“商品”页签中,作为视频直播的素材。 登录MetaStudio控制台。
面的实时切换。 详细配置说明,如下所示: 登录MetaStudio控制台,单击“智能交互”。 如果是展厅场景,需要切换到“华北-北京四”区域。因为展厅的配置,均在“华北-北京四”区域。 在界面右侧,选择“对话配置”页签,如图1所示。 配置说明如下所示,其他配置请参见智能交互。 语
页面,如图2所示。 界面左侧为名片配置内容,右侧为名片预览效果图。参数配置说明如表1所示。 图2 制作名片 表1 参数说明 区域 参数 说明 请填写数字人信息 上传头像 需提前准备一张正面清晰且无遮挡的数字人形象照片,并满足如下要求: 图片格式:png、jpg、jpeg、webp。
面的实时切换。 详细配置说明,如下所示: 登录MetaStudio控制台,单击“智能交互”。 如果是展厅场景,需要切换到“华北-北京四”区域。因为展厅的配置,均在“华北-北京四”区域。 在界面右侧,选择“对话配置”页签,如图1所示。 配置说明如下所示,其他配置请参见智能交互。 语
Content-Type常见取值,如下所示: image/gif:gif图片格式 image/jpeg:jpg或jpeg图片格式 image/png:png图片格式 audio/mp3:mp3音频格式 audio/wav:wav音频格式 video/mp4:mp4视频格式 application/octet-st
的2个问题,共计3个问题。其他数值的配置效果,以此类推。 对话内容合规审核 开启后,将自动审核用户的提问内容,若问题存在违禁词,系统将自动拦截返回默认答案。如果关闭,将无法审核用户提问是否合规。 配置检查 单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。
身数字人视频制作任务接口未配置image_config参数。详细说明如下所示: 使用创建分身数字人视频制作任务接口插入视频素材时,“layer_type”会配置为视频素材图层即“VIDEO”,并配置视频素材图层配置项video_config。此时还需配置图片素材图层image_c
视频制作界面 表1 界面说明 序号 区域名称 说明 1 视频素材区域 设置视频的场景,包括如下内容。视频素材的操作详情,请参考视频制作公共配置。 模板:系统预置视频模板列表。支持基于系统预置模板,一键快速制作数字人视频。 注意:只有管理员可以自定义新增模板。 角色:自动展示系统预置的分
互动库 选中左侧的互动库,单击界面右侧的“新建”,弹出“新建互动”对话框,如图3所示。 可以给当前互动库,新增1条互动规则。参数配置说明,如表1所示。 图3 互动规则 表1 互动规则配置说明 参数 说明 类型 互动类型。 包含如下选项: 弹幕 用户入场 点赞 送礼 互动名称(可选) 互动名称。
查看名片 如果用户需要查看已生成的分身数字人名片,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“分身名片”页签,如图1所示。 在“分身名片”页面,可以看到已生成的名片列表,以卡片形式排列展示。 支持对名片进行如下操作: 单击,查看分身数字人的语音表达形态。
购买语音包后试听一直转圈圈是为什么? 需要检查已购买的第三方声音AK/SK是否配置正确,详见购买出门问问声音套餐。如果配置有误,则无法使用。 父主题: 计费咨询
场景说明 智能交互包含如下场景: 场景一:用户开箱即用的智能交互数字人场景。 在MetaStudio控制台完成交互配置,包括LLM或者大模型配置,通过Web页面浏览,无需开发。 图1 智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交
支持的格式为:PNG、JPG、JPEG、WEBP。 大小不超过16MB。 分辨率最大支持1080P,如果超出,会自动缩放为1080P,且需保证分辨率大于等于80*80。 音频 音频录制要求,如下所示: 单声道音频。 清晰人声无背景音乐与杂音。 音频格式要求,如下所示: 支持的格式为:MP3、WAV。
基础版声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长3~10分钟,建议5分钟。 进阶版声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长10~30分钟,建议15分钟。 高品质声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长1小时以上,建议1小时。
LiveEventCallBackConfig object 直播事件HTTPS回调通知配置 rtc_callback_config RTCLiveEventCallBackConfig object RTC回调事件配置。兼容处理,未携带配置则默认订阅LIVE_PROGRESS stream_duration
LiveEventCallBackConfig object 直播事件HTTPS回调通知配置 rtc_callback_config RTCLiveEventCallBackConfig object RTC回调事件配置。兼容处理,未携带配置则默认订阅LIVE_PROGRESS stream_duration
LiveEventCallBackConfig object 直播事件HTTPS回调通知配置 rtc_callback_config RTCLiveEventCallBackConfig object RTC回调事件配置。兼容处理,未携带配置则默认订阅LIVE_PROGRESS stream_duration
进行用户问题模拟,查看对话效果。 (可选)新增English情景模式:前面的所有操作,都是main情景模式下的配置,如果对话配置时,语言选择“中文”,则main情景模式下的配置生效。如果对话配置时,语言选择“英文”,当前应用需要新增English情景模式,才能对话成功。 情景模
建立WebSocket连接,实现用户与数字人对话,详见智能交互驱动。 图2 操作流程图 单击“确定”,创建应用,创建效果如图3所示。 可单击“修改”,修改配置。 图3 互动问答 (可选)单击“对话配置”页签,配置对话,详细操作请参考对话配置。 单击“发布设置”页签,参考表2配置参数。 表2