检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择模型 选择AI模型。不同模型需要配置的参数数量不同,其中,高阶模型需要配置的参数最多。 包含如下选项: 初阶模型 中阶模型 高阶模型 多轮对话 是否开启多轮会话。 如果开启,会根据上下文的信息进行语义理解,以生成连贯的对话。 业务ID 仅特殊定制的业务模型需要配置。 所在城市 智能交互面向的城市。
查看浏览器配置 用ffmpeg检查视频的编码是否是H265(HEVC),输入命令:ffmpeg -i 视频文件名。 图3 检查视频是否是hevc编码 需要先安装ffmpeg,安装方法如下。 ffmpeg下载地址:https://github.com/BtbN/FFmpeg-Builds/releases。
资产存储计费说明 资产存储 计费说明 免费存储空间 MetaStudio服务免费赠送每个租户5GB资产存储空间,用于上传各类音视频、图片等素材。如果租户需要更多的存储空间,请购买单独的资产管理包月产品。 定制形象模型存储 基于MetaStudio服务定制生成的形象模型,其所包含的音色模型所占存储空间,暂不计入租户资产存储计费中。
新增知识库 可根据实际需要,上传外部知识库和问答库给大模型学习。 前提条件 使用奇妙问前,需提交工单申请使用手机号注册账号。 操作步骤 访问奇妙问,输入有效手机号和验证码,或者通过密码方式登录。 图1 奇妙问 单击“登录”,进入奇妙问“创建角色”页面,如图2所示。 图2 创建角色
使用限制 在使用数字内容生产线服务前,您需要了解本服务的使用限制信息。 区域限制 预置模特使用限制 API使用限制 形象制作限制 声音制作限制 视频制作限制 视频直播限制 Flexus分身数字人限制 照片数字人限制 智能交互限制 资产管理说明 SP用户限制
为了保证数字人训练的效果,请按照我们提供的流程进行录制,请根据实际需求评估录制流程: 不需要交互:15~20秒静默 + 4~5分钟自然表达 需要交互:15~20秒静默 + 无语义动作 + 4~5分钟自然表达,详见交互数字人拍摄要求。 需要动作编排:15~20秒静默 + 4~5分钟自然表达 + 单独拍摄动
界面详情请参见图3。 委托站点 从下拉框中选择用户购买CBS服务的问答机器人所在Region。 委托 需要授予MetaStudio服务CBS服务的访问权限。 首次委托的站点,需要开启委托开关。详细操作如下所示: 开启委托开关,界面会弹出如图3所示的对话框。 单击“同意授权”,Me
定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备完成如下内容: “语料上传”方式制作声音时,需要参考声音制作页面的“录音指导”录制音频。 签署声音授权文件,如授权书所示。 购买小语种克隆套餐包并激活使用,操作请参考购买出门问问声音套餐。
地向用户涨价。 无论哪方都需要多方面考量,结合多终端兼容的市场需要, 为人民带来更加丰富的资源,才能走得长远。 网络暴力是当前社会面临的一大问题。 在社交媒体上,人们可以随意发表言论, 但是也需要意识到这些言论所带来的后果。 预防和治理网络暴力是一个需要全社会共同关注和解决的庞大课题,
文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考购买出门问问声音套餐。 请填写名片信息 姓名 必填项,数字人姓名。
et链接。 须知: 参数返回的地址默认无wss://前缀,实际使用时,需要补齐前缀。示例:如果返回字段内容为metastudio-api.cn-north-4.myhuaweicloud.com:443,则需要拼接为wss://metastudio-api.cn-north-4.myhuaweicloud
租户控制直播播放的配置 为保障主播可以截取到完整的直播视频,MetaStudio直播服务提供了控制直播播放的配置。 启动直播前,Console控制台界面,需要去勾选“加载完自动直播”(即配置项“play_policy.auto_play_script”设置为“FALSE”)。启动直播任务后,会等
“产品分类”中高亮展示的是SP用户可购买的资源包类型,置灰展示的是未对SP用户开放的资源包类型。 图2 购买页面 SP用户根据实际情况,选择需要的服务类型、产品分类、计费模式和购买数量,单击“加入清单”,依次添加至右侧的“购买清单”中。 待购买清单全部添加完成后,单击“确认订单”,进入“规格详情”页面,如图3所示。
et链接。 须知: 参数返回的地址默认无wss://前缀,实际使用时,需要补齐前缀。示例:如果返回字段内容为metastudio-api.cn-north-4.myhuaweicloud.com:443,则需要拼接为wss://metastudio-api.cn-north-4.myhuaweicloud
自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音。文本驱动需要填写introduction_text和voice_asset_id参数。 AUDIO: 语音驱动,需要在资产库中先上传语音资产。语音驱动需要填写introduction_audio_asset_id参数。 默认取值:
智能交互中数字人分身的动作是根据数字分身拍摄形象训练生成的,唇形和文字声音匹配,数字分身和背景融合自然,清晰度1080P。 智能交互根据客户需要,后台提供多种知识库配置,支持配置中英双语。 智能交互基于已有训练生成的数字分身形象模型和声音模型,结合知识库,可与用户进行实时对话。 用
自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音。文本驱动需要填写introduction_text和voice_asset_id参数。 AUDIO: 语音驱动,需要在资产库中先上传语音资产。语音驱动需要填写introduction_audio_asset_id参数。 默认取值:
示。 可以看到资源名称、总量、可激活数量和激活截止时间。可以自主设置激活数量,无需一次性全部激活。 图3 激活资源 根据实际情况,设置本次需要激活的数量,单击“确定”。 界面右上角提示“激活成功”,说明激活已成功。 父主题: SP用户
参考视频直播公共配置。 模板:视频直播模板,“模板”页签仅管理员可见。 角色:数字人形象列表,可选择需要使用的数字人形象,支持自定义。 背景:背景图片列表,支持本地导入。可选择需要使用的背景图。 贴图:各类贴图列表,支持本地导入。支持在当前画面基础上,增加贴图,丰富视频画面。 视
流和活动。 图2 文本驱动 音频制作完成后,可单击音量图标,调整音频的音量。 上述操作全部完成后,第一个场景的视频内容已制作完成。 如果还需要制作更多场景,可单击“场景”区域的“+”图标,新增场景。制作过程参考第一个场景即可。 图3 场景区域 所有场景设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。