检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
(HEVC)视频解码。 图2 查看浏览器配置 用ffmpeg检查视频的编码是否是H265(HEVC),输入命令:ffmpeg -i 视频文件名。 图3 检查视频是否是hevc编码 需要先安装ffmpeg,安装方法如下。 ffmpeg下载地址:https://github.com/
HTTP方法 方法 说明 GET 请求服务器返回指定资源。 PUT 请求服务器更新指定资源。 POST 请求服务器新增资源或执行特殊操作。 DELETE 请求服务器删除指定资源,如删除对象等。 HEAD 请求服务器资源头部。 PATCH 请求服务器更新资源的部分内容。 当资源不存在的
audio_uploading_url Array of strings 音频上传的地址。 通过该obs地址上传时,需设置content-type为audio/wav txt_uploading_url Array of strings 文本上传的地址。 通过该obs地址上传时需设置content-type为text/plain
audio_uploading_url Array of strings 音频上传的地址。 通过该obs地址上传时,需设置content-type为audio/wav txt_uploading_url Array of strings 文本上传的地址。 通过该obs地址上传时需设置content-type为text/plain
这里配置的是MetaStudio服务调用第三方语言模型的API地址。 流式响应 MetaStudio智能交互服务提供流式问答(响应更快)和非流式问答两种方式,第三方语言模型可以选择其中一种响应方式。 多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。 配置说明,如下所示: 如果设置为
视频直播限制 分身数字人直播限制,如下所示: 直播间配置约束 直播任务退出说明 直播播放说明 直播内容审核说明 直播间配置约束 直播间配置限制,如表1所示。 表1 直播间限制 直播间配置 限制 文本驱动 每个单场景中所有段落输入文字的总量需大于200字。 每个段落的文本字符数量需
智能交互限制 智能交互对硬件设备的最低配置要求,如表1所示。 表1 硬件设备要求 硬盘配置 最低配置 CPU i5及以上版本。 内存 8G以上。 硬盘 128G及以上。 操作系统 Windows或Android系统。 麦克风 需要有麦克风,且要保障1米以内的拾音效果。 扬声器 需要有扬声器。
前提条件 需要申请开通智能交互权限后,才可以使用分身数字人智能交互功能。 智能交互对硬件设备的最低配置要求,如智能交互使用限制所示。 与数字人智能交互的界面,对浏览器的要求,如智能交互使用限制所示。 父主题: 智能交互
答,给您提供交互功能。 产品运营和维护 为了保障SDK稳定运行,改善产品的运营策略,SDK会直接收集客户应用调用SDK接口的信息并上传至服务器进行统计分析。处理的个人信息包括应用信息(浏览器User Agent)、SDK接口调用记录。上述信息不会与您个人身份关联,我们无法识别您的身份。
及其互动规则。 单击“确认”。 界面下方,成功导入互动库中的互动规则列表。 单击界面右侧的“直播配置”页签,如图11所示。 直播配置说明,如表3所示。 图11 我的视频 表3 直播配置 区域 参数 说明 开播设置 选择开播方式(二选一) 请根据实际情况,选择一种开播方式,并按照界面提示进行操作。
声音制作任务管理 查询用户配置的个性化音频时长 创建基础版语音训练任务 创建进阶版语音训练任务 创建高级版语音训练任务 查询语音训练任务列表 提交语音训练任务 查询语音训练任务详情 删除语音训练任务 查询任务操作日志 获取语音文件上传地址 获取语音训练任务审核结果 设置任务批次 确认在线录音结果
应用创建成功,自动进入新增应用的“应用配置”页面。 配置应用 在界面上方的主菜单中,单击“我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 图3 应用配置页面 配置“自然语言模型”,保持默认值“AIUI通用语义模型”。 单击“管理技能配置”,弹出“配置应用需要的技能”对话框,如图4所示。
如图8所示。 图8 构建发布 配置应用 在界面上方的主菜单中,单击“我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 图9 应用配置页面 配置“自然语言模型”,从下拉框中选择“星火交互认知大模型”。 单击“管理技能配置”,弹出“配置应用需要的技能”对话框,如图10所示。
MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。 单击左侧导航栏中的“应用”,如图2所示。 参数配置说明如表1所示。 图2 创建应用 表1 创建应用 参数 说明 第三方应用 如果已配置对话机器人服务CBS,请从下拉框中选择“华为云CBS”。 应用名称 用户根据实际情况自定义即可。
解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。 表1 防火墙端口白名单 端口类型 端口 TCP端口 443、6447 UDP端口 20000-20063 配置SparkRTC域名的防火墙白名单,如表2所示。
域。因为展厅的配置,均在“华北-北京四”区域。 在左侧导航栏中,选择“我的创作”。 界面右侧选择“智能交互 > 对话项目”页签,如图1所示。 图1 对话项目 找到需要修改的对话项目,单击右侧的“编辑”,进入对话编辑界面,如图2所示。 图中标识“1”处为语言修改配置。请根据实际情况切换语言,目前仅支持中文和英文。
域。因为展厅的配置,均在“华北-北京四”区域。 在左侧导航栏中,选择“我的创作”。 界面右侧选择“智能交互 > 对话项目”页签,如图1所示。 图1 对话项目 找到需要修改的对话项目,单击右侧的“编辑”,进入对话编辑界面,如图2所示。 图中标识“1”处为语言修改配置。请根据实际情况切换语言,目前仅支持中文和英文。
操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“照片数字人”,进入照片数字人制作页面,如图1所示。 界面左侧展示配置项,右侧展示预览效果。配置操作,请参考表1。 图1 照片数字人制作页面 表1 界面操作说明 区域 参数 说明 01 请上传您的照片 人像照片 单击“查看
默认取值: VIDEO voice_properties 否 VoiceProperties object 声音配置信息,为Flexus版声音的配置项,标准版声音不支持此配置。 supported_service 否 Array of strings 该任务所生成的模型支持的业务类型,可多选。
任务ID。 websocketAddr string | undefined 智能交互服务端websocket地址,三方驱动场景用来拼接websocket链接。 须知: 参数返回的地址默认无wss://前缀,实际使用时,需要补齐前缀。示例:如果返回字段内容为metastudio-api.cn-north-4