检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
设置完成后,单击“生成视频”,弹出如图2所示的对话框,显示照片数字人视频的生成进度。 可执行下述操作: 单击图中第一个链接“任务中心-视频”,可进入“任务中心 > 照片数字人”页面,查看任务进度,详情请参见查看任务。 单击图中第二个链接“我的创作-视频”,可进入“我的创作 > 视频”界面,查看已生成的视频,详情请参见查看视频。
需要有扬声器。 触摸屏 需要有触摸屏。 带宽 4M以上。 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 智能交互界面对浏览器的要求,如表2所示。 表2 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows
窗口捕获方式开播。 智能交互 对接第三方大脑,通过数字人交互的方式与用户进行问答。场景应用广泛,包括智能导购、文旅导览、智能问答、营业厅客服等。 注意: 数字人回答的内容,是由对接的第三方大模型或知识库返回的答案决定的。 资产管理 支持从本地上传模型、PPT、动画、素材、视频、场景、图片、音乐等资产。
右侧界面的预览效果就是数字人名片的实际生成效果,请输入适量的字符,以确保正常的展示效果。 公司 必填项,数字人公司。 内容较多时,最多支持在名片中分2行展示,超出2行后,默认不展示。为保证名片的效果展示,请保持合理的输入长度。 联系电话 必填项,数字人联系电话,请输入有效的联系方式。 公司地址
Flexus支持通过API集成使用吗? 为什么调用API时提示“APIG.0301”? 使用API时返回“APIGW”开头的错误码,该如何处理? 智能交互SDK从哪里下载?
接口界面查看上传结果。也可以在MetaStudio控制台的“我的创作 > 资源 > 已激活”页签,查看上传的资产文件。 图4 接口页面 常见错误 上传资产失败的常见错误,如下所示: 2中file_md5输入错误,因为文件的MD5计算错误,且没有进行Base64编码。 3中可能错误,如下所示:
已完成 JOB_SUCCESS: 训练任务完成(普通用户任务的完成状态,此时用户已经可以使用模型) JOB_FINISH: 任务结束,是最终状态,不支持修改此状态(NA用户任务的完成状态,并且此状态表明模型效果已通过用户的验收) 挂起,仅NA白名单用户有该状态 JOB_PENDING:
嗨,大家好!欢迎来到我们的直播间!我是今天的主播Lan。 非常高兴能够和各位在今晚的直播间相聚,希望今天在直播间里能和大家一起度过一段非常有意义的时光! 感谢每一位在直播间停留观看的朋友们,感谢大家进来咱们的直播间参与今天的互动、留言。 稍后我们的直播间不但会教学一些数字人视频的剪辑技巧,还会跟大家推荐一些AI剪辑的功能。
为方便识别和记忆,两边的技能名称推荐相同。 技能标识 技能标识,必须与科大讯飞创建的技能标识保持一致,如在科大讯飞创建同名技能并导入技能文件所示。否则用户命中问题,也无法获取到正确的答案。 单击“确定”,进入如图3所示的页面。 参考表3设置第一个问答对。单击“添加问答”,可以增加更多的问答对。一个技能可以最多添加40个问答对。
查当前PC的浏览器是否支持H265(HEVC)视频解码。 图2 查看浏览器配置 用ffmpeg检查视频的编码是否是H265(HEVC),输入命令:ffmpeg -i 视频文件名。 图3 检查视频是否是hevc编码 需要先安装ffmpeg,安装方法如下。 ffmpeg下载地址:https://github
数字人支持提供语义理解知识库吗? 不提供语义理解知识库。语义理解是知识库的能力,不是数字人的能力。 智能交互的主要功能是通过数字人与用户进行交互问答,也就是用户提问,数字人说出知识库返回的答案。数字人回答的内容,是由大模型或知识库返回的答案决定的。 父主题: 数字人
单击界面右侧的“导入”,弹出“导入训练语料”对话框。 图5 导入训练语料 单击“下载模板”,将语料模板下载至本地。 请按照模板文件的格式,填充完成所有问题分类及其语料对,保存文件。 单击“添加文件”,从本地选择文件,单击“确定”。 等待文件导入成功后,可以看到增加成功的问题类别及其全量语料对,示例如图6所示。
与AIUI开放平台应用的“应用名称”保持一致。 APPID 与AIUI开放平台应用的“APPID”保持一致。 APPKEY 与AIUI开放平台应用的“APPKEY”保持一致。 APISECRET 与AIUI开放平台应用的“APISECRET”保持一致。 对接生产环境 对接科大讯飞现网的自然语言
如果还需要制作更多场景,可单击“场景”区域的“+”图标,新增场景。制作过程参考第一个场景即可。 图3 场景区域 所有场景设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。 参数设置说明如下所示: 分辨率:根据实际情况,选择视频的分辨率。 导出为:输入导出文件的名称。 画质增强:开启后
如何实时切换智能交互的语言和声音? 在展厅等智能交互场景中,会有切换智能交互界面,数字人说话语言和声音的需求。 请参考下述步骤操作: 登录MetaStudio控制台。 如果是展厅场景,需要切换到“华北-北京四”区域。因为展厅的配置,均在“华北-北京四”区域。 在左侧导航栏中,选择“我的创作”。
第三方平台的直播画面不清晰怎么办? 如果用户在第三方直播平台的直播画面不清晰,需排查是否是下述原因导致: 电脑是否有独立显卡。 OBS视频采集工具的基础分辨率配置是否与输出分辨率一致。 检查独立显卡 用户使用的第三方直播平台所在电脑,必须装有独立显卡。 检查OBS视频分辨率配置
智能交互客户端SDK 操作前提 SDK概述 SDK下载 Web SDK 父主题: 智能交互
20020011 上传的音频文件格式不正确,请按指导使用正确的音频格式 上传的音频文件格式不正确,请按指导使用正确的音频格式 上传的音频文件格式不正确,请按指导使用正确的音频格式 400 MSS.20020012 压缩包中的文件类型不符合任务要求 压缩包中的文件类型不符合任务要求
形象制作 拍摄真人视频 形象拍摄指导文档下载 创建分身数字人定制任务 查看数字人定制任务 演讲示例稿
在数字人智能交互界面,自动展示默认语言,并用默认语言与用户进行问答。可通过界面右上方的语言切换图标,切换语言。 声音:单击声音右侧的图标,切换数字人声音。 这里选择的声音,需要与前面选择的语言匹配。如果是中文,则选择中文声音,英文语言则选择对应的英文声音,否则数字人表达会有问题。 图1 对话配置 父主题: