检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
号 算法基本原理 数字人照片建模算法是指使用深度学习算法将已授权的人像照片信息转换为数字人3D模型的一种技术。 其基本情况包括: 输入数据:有授权的人像照片。 算法原理:使用深度学习算法,将人像照片转换为数字人3D模型。 输出结果:数字人3D模型。 应用领域:数字人照片建模算法可
创建应用 表1 创建应用 参数 说明 第三方应用 从下拉框中选择“奇妙问”。 应用名称 设置当前智能交互数字人应用的名称。 账号 注册奇妙问的账号,即用户注册奇妙问的手机号。 APPSECRET 输入用户在奇妙问创建角色的AppSecret,如查看应用信息-AppSecret所示。 角色ID
新增知识库 可根据实际需要,上传外部知识库和问答库给大模型学习。 前提条件 使用奇妙问前,需提交工单申请使用手机号注册账号。 操作步骤 访问奇妙问,输入有效手机号和验证码,或者通过密码方式登录。 图1 奇妙问 单击“登录”,进入奇妙问“创建角色”页面,如图2所示。 图2 创建角色
完成审核。 图4 定制任务详情 审核通过后,任务状态变更为“算法训练中”,如图所示。 数字人定制任务审核通过后,启动算法训练,会在3个工作日内训练完成并生成数字人。 图5 数字人定制任务 等待数字人模型训练完成后,任务状态变更为“算法训练完成”,如图6所示。 图6 数字人定制任务
SDK的EventMap事件。 表1 通知列表 接口 描述 error 错误事件。 enterSleep 数字人自动休眠事件。 jobInfoChange 交互任务信息变更事件。 speakingStart 数字人开始讲话事件。 speakingStop 数字人结束讲话事件。 speechRecognized
23ab33712d94f2940c147e8a65d8e18e0f3d3ceff8c513c4a4b9d5c03cac46db 重要变更,见•重要变更:1.4.2.1-create新增参数... 1.1.2 2024-04-02 Web SDK:HwICSUiSDK-1.1.2.zip
Flexus形象和声音使用限制 Flexus分身数字人目前仅支持视频制作,不支持视频直播和智能交互。 视频制作限制 Flexus数字人采用实景拍摄,视频制作时不支持切换背景。 Flexus分身数字人左上角会有标识。未带有标识的数字人均为标准版形象。 需注意Flexus视频制作和标准版视频制作分开计费,从各自的套餐包中扣除费用。
理的期限内删除您的个人信息或进行匿名化处理。 如何联系我们 我们设立了个人信息保护专职部门,您可以在注册华为云账号后,通过访问个人行使权利的申请受理页面,我们会尽快回复。 公司注册地址:贵州省贵安新区黔中大道交兴功路华为云数据中心,华为云计算技术有限公司。邮编:550029。 如
Studio服务内容审核功能。 如果服务接收到直播内容投诉,按照国家相关部门要求,会冻结违规的直播间及直播任务。情节严重的,还会冻结租户的全部资源。 父主题: 使用限制
CleanUpInsertCommand 参数 是否必选 参数类型 描述 command_ids 否 Array of strings 命令ID列表。如果不填,则清理全部未播放的插入命令。 最小长度1,最大长度64。 数组长度:0~100。 父主题: 附录
声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。 确认声音制作任务已训练完成后,在左侧导航栏中,单击“我的创作”。
用户上传图片超过4K,服务不支持 要求用户更换符合要求的图片 400 MSS.45000021 推理外部错误 推理模块初始化失败 联系技术支持,确认具体问题。 400 MSS.45000022 模型混合异常 横屏模型不能和竖屏模型一起使用 要求用户更换为同类型的模型 400 MSS.45000023
音频录制说明 音频录制 说明 采样率 推荐使用48kHz采样率录制音频。 苹果手机设置简易录音机录音参数的操作如下所示: 打开简易录音机软件,切换至设置“Settings”页面。 选择“Format”,进入“Format”页面。 设置如下选项: 文件格式:选择“.wav (PCM)”或MP3格式。
如表4所示。 图13 开播页面 表4 界面说明 界面元素 说明 00:01:20 直播计时,当前已直播1分20秒。 切换互动内容播报的声音。默认为主播声音,可切换为助播声音。 单击快捷图标,选择预置的互动内容发送播报。 请输入互动内容,回车发送内容 手工输入互动内容,发送成功后,
间,实现数字人视频制作、直播、智能交互和数字人IP代言等场景。 数字人升级迭代快,提升产品竞争力 口型精准:口型匹配度>95%,多语种无缝切换,泛化能力强。 表情自然:通过AI眼神矫正,矫正前后眼部ID一致,避免眼神不聚焦。 图像真实:智能重打光,背景融合更真实。 多种复杂场景建
进阶版:约1~3个工作日。 高品质:约5个工作日。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。 父主题: 声音制作
线蓝皮书》, 这是我国首次以蓝皮书形式发布的生态保护红线成果。 蓝皮书表示,全国划定生态保护红线面积合计约三百一十九万平方公里, 涵盖我国全部三十五个生物多样性保护优先区域,百分之九十以上的典型生态系统类型。 九月四日,贵州茅台和瑞幸联名推出的“酱香拿铁”咖啡正式上线, 交警提示
单击技能右侧的“导出”,如图6所示。 将技能文件下载至本地,待后续使用。 图6 导出技能 在科大讯飞创建同名技能后,导入技能文件 执行本操作前,需要在科大讯飞平台完成账号注册操作。 访问科大讯飞的AIUI开放平台。 单击界面上方的“技能工作室”。进入“技能控制台”页面,如图7所示。 图7 技能控制台 单击“创建技能”,弹出如图8所示的对话框。
驱动任务结束时间,格式遵循:RFC 3339, 例 “2020-07-30T10:45:17Z” is_tail Boolean 是否为尾部(任务数据已全部生成,后续没有新的数据) 默认取值: false audio String 音频数据,Base64编码,1秒内的数据。 blendshapes
关键词搜索框,可输入图片名称进行精准搜索。 示例:科技。 纯色背景 支持设置为透明背景(第一张图),此时不支持添加视频素材,且已添加的素材也会全部清除。 支持设置为纯色背景,可以选择已有的颜色,也可以自定义颜色。 筛选条件 支持通过背景、类型的维度,筛选展示下方的图片。 图片列表 默