检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在科大讯飞平台创建应用(星火交互认知大模型) 在科大讯飞AIUI开放平台,创建星火交互认知大模型的应用。 星火交互认知大模型应用,不支持直接切换为AIUI通用语义模型。因为已配置内容不适用,建议参考在科大讯飞平台创建应用(AIUI通用语义模型)单独为其创建应用。 详细操作如下所示,
区域的“取消激活”,将资产设置为“未激活”状态。未激活状态的资产在控制台不可用。 查看详情:单击资产卡片,进入“图片详情”界面,查看资产的全部信息,如图5所示。 编辑资产:单击资产卡片,在“图片详情”界面,单击“编辑”,修改资产信息。 删除资产:单击资产卡片,在“图片详情”界面,单击“删除”,删除资产。
SP用户仅对大客户开放申请和使用。 SP用户不支持自己使用购买的资源包。 SP用户不支持访问MetaStudio控制台,进行控制台操作。 操作步骤 注册华为账号:单击进入注册页面。 完成实名认证:单击进入实名认证。 获取所在Region的项目ID,操作方法如获取项目ID所示。 大客户可以提交工单,或者
用户如何举报平台违规内容? 如何调用MetaStudio接口? 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 如何实时切换智能交互的语言和声音? 父主题: 附录
号 算法基本原理 数字人照片建模算法是指使用深度学习算法将已授权的人像照片信息转换为数字人3D模型的一种技术。 其基本情况包括: 输入数据:有授权的人像照片。 算法原理:使用深度学习算法,将人像照片转换为数字人3D模型。 输出结果:数字人3D模型。 应用领域:数字人照片建模算法可
的问答信息更丰富。 创建智能交互数字人中的“第三方应用”选择“奇妙问”时,才需要执行本节操作。 用户使用奇妙问前,需要联系奇妙问的客户经理注册开通服务。 客户经理的联系方式,可以在云商店语音合成商品页面查看,如图1所示。 图1 查看联系方式 操作步骤如下所示。详细操作请联系奇妙问
ext值为“饭了么”,需要将两条通知的text值拼接在一起才是完整的内容。 文本问答的用法 智能交互默认是语音问答,如需使用文本问答,需要切换模式。可以通过下述2种方式处理: 在开始对话时设置。使用startChat接口开启对话时,设置成文本问答模式,如下所示: const { result
enterActive 数字人激活事件。 × √ enterSleep 数字人自动休眠事件。 × √ jobInfoChange 交互任务信息变更事件。 √ √ speakingStart 数字人开始讲话事件。 × √ speakingStop 数字人结束讲话事件。 × √ speechRecognized
完成审核。 图4 定制任务详情 审核通过后,任务状态变更为“算法训练中”,如图所示。 数字人定制任务审核通过后,启动算法训练,会在3个工作日内训练完成并生成数字人。 图5 数字人定制任务 等待数字人模型训练完成后,任务状态变更为“算法训练完成”,如图6所示。 图6 数字人定制任务
Flexus形象和声音使用限制 Flexus分身数字人目前仅支持视频制作,不支持视频直播和智能交互。 视频制作限制 Flexus数字人采用实景拍摄,视频制作时不支持切换背景。 Flexus分身数字人左上角会有标识。未带有标识的数字人均为标准版形象。 需注意Flexus视频制作和标准版视频制作分开计费,从各自的套餐包中扣除费用。
23ab33712d94f2940c147e8a65d8e18e0f3d3ceff8c513c4a4b9d5c03cac46db 重要变更,见•重要变更:1.4.2.1-create新增参数... 1.1.2 2024-04-02 Web SDK:HwICSUiSDK-1.1.2.zip
言,并用默认语言与用户进行问答。可通过界面右上方的语言切换图标,切换语言。 注意:科大讯飞场景下,如果选择“英文”,科大讯飞应用要新增English情景模式,详见创建智能交互数字人(科大讯飞)。 声音 单击声音右侧的图标,切换数字人声音。 这里选择的声音,需要与前面选择的语言匹配
理的期限内删除您的个人信息或进行匿名化处理。 如何联系我们 我们设立了个人信息保护专职部门,您可以在注册华为云账号后,通过访问个人行使权利的申请受理页面,我们会尽快回复。 公司注册地址:贵州省贵安新区黔中大道交兴功路华为云数据中心,华为云计算技术有限公司。邮编:550029。 如
Studio服务内容审核功能。 如果服务接收到直播内容投诉,按照国家相关部门要求,会冻结违规的直播间及直播任务。情节严重的,还会冻结租户的全部资源。 父主题: 使用限制
CleanUpInsertCommand 参数 是否必选 参数类型 描述 command_ids 否 Array of strings 命令ID列表。如果不填,则清理全部未播放的插入命令。 最小长度1,最大长度64。 数组长度:0~100。 父主题: 附录
声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。 确认声音制作任务已训练完成后,在左侧导航栏中,单击“我的创作”。
用户上传图片超过4K,服务不支持 要求用户更换符合要求的图片 400 MSS.45000021 推理外部错误 推理模块初始化失败 联系技术支持,确认具体问题。 400 MSS.45000022 模型混合异常 横屏模型不能和竖屏模型一起使用 要求用户更换为同类型的模型 400 MSS.45000023
音频录制说明 音频录制 说明 采样率 推荐使用48kHz采样率录制音频。 苹果手机设置简易录音机录音参数的操作如下所示: 打开简易录音机软件,切换至设置“Settings”页面。 选择“Format”,进入“Format”页面。 设置如下选项: 文件格式:选择“.wav (PCM)”或MP3格式。
间,实现数字人视频制作、直播、智能交互和数字人IP代言等场景。 数字人升级迭代快,提升产品竞争力 口型精准:口型匹配度>95%,多语种无缝切换,泛化能力强。 表情自然:AI眼神纠正,持续眼神交流,细节更丰富。 图像真实:智能重打光,背景融合更真实。 多种复杂场景建模:支持人物走动、侧身等训练,肢体动作更自然。
如表4所示。 图13 开播页面 表4 界面说明 界面元素 说明 00:01:20 直播计时,当前已直播1分20秒。 切换互动内容播报的声音。默认为主播声音,可切换为助播声音。 单击快捷图标,选择预置的互动内容发送播报。 请输入互动内容,回车发送内容 手工输入互动内容,发送成功后,