检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在左侧导航栏中,单击“任务中心”。 在“分身数字人”页签,单击数字人定制任务右侧的“查看详情”,进入“定制任务详情”页面。 审核通过后,任务状态变更为“算法训练中”,如图1所示。 单击右上角的“编辑”,可以为数字人添加标签。标签添加完成后,单击“保存”,保存修改。 图1 数字人定制任务
在科大讯飞平台创建应用(AIUI通用语义模型) 在科大讯飞AIUI开放平台,创建AIUI通用语义模型的应用。 AIUI通用语义模型应用,不支持直接切换为星火交互认知大模型。因为已配置内容不适用,建议参考在科大讯飞平台创建应用(星火交互认知大模型)单独为其创建应用。 详细操作如下所示,具体的操作步骤请参见科大讯飞的文档中心。
在科大讯飞平台创建应用(星火交互认知大模型) 在科大讯飞AIUI开放平台,创建星火交互认知大模型的应用。 星火交互认知大模型应用,不支持直接切换为AIUI通用语义模型。因为已配置内容不适用,建议参考在科大讯飞平台创建应用(AIUI通用语义模型)单独为其创建应用。 详细操作如下所示,
用户如何举报平台违规内容? 如何调用MetaStudio接口? 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 如何实时切换智能交互的语言和声音? 父主题: 附录
的问答信息更丰富。 创建智能交互数字人中的“第三方应用”选择“奇妙问”时,才需要执行本节操作。 用户使用奇妙问前,需要联系奇妙问的客户经理注册开通服务。 客户经理的联系方式,可以在云商店语音合成商品页面查看,如图1所示。 图1 查看联系方式 操作步骤如下所示。详细操作请联系奇妙问
号 算法基本原理 数字人照片建模算法是指使用深度学习算法将已授权的人像照片信息转换为数字人3D模型的一种技术。 其基本情况包括: 输入数据:有授权的人像照片。 算法原理:使用深度学习算法,将人像照片转换为数字人3D模型。 输出结果:数字人3D模型。 应用领域:数字人照片建模算法可
完成审核。 图4 定制任务详情 审核通过后,任务状态变更为“算法训练中”,如图所示。 数字人定制任务审核通过后,启动算法训练,会在3个工作日内训练完成并生成数字人。 图5 数字人定制任务 等待数字人模型训练完成后,任务状态变更为“算法训练完成”,如图6所示。 图6 数字人定制任务
Flexus形象和声音使用限制 Flexus分身数字人目前仅支持视频制作,不支持视频直播和智能交互。 视频制作限制 Flexus数字人采用实景拍摄,视频制作时不支持切换背景。 Flexus分身数字人左上角会有标识。未带有标识的数字人均为标准版形象。 需注意Flexus视频制作和标准版视频制作分开计费,从各自的套餐包中扣除费用。
23ab33712d94f2940c147e8a65d8e18e0f3d3ceff8c513c4a4b9d5c03cac46db 重要变更,见•重要变更:1.4.2.1-create新增参数... 1.1.2 2024-04-02 Web SDK:HwICSUiSDK-1.1.2.zip
言,并用默认语言与用户进行问答。可通过界面右上方的语言切换图标,切换语言。 注意:科大讯飞场景下,如果选择“英文”,科大讯飞应用要新增English情景模式,详见创建智能交互数字人(科大讯飞)。 声音 单击声音右侧的图标,切换数字人声音。 这里选择的声音,需要与前面选择的语言匹配
点不同,MetaStudio的终端节点如表1所示。您也可以从地区和终端节点中查询服务的终端节点。 表1 MetaStudio的终端节点 区域名称 区域 终端节点(Endpoint) 华东-上海一 cn-east-3 metastudio.cn-east-3.myhuaweicloud
我们只需要复制这个文案添加到字幕轨道中,找到文字转语音的按钮,选择“电影解说” 这个配音,点击进行转换,然后稍作等待,大家就能听到熟悉的声音。 同样,我们再来试试语音转文字,将我们的视频拖入视频轨道,选中它,找到我们的语音转文字功能,同样转换的速度也是很快。 我们这里是支持字幕一键同步及srt字幕的导出。 聊
用户上传图片超过4K,服务不支持 要求用户更换符合要求的图片 400 MSS.45000021 推理外部错误 推理模块初始化失败 联系技术支持,确认具体问题。 400 MSS.45000022 模型混合异常 横屏模型不能和竖屏模型一起使用 要求用户更换为同类型的模型 400 MSS.45000023
如表3所示。 图12 开播页面 表3 界面说明 界面元素 说明 00:01:20 直播计时,当前已直播1分20秒。 切换互动内容播报的声音。默认为主播声音,可切换为助播声音。 单击快捷图标,选择预置的互动内容发送播报。 请输入互动内容,回车发送内容 手工输入互动内容,发送成功后,
声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。 确认声音制作任务已训练完成后,在左侧导航栏中,单击“我的创作”。
音频录制说明 音频录制 说明 采样率 推荐使用48kHz采样率录制音频。 苹果手机设置简易录音机录音参数的操作如下所示: 打开简易录音机软件,切换至设置“Settings”页面。 选择“Format”,进入“Format”页面。 设置如下选项: 文件格式:选择“.wav (PCM)”或MP3格式。
ms,会结束语音识别。建议该值大于500ms。 委托语言交互服务(SIS) 如需使用热词功能,请开启委托授权。SIS服务用于将用户口述音频转换为文本。 热词 仅开启“委托语言交互服务(SIS)”后,才会展示“热词”配置。 数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,
间,实现数字人视频制作、直播、智能交互和数字人IP代言等场景。 数字人升级迭代快,提升产品竞争力 口型精准:口型匹配度>95%,多语种无缝切换,泛化能力强。 表情自然:AI眼神纠正,持续眼神交流,细节更丰富。 图像真实:智能重打光,背景融合更真实。 多种复杂场景建模:支持人物走动、侧身等训练,肢体动作更自然。
中设置相关权限,并且该权限仅对此项目生效;如果在“所有项目”中设置权限,则该权限在所有区域项目中都生效。访问MetaStudio时,需要先切换至授权区域。 权限根据授权精细程度分为角色和策略。 角色:IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该机制以服务为粒
如表4所示。 图13 开播页面 表4 界面说明 界面元素 说明 00:01:20 直播计时,当前已直播1分20秒。 切换互动内容播报的声音。默认为主播声音,可切换为助播声音。 单击快捷图标,选择预置的互动内容发送播报。 请输入互动内容,回车发送内容 手工输入互动内容,发送成功后,