检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建应用 参数 说明 第三方应用 配置说明如下所示: 科大讯飞平台应用的“自然语言模型”配置为“AIUI通用语义模型”时,如配置应用所示。请从下拉框中选择“科大讯飞AIUI通用语义模型”。 科大讯飞平台应用的“自然语言模型”配置为“星火交互认知大模型”时,如配置应用所示。请从下拉框中选择“科大讯飞星火交互认知大模型”。
修订记录 发布日期 修订记录 2024-07-09 新增PHP和Node.js语言SDK。 2023-06-30 第一次正式发布。
前提条件 场景说明 创建智能交互数字人(华为云CBS) 创建智能交互数字人(科大讯飞) 创建智能交互数字人(奇妙问) 创建智能交互数字人(第三方语言模型) 创建智能交互数字人(二次开发场景) 智能交互公共配置
用户如何举报平台违规内容? 如何调用MetaStudio接口? 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 如何实时切换智能交互的语言和声音? 父主题: 附录
声音更新记录 2024年12月 表1 声音更新记录 发音人名称 性别 TTS版本 风格 语言 对话女生 女 TTS V7 - 中文 广告男声 男 TTS V7 - 中文 教育女声 女 TTS V7 - 中文 客服男声 男 TTS V7 - 中文 客服女声 女 TTS V7 - 中文
创建应用 参数 说明 第三方应用 配置说明如下所示: 科大讯飞平台应用的“自然语言模型”配置为“AIUI通用语义模型”时,如配置应用所示。请从下拉框中选择“科大讯飞AIUI通用语义模型”。 科大讯飞平台应用的“自然语言模型”配置为“星火交互认知大模型”时,如配置应用所示。请从下拉框中选择“科大讯飞星火交互认知大模型”。
如果未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景。 请选择声音性别 声音的性别,用于匹配声音模型的精准度。 如下所示: 男生 女生 原始输入语言 上传语料所使用的语言。 包含如下语言: 中文 英文 须知:当前参数配置仅作为标识,对训练结果没有任何影响。 选择声音标签 声音的标签。作用为选择声音时,快速筛选领域。
使用“语料上传”的方式,直接上传一个已录制好的长音频WAV或MP3文件,无需压缩,无需携带文案txt文件。 请选择声音性别 选择声音的性别,示例:女生。 原始输入语言 选择上传语料所使用的语言,示例:中文。 选择声音标签 声音的标签。请根据所选文案样例,选择相应的标签,如下所示: 营销:营销宣传风格文案 新闻:新闻播报风格文案
普通文档 上传问答题库的操作。 单击“问答题库”区域的“新建题库”,进入“创建问答库”页面,如图7所示。 设置如下参数: 语言:从下拉框中选择问答文件的语言类型,默认为:中文。 问答库名称:输入问题库名称。 图7 创建问答库 单击“问答模板下载”,下载模板文件至本地,必须按照模板格式准备问答文件。
(可选)新增English情景模式 前面的所有操作,都是main情景模式下的配置,如果智能交互公共配置时,语言选择“中文”,则main情景模式下的配置生效。 如果智能交互公共配置时,语言选择“英文”,当前应用需要新增English情景模式,才能对话成功。 操作步骤,如下所示: 在界面上方的主菜单中,单击“我的应用”。
(可选)新增English情景模式 前面的所有操作,都是main情景模式下的配置,如果智能交互公共配置时,语言选择“中文”,则main情景模式下的配置生效。 如果智能交互公共配置时,语言选择“英文”,当前应用需要新增English情景模式,才能对话成功。 操作步骤,如下所示: 在界面上方的主菜单中,单击“我的应用”。
xt为“你吃”,第二条新返回了“饭了么”,则第二条text值为“饭了么”,需要将两条通知的text值拼接在一起才是完整的内容。 文本问答的用法 智能交互默认是语音问答,如需使用文本问答,需要切换模式。可以通过下述2种方式处理: 在开始对话时设置。使用startChat接口开启对话时,设置成文本问答模式,如下所示:
图像真实:智能重打光,背景融合更真实。 多种复杂场景建模:支持人物走动、侧身等训练,肢体动作更自然。 多语言泛化:一次母语训练,多语种支持;支持20+语种,覆盖主流语言。 相对真人成本下降90%以上 一次拍摄与训练后,可无限次使用;无时间约束、无时长限制、无容量限制;统一质量
01:18 万兴科技数字人 “华斯卡”颁奖典礼 与数字人主持一同揭晓入围作品 20:29 华为影业“华斯卡”颁奖典礼 华为云普朗克展厅 数字人多国语言讲解展屏内容 00:56 华为云普朗克展厅数字人 贵州电商云 数字人直播让非遗产品走向世界 01:39 贵州电商云数字人 徐福记数字人直播
用户阅读隐私政策。隐私政策需方便用户查看,例如用户在App主功能界面中通过4次以内的点击或滑动操作可访问。 描述语言需要清晰通俗,符合通用语言习惯,避免使用有歧义的语言。 隐私政策内容要包含产品及服务收集个人信息的目的、方式和范围,个人信息处理者的名称和联系方式等。 您的产品及服
language model is empty. 请正确配置第三方语言模型。 MSS.47010131 The third-party language model url is empty. 请正确配置第三方语言模型地址。 MSS.47010134 Invalid third-party
频处理工具,万兴播爆和万兴喵影。 万兴播爆是跨境出海营销人必备的数字人短视频工具,里面有200多款数字人模特。 而且能说80多种不同国家的语言,只需要输入一段文案,就能让数字人帮你念出来,生成一段数字人视频。 万兴喵影则是专为高级视频剪辑而生的工具,不仅如此,它还能处理音频,让你的视频在听觉和视觉上都更吸引人。
每个单场景中所有段落输入文字的总量需大于200字。 每个段落的文本字符数量需小于2000,如果包含语音合成标记语言SSML标签,需小于3000。 整个直播间所有段落的文本总字符数,如果包含语音合成标记语言SSML标签时,需小于30万。 音频驱动 每个单场景上传音频的时长需大于1分钟,大小不超过100M。
HUAWEI_EI:EI TTS MOBVOI:出门问问TTS language String 语言类型。默认值CN。 CN:中文。 EN:英文。 默认取值: CN language_desc String 语言描述。 状态码: 400 表11 响应Body参数 参数 参数类型 描述 error_code
47010130 第三方语言模型配置为空 第三方语言模型配置为空 请携带正确的第三方语言模型配置 400 MSS.47010131 第三方语言模型地址为空 第三方语言模型地址为空 请携带正确的第三方语言模型地址字段 400 MSS.47010134 第三方语言模型地址非法 第三方语言模型地址非法