检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
方驱动;6:第三方语言模型;8:奇妙问 取值范围: 0-32 app_key String 应用的AccessKey或帐号。 robot_type String 交互对接类型 LIVE:直播交互 CHAT:智能交互 language String 智能交互语言 zh_CN:简体中文(已下线,请使用CN)
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
伯语、葡萄牙语、泰语。 须知:当前参数配置仅作为标识,对训练结果没有任何影响。 请选择输出模型语言 选择输出的声音模型支持的语言。 支持如下语言: 多语种:输出的声音模型,支持合成的语言类型包括中文、英文、德语、法语、土耳其语、菲律宾语、日语、意大利语、马来语、俄罗斯语、韩语、芬
Explorer中,具体API页面的“代码示例”页签查看对应编程语言类型的SDK代码,如图1 获取SDK代码示例所示。 图1 获取SDK代码示例 SDK列表 目前MetaStudio提供了Java、Python和Go语言SDK供开发者使用,如表1所示。您可以在GitHub仓库查看
MetaStudio语音驱动采用语音合成标记语言(SSML,Speech Synthesis Markup Language)来控制数字人的行为,包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。MetaStudio在此基础上,扩展了一些字段用于实现数字人的控制。
MetaStudio制作视频添加的字幕,视频画面中的文本信息都涉及字体。目前MetaStudio服务支持的字体及语言类型如表1所示。 表1 服务支持的字体说明 字体名称 支持的语言类型 Adelle_Sans_Global Adelle_Sans_Global_Bold 中文、英文、德
如何调用MetaStudio接口? MetaStudio提供RESTful API和Java/Python/Go三种语言的SDK。API调用请参考《API参考》,SDK集成请参考API Explorer中的“代码示例”。 父主题: API使用
如何调用MetaStudio接口? MetaStudio提供RESTful API和Java/Python/Go三种语言的SDK。API调用请参考《API参考》,SDK集成请参考API Explorer中的“代码示例”。 父主题: FAQ
界面右侧有“创建角色”入口,下方的“角色中心”区域展示系统预置的角色,可以直接克隆使用。 图2 创建角色 单击“创建角色”,进入“创建角色”页面,如图3所示。 参数配置说明,如表1所示。 图3 创建角色 表1 参数说明 参数 说明 语言 包含中文和英语。 单语言场景,可直接切换语言类型。 多语言场景,可单击右侧的“添加语言”,将中文和英语都添加上。
选择“第三方语言模型”。 应用名称 用户根据实际情况自定义即可。 APPID MetaStudio服务对接第三方语言模型LLM时,需要LLM提供的APPID信息。 APPKEY MetaStudio服务对接第三方语言模型LLM时,需要LLM提供的APPKEY信息。 第三方语言模型地址
热点问题会展示在如图5所示②区域的位置。 语言 数字人对话界面的语言。包含:中文、英文。 支持同时添加中文和英文,并设置其中一种语言为默认语言,则界面信息按照默认语言进行展示。进入智能交互页面时,页面也按照默认语言进行展示,可通过界面右上方的语言切换图标,切换界面展示的语言,同时也是用户与数字人交互的语言。 注意
智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交互服务定义的API接口结构,自主开发第三方语言模型API,对接第三方语言模型到智能交互服务,实现智能交互能力。操作请参考创建智能交互数字人(第三方语言模型)。 场景三:用户使用智能交互
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
使用“语料上传”的方式,直接上传一个已录制好的长音频WAV或MP3文件,无需压缩,无需携带文案txt文件。 请选择声音性别 选择声音的性别,示例:女生。 原始输入语言 选择上传语料所使用的语言,示例:中文。 选择声音标签 声音的标签。请根据所选文案样例,选择相应的标签,如下所示: 营销:营销宣传风格文案 新闻:新闻播报风格文案
如果未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景。 请选择声音性别 声音的性别,用于匹配声音模型的精准度。 如下所示: 男生 女生 原始输入语言 上传语料所使用的语言。 包含如下语言: 中文 英文 须知:当前参数配置仅作为标识,对训练结果没有任何影响。 选择声音标签 声音的标签。作用为选择声音时,快速筛选领域。