检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
本地模型路径中。 使用要求 WebSDK版本为3.0.1及以上。 仅支持数字人平台配置或内置ASR(语音转文本)能力的方案。不支持WebSocket接口驱动数字人方案,即文本驱动方案。 在调用create接口之前,必须要有用户点击集成WebSDK的页面的行为。 浏览器通过有上述点
明。 视频素材:如图中1区域所示,包括模板、角色、背景、贴图、视频、商品、文本等素材。支持使用预置的,也支持自定义生成。 画面布局:简称“画布”,如图中2区域所示。可以在画布中插入人物形象、背景、贴图、文本框、视频等内容,支持调整各项直播素材的大小和图层位置。所有的设置效果均在画布中直观可见。
智能交互根据客户需要,后台提供多种知识库配置,支持配置中英双语。 智能交互基于已有训练生成的数字分身形象模型和声音模型,结合知识库,可与用户进行实时对话。 用户购买路数越多,同时进行数字人交互对话的数量则越多。 资源超过有效期后将无法使用,建议开通自动续费功能。 路数就是并发数,是智能交互同时执行的任务数量。需
否 String 使用AK/SK方式认证时必选,携带项目ID信息。 X-App-UserId 否 String 第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 valid_period 否 Integer 有效天数(0表示长期有效)。 取值范围:
否 String 使用AK/SK方式认证时必选,携带项目ID信息。 X-App-UserId 否 String 第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 clean_auth_credential 否 Boolean 是否清除鉴权凭证。
thumbnail_url String 缩略图路径。 表6 ProductTextInfo 参数 参数类型 描述 title String 文本标题 text String 文本 表7 ProductMediaDetailInfo 参数 参数类型 描述 asset_id String 资产ID asset_type
能”)。为了提供交互功能,SDK会通过您主动点击聊天按钮申请客户应用或浏览器的麦克风权限,在您同意客户应用使用麦克风之后,将您的音频数据或文本数据上传到客户指定的第三方系统或模型,用于识别语义并做出应答,给您提供交互功能。 产品运营和维护 为了保障SDK稳定运行,改善产品的运营策
thumbnail_url String 缩略图路径。 表8 ProductTextInfo 参数 参数类型 描述 title String 文本标题 text String 文本 表9 ProductMediaDetailInfo 参数 参数类型 描述 asset_id String 资产ID asset_type
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。
用户上传的用于制作数字人名片的图片。 introduction_type 否 String 自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音。文本驱动需要填写introduction_text和voice_asset_id参数。 AUDIO: 语音驱动,需要在资产库中
用户上传的用于制作数字人名片的图片。 introduction_type 否 String 自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音。文本驱动需要填写introduction_text和voice_asset_id参数。 AUDIO: 语音驱动,需要在资产库中
false is_support_phoneme 否 Boolean 参数解释: 该声音是否支持中文多音字。 约束限制: 不涉及 取值范围: true: 支持中文多音字 false: 不支持中文多音字 默认取值: false is_support_break_time 否 Boolean
参数类型 描述 text_type String 参数解释: 文本类型。 DYNAMIC:动态文本,需要进行关键字替换。 STATIC:静态文本。 默认取值: DYNAMIC text_context String 文本。 font_name String 参数解释: 字体。当前支持的字体:
在左侧导航栏中,选择“我的创作”。 选择“声音 > 已购”页签,界面如图10所示。 图10 已购声音凭证 单击界面右上方的“添加凭证”,弹出“购买序列号”对话框,如图11所示。 参数配置说明,如表1所示。 图11 购买序列号 表1 参数说明 参数 说明 主体 购买出门问问声音套餐中购买套餐包的归属主体,从下拉框中选择“出门问问”。
X-App-UserId 否 String 第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 text 是 String 待合成文本。 tts_text 否 String 发送给tts的待合成文本。 emotion 是 String 音色ID,获取方式详见获取音色ID。
参数类型 描述 text_type 否 String 参数解释: 文本类型。 DYNAMIC:动态文本,需要进行关键字替换。 STATIC:静态文本。 默认取值: DYNAMIC text_context 否 String 文本。 font_name 否 String 参数解释: 字体。当前支持的字体:
万兴播爆针对文案也提供了三个AI功能,分别是智能脚本、AI文本翻译,甚至是AI视频翻译。 其中AI视频翻译是最新的功能,支持多种语言的翻译 像咱们国内的跨境卖家,就完全可以把国内已经录制好的视频,直接上传,就可以把视频翻译为多国籍的版本,口音也可以选择。 文案可以自己撰写,写好了可以直接上传到对话框,就可以直接生成口
false is_support_phoneme Boolean 参数解释: 该声音是否支持中文多音字。 约束限制: 不涉及 取值范围: true: 支持中文多音字 false: 不支持中文多音字 默认取值: false is_support_break_time Boolean 参数解释:
参数类型 描述 text String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。
introduction_type String 自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动,需要在资产库中先上传语音资产 默认取值: TEXT introduction_text String 自我介绍文本,用于驱动数字人口型。 voice_asset_id String