检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
R(名片效果图) 资产类型为IMAGE时,包含MAIN 资产类型为VIDEO时,包含MAIN、COVER 约束限制: 一个资产中MAIN文件只有一个,且必须有一个 取值范围: 字符长度1-128位。 默认取值: 不涉及 响应参数 状态码: 200 表4 响应Header参数 参数
三方驱动场景(是否支持) 非三方驱动场景(是否支持) activeInteractionMode 获取当前生效的交互模式(语音问答/文本问答)。 × √ addEventListeners 回调注册。 √ √ checkBrowserSupport 检查浏览器是否支持。 √ √ create
不同声音对表1中操作的支持情况有差异。如果表1中操作项置灰,说明当前选择的声音不支持此操作。需要重新选择一个支持所需操作的声音模型,进行文本驱动设置。 表1 操作说明 操作 说明 插入停顿 将鼠标放在需要停顿的文字右侧,单击“插入停顿”。在弹出的提示框中,选择“换气”或者停顿的时间,也支持自定义停顿时长。
命令名称。 INSERT_PLAY_SCRIPT:插入表演脚本。用于互动回复。数字人不变,背景不变。params结构定义:ShootScript。 REWRITE_PLAY_SCRIPT:动态编辑未播放剧本。params结构定义:scene_scripts。 INSERT_PLAY_AU
如何实时切换智能交互的语言和声音? 智能交互对话项目支持同时添加中文和英文语言,以实现智能交互页面中英文界面的实时切换。 详细配置说明,如下所示: 登录MetaStudio控制台,单击“智能交互”。 如果是展厅场景,需要切换到“华北-北京四”区域。因为展厅的配置,均在“华北-北京四”区域。
输入主题,便于问题查找,不包含问题内容。 所有问法 输入所有提问方式。问法包括同一个问题的不同提问方式。 支持最多添加500个相似问题,每个问题不能超过64个字符。 数字人回答 输入数字人回答。 单击“保存”,界面左侧的“问答列表”中新增一个问答对,示例如图4所示。 图4 添加问答 所有问答对录入完成
作、直播、智能交互和数字人IP代言等场景。 数字人升级迭代快,提升产品竞争力 口型精准:口型匹配度>95%,多语种无缝切换,泛化能力强。 表情自然:AI眼神纠正,持续眼神交流,细节更丰富。 图像真实:智能重打光,背景融合更真实。 多种复杂场景建模:支持人物走动、侧身等训练,肢体动作更自然。
项目ID,获取方法请参考获取项目ID。 表2 Query参数 参数 是否必选 参数类型 描述 business 否 String 业务类型。可填多个用","分隔 VOICE_CLONE:声音制作 SYNTHETICS_SOUND:声音合成 ASSET_MANAGER:资产管理 MODELING_2D:形象制作
默认取值: 10 state 否 String 任务状态,默认所有状态。 可多个状态查询,使用英文逗号分隔。 如state=CREATING,PUBLISHED sort_key 否 String 排序字段,支持的排序方式有: 按创建时间排序:create_time 按更新时间排序:update_time
文本驱动 音频制作完成后,可单击音量图标,调整音频的音量。 上述操作全部完成后,第一个场景的视频内容已制作完成。 如果还需要制作更多场景,可单击“场景”区域的“+”图标,新增场景。制作过程参考第一个场景即可。 图3 场景区域 所有场景设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。
取值范围: true: 支持中文多音字 false: 不支持中文多音字 默认取值: false is_support_break_time Boolean 参数解释: 该声音是否支持停顿。 约束限制: 不涉及 取值范围: true: 支持停顿 false: 不支持停顿 默认取值: false
(横屏)或9:16(竖屏),建议优先使用竖屏拍摄。支持MP4、MOV格式的视频,推荐MP4格式。 训练生成的分身数字人形象与真人形象完全相同。 声音制作语料类型 Flexus分身数字人制作任务会同时生成一个Flexus形象和一个Flexus声音,所以也需要提供音频。 单独上传语料
withSpeed(100); body.withText("测试用朗读文本。"); body.withScriptType(CreateTTSAReq.ScriptTypeEnum.fromValue("TEXT")); body.withVoiceAsset
输出的语言受限制。使用自定义声音合成音频时,仅支持17种语言:中文、英文、德语、法语、土耳其语、菲律宾语、日语、意大利语、马来语、俄罗斯语、韩语、芬兰语、西班牙语、印尼语、阿拉伯语、葡萄牙语、荷兰语(暂未开放泰语)。 操作限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,
training_input_source_url String 用户原始输入数据url。 create_type String 任务创建方式。 PACKAGE: 使用一个zip包包含所有数据 SEGMENT: 逐句上传数据 tag String 任务标签。 ECOMMERCE: 电商 NEWS: 新闻 MARKETING:
参数类型 描述 tag 否 String 任务标签。 ECOMMERCE: 电商 NEWS: 新闻 MARKETING: 营销 description 否 String 一段描述信息,会呈现在资产库中。 sex 否 String 语音性别,是男性声音还是女性声音。 FEMALE:
in the recently concluded Hunan Provincial Youth Championship. Despite the hardships of life and the difficulties of training, he has not retreated
事件通知(EventMap) 本节介绍Web SDK的EventMap事件。 表1 通知列表 接口 描述 三方驱动场景(是否支持) 非三方驱动场景(是否支持) error 错误事件。 √ √ enterActive 数字人激活事件。 × √ enterSleep 数字人自动休眠事件。
SDK:HwICSUiSDK-3.0.2.zip 57fb6f80f293ea904dbb67b6141e28795faf9da23bb8d9ca055617f4d30ae081 下载Web SDK安装包。 3.0.1 2024-12-30 Web SDK:HwICSUiSDK-3.0.1.zip 47254a
Safari浏览器 16.5+ 预制唤醒能力 自3.0.1版本开始,SDK支持唤醒能力(注意:如果使用了websocket接口驱动数字人的方案,是不支持websdk内置语音唤醒能力的)。预制的唤醒能力支持使用“你好云笙”、“稍等一下”、“谢谢再见”三个唤醒词,进行数字人唤醒、打断和退出。