检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如果训练生成的数字人形象不满足需求,单击右下方的“驳回”,进入“问题填写”界面。 输入“问题标题”、“问题描述”,并上传相应的附件,如更新后的绿幕视频文件等内容。如果存在多个问题,可以单击界面右上角的“添加问题”,增加多个问题描述。问题全部添加完成后,单击“确认”,等待服务管理员处理。 用户
“X-Subject-Token”就是需要获取的用户Token。有了Token之后,您就可以使用Token认证调用其他API。 建议在配置文件或者环境变量中密文存放,使用时解密,确保安全。 图1 管理员创建IAM用户响应消息头 响应消息体(可选) 该部分可选。响应消息体通常以结构
在“识别热词”区域,单击“下载热词模板”,将模板下载至本地。 本地打开模板文件,按照模板提示,输入需要添加的热词,示例如下所示: 数字人对话,weight:4.0 文件编辑完成后,单击“上传热词”,将文件上传至应用中。 单击界面右上方的“保存修改”,保存应用修改。 配置应用的设备人设。
租户级自定义读法配置、修改TTS租户级自定义读法配置。 2024-12-05 第十三次正式发布 本次变更如下: 新增接口组:分身数字人字幕文件生成管理。 新增接口组:第三方直播平台管理。 2024-11-30 第十二次正式发布 本次变更如下: 语音合成管理接口组,新增接口:创建TTS异步任务、获取TTS异步任务。
用户可以执行如下操作: 单击视频,预览视频播放效果。 单击“再次制作”,可再次制作照片数字人视频。 单击“下载至本地”,下载照片数字人视频至本地。下载后的文件为mp4格式。 图3 照片数字人视频生成成功 父主题: 照片数字人
视频直播限制 分身数字人直播限制,如下所示: 直播间配置约束 直播任务退出说明 直播播放说明 直播内容审核说明 直播间配置约束 直播间配置限制,如表1所示。 表1 直播间限制 直播间配置 限制 文本驱动 每个单场景中所有段落输入文字的总量需大于200字。 每个段落的文本字符数量需
//IAM用户名 "password": $ADMIN_PASS, //IAM用户密码,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全 "domain": {
界面元素 说明 本地导入 单击“本地导入”,从本地选择MOV、MP4、M4V、MKV、FLV、3GP、WMV或AVI格式的视频文件上传。 也支持直接拖拽本地视频文件至视频列表区域,完成上传操作。 界面默认展示两列视频,单击图标后,缩小展示为1列视频。单击图标,可恢复为2列展示。 关键词搜索框,可输入视频名称进行精准搜索。
回复一条文本内容。 示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。
贴图,丰富视频画面。 视频:无声音视频素材列表,支持本地导入,支持MOV、MP4、M4V、MKV、FLV、3GP、WMV和AVI格式的视频文件。支持添加为背景视频。 商品:商品列表。需要自定义创建商品,一个商品可以同时包含贴图、视频、文本和音频内容。 文本:文本模板列表,可选择一个文本模板,在视频直播画面上添加文本。
0版本SDK,相比2.1.0版本,变更点如下所示: 新增接口sendDrivenText,支持发送智能交互数字人主动播报文本信息。 解决IDE加载TS声明文件报错问题。 2024-11-13 本次变更如下: 新增发布2.1.0版本SDK,相比2.0.3版本,变更点如下所示: 支持文本问答。 st
用户可以执行如下操作: 单击名片,预览名片生成效果。 单击“再次制作”,可再次制作数字人名片。 单击“下载至本地”,下载数字人名片至本地。下载后的文件为mp4格式。 图4 名片生成成功 父主题: 数字人名片制作
创建智能交互数字人 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人进行交互对话。相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。 图1 MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。
新闻播报风格文案 大家好,欢迎收听今天的新闻播报。我是主持人小A。现在为您带来最新的国内外要闻。 首先是国内新闻。 我们先来关注一下生活类新闻, 近年来,随着健康意识的提升,全国范围内的健身热潮愈发火爆。 从早晨的广场舞到晚上的健身房,人们纷纷加入到各种形式的健身运动中。 专家表
主入口(HwICSUiSdk) 本节介绍Web SDK的接口详情。 表1 接口 接口 描述 activeInteractionMode 获取当前生效的交互模式(语音问答/文本问答)。 addEventListeners 回调注册。 checkBrowserSupport 检查浏览器是否支持。
智能交互公共配置 智能交互界面支持添加角色、背景、对话,可参考本节进行操作。 角色 角色界面详情,如图1所示。 图1 角色界面 角色界面说明,如表1所示。 表1 界面元素说明 界面元素 说明 定制数字人 单击“定制数字人”,跳转至形象制作页面,界面详情和操作指导,详见创建分身数字人定制任务。
代码示例,如下所示: URI uri = URI.create(llm_url); long currentTimeMillis = System.currentTimeMillis(); String input = uri.toString() + currentTimeMillis;
率。 算法运行机制 训练阶段输入预先获取的高质量语音及其表情基系数,通过学习获得语音特征与表情基系数的关系。 用户使用时,输入音频流或音频文件。 音频经过安全审核后,进入下一步操作,否则不返回结果。 对音频特征提取后,获取音频特征,再通过算法将音频特征转换为表情基系数。 返回结果数据。