检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如“天气查询工具”,可以用于回答天气的问题。 知识库 单击“添加”,在弹出的“选择知识库”对话框中,勾选对应的知识库。 这里的知识库均为“普通文件”类型,其来源请参考新增知识库-上传普通文件。 回答仅限于文档 是否开启回答仅限于文档。 如果开启此设置, 数字人仅回答知识库中内容。如果超出知识库范围,数字人使用兜底话术答复。
第一次单击可折叠“文本驱动/视频驱动”,第二次单击后恢复展示。 音频驱动 需从本地上传已录制好的音频。音频文件格式需要为WAV、MP3或M4A,大小不能超过100M。 可单击“导入”上传音频,也可以直接拖拽本地音频文件至提示区域中,完成上传。单击左侧的图标,可试听音频效果。如果音频效果不佳,可以单击“导入”,覆盖更新音频。
在“识别热词”区域,单击“下载热词模板”,将模板下载至本地。 本地打开模板文件,按照模板提示,输入需要添加的热词,示例如下所示: 数字人对话,weight:4.0 文件编辑完成后,单击“上传热词”,将文件上传至应用中。 单击界面右上方的“保存修改”,保存应用修改。 配置应用的设备人设。
所有场景设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。 参数设置说明如下所示: 分辨率:根据实际情况,选择视频的分辨率。 导出为:输入导出文件的名称。 画质增强:开启后将提升视频清晰度,合成时间相应变长。请根据实际情况确定是否开启。 单击“确定”,弹出“视频制作任务中心”对话框。
a/fas 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户项目ID 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 audio_file_download_url 是 String 语音驱动音频文件下载URL,格式为AAC或者MP3
“X-Subject-Token”就是需要获取的用户Token。有了Token之后,您就可以使用Token认证调用其他API。 建议在配置文件或者环境变量中密文存放,使用时解密,确保安全。 图1 管理员创建IAM用户响应消息头 响应消息体(可选) 该部分可选。响应消息体通常以结构
可商家在收费之余却忽视了消费者的观看体验。 视频平台应该更多地向自身挖掘内容,而不是一味地向用户涨价。 无论哪方都需要多方面考量,结合多终端兼容的市场需要, 为人民带来更加丰富的资源,才能走得长远。 网络暴力是当前社会面临的一大问题。 在社交媒体上,人们可以随意发表言论, 但是也需要意识到这些言论所带来的后果。
在“识别热词”区域,单击“下载热词模板”,将模板下载至本地。 本地打开模板文件,按照模板提示,输入需要添加的热词,示例如下所示: 数字人对话,weight:4.0 文件编辑完成后,单击“上传热词”,将文件上传至应用中。 单击界面右上方的“保存修改”,保存应用修改。 配置应用的设备人设。
如果训练生成的数字人形象不满足需求,单击右下方的“驳回”,进入“问题填写”界面。 输入“问题标题”、“问题描述”,并上传相应的附件,如更新后的绿幕视频文件等内容。如果存在多个问题,可以单击界面右上角的“添加问题”,增加多个问题描述。问题全部添加完成后,单击“确认”,等待服务管理员处理。 用户
租户级自定义读法配置、修改TTS租户级自定义读法配置。 2024-12-05 第十三次正式发布 本次变更如下: 新增接口组:分身数字人字幕文件生成管理。 新增接口组:第三方直播平台管理。 2024-11-30 第十二次正式发布 本次变更如下: 语音合成管理接口组,新增接口:创建TTS异步任务、获取TTS异步任务。
率。 算法运行机制 训练阶段输入预先获取的高质量语音及其表情基系数,通过学习获得语音特征与表情基系数的关系。 用户使用时,输入音频流或音频文件。 音频经过安全审核后,进入下一步操作,否则不返回结果。 对音频特征提取后,获取音频特征,再通过算法将音频特征转换为表情基系数。 返回结果数据。
用户可以执行如下操作: 单击视频,预览视频播放效果。 单击“再次制作”,可再次制作照片数字人视频。 单击“下载至本地”,下载照片数字人视频至本地。下载后的文件为mp4格式。 图3 照片数字人视频生成成功 父主题: 照片数字人
asset_state String 资产状态。 cover_url String 封面图片路径。 thumbnail_url String 缩略图路径。 main_url String 缩略图路径。 状态码: 400 表8 响应Body参数 参数 参数类型 描述 error_code
回复一条文本内容。 示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。
该接口用于创建驱动数字人表情、动作及语音的任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsa-jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。 请求参数 表2 请求Header参数
界面元素 说明 本地导入 单击“本地导入”,从本地选择MOV、MP4、M4V、MKV、FLV、3GP、WMV或AVI格式的视频文件上传。 也支持直接拖拽本地视频文件至视频列表区域,完成上传操作。 界面默认展示两列视频,单击图标后,缩小展示为1列视频。单击图标,可恢复为2列展示。 关键词搜索框,可输入视频名称进行精准搜索。
//IAM用户名 "password": $ADMIN_PASS, //IAM用户密码,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全 "domain": {
model file down fail 请检查人物模型资产文件是否存在,不存在请更换人物模型,如果存在请联系技术支持 MSS.47000014 background file down fail 请检背景图片资产文件是否存在,不存在请更换背景,如果存在请联系技术支持 MSS.47000015
asset_state String 资产状态。 cover_url String 封面图片路径。 thumbnail_url String 缩略图路径。 main_url String 缩略图路径。 状态码: 400 表10 响应Body参数 参数 参数类型 描述 error_code
支持多选,支持添加新类别。 产品素材 合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作: 单击商品