检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
公开,所有租户可访问。当前仅提供系统资产可公开访问。 SHARED:共享,指定租户可访问。拥有者指定租户可访问。 expire_time 否 String 共享过期时间。默认过期时间为30天,即共享当天+30的23:59:59。 allowed_project_ids 否 Array
xml的响应参数chat_access_address中获取。 通过WEB SDK调用场景 终端节点地址从智能交互SDK的通知jobInfoChangejobInfoChange的参数websocketAddr中获取。 功能介绍 该接口用于创建用户与数字人对话的WebSocket连接,驱动数字人对话。 调用方法
添加按钮点击触发create接口后,测试是否有声音。如果有声音,就是浏览器的安全策略导致,需要引导用户在create之前点击页面。 检查扬声器设备是否正常。 如果有增删扬声器设备的行为,请刷新或重新打开挂载数字人的页面后重试。如果还不行,请参考第二条,检查设备是否正常。 父主题: Web SDK
单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。 授权书内容,可参考授权书。 单击“提交制作”。 弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。 如果用户确认无误,单击“确认提交”。
视频制作界面说明 用户启动制作视频时,可以先了解下视频制作界面详情。 视频制作界面如图1所示。各区域详细说明,如表1所示。 用户使用数字人形象创作的视频,都会自动保存在MetaStudio控制台首页“最近项目”区域的“视频项目”页签中。用户可以根据实际情况,进行二次创作。 图1 视频制作界面
单击“确定”,弹出“视频制作任务中心”对话框。 可查看视频合成任务的进度,直至合成成功。 单击“合成成功”状态右侧的图标,进入视频详情页面,如图4所示。 单击“预览”,可以看到合成的视频。预览过程中,可全屏播放,或下载视频到本地。 图4 视频详情
效期为24小时)的值,待后续步骤使用。 图2 接口页面 参考OBS的PUT上传接口,上传资产文件至2中返回的upload_url(文件上传地址,有效期为24小时)中,如图3所示。 详细操作说明,如下所示: 在Postman工具中,将upload_url地址作为请求地址,使用PUT方式上传。
剧本保存失败时,请您根据界面提示信息进行问题定位及修改。 提示“剧本名称包含非法字符” 请您根据要求修改剧本名称中的敏感字符。 提示“包含敏感词汇” 可能是讲解词中包含敏感词汇,去除讲解词中的敏感词汇即可。 提示“演示素材不存在或不可用” 请您检查选择的素材是否已激活。 父主题: 视频制作
播的当前场景中。 在视频直播画面预览区域,如果存在多种素材,支持对数字人进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。 将鼠标放在数字人上方,数字人右上角展示图标。单击图标,可以将数字人更新至当前视频直播的所有场景中。 背景 背景界面详情,如图2所示。
获取TTS试听文件 功能介绍 该接口用于获取TTS试听文件下载链接,返回List中包含当前已生产的试听文件。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/ttsc/audition-file/{job_id} 表1 路径参数 参数 是否必选
声音制作任务算法训练完成后,可以查看声音。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 选择“声音制作”,确认声音制作任务已训练完成。 在左侧导航栏中,单击“我的创作”。 选择“声音”,找到已生成的声音,单击声音卡片中的头像,即可试听声音效果。 用户还可以执行如下操作: 单
如下所示,其中加粗的字段需要根据实际值填写。 accountid为IAM用户所属的账号ID。 username为要创建的IAM用户名。 email为IAM用户的邮箱。 **********为IAM用户的登录密码。 POST https://iam.cn-north-4.myhuaweicloud
高品质:约5个工作日。 自定义声音应用方式,如下所示: 自定义声音生成后,会自动展示在MetaStudio控制台声音列表中,可用于分身数字人视频制作、视频直播或智能交互等场景中。 通过MetaStudio的API调用自定义声音。 父主题: 声音制作
预付费资源包中扣除1次。 计费时优先使用套餐包中的额度,该额度使用完后,转按需付费。 照片建模的含义:根据单张照片自动生成3D风格化基础模型。 按需计费 按需预付费套餐包 语音驱动 按照输入文本或语音驱动数字人口型、表情等动作的时长进行计费。 计费时优先使用套餐包中的额度,该额度使用完后,转按需付费。
流程图总体说明 流程图示例中详细的接口交互说明,如下所示: 用户请求建立WebSocket连接 用户发送文本驱动消息 用户发送中断对话的消息 用户发送结束对话的消息 用户发送心跳请求消息 用户与数字人对话超时断连 会话任务结束 用户请求建立WebSocket连接 用户请求建立WebSoc
PROCESSING 处理中,SUCCEED 成功,FAILED 失败) audio_file_url String 音频文件下载链接,有效期为1个小时。 audio_info_file_url String 字幕文件下载链接,有效期为1个小时。 状态码: 400 表4 响应Body参数 参数 参数类型
删除资产 功能介绍 该接口用于删除资产库中的媒体资产。调用该接口删除媒体资产时,媒体资产会放入回收站中,不会彻底删除。如需彻底删除资产,需增加“mode=force”参数配置。 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/digital-assets/{asset_id}
startUserSpeak 用户开始提问。 stopChat 结束对话。 stopSpeak 停止说话(注:接口已重命名为stopUserSpeak,请直接切换至新接口)。 stopUserSpeak 用户停止提问(注:此处只是停止ASR接收用户语音,对话仍处于激活态)。 unmuteRemoteAudio
FAILED:主文件上传失败 UNACTIVED:主文件上传成功,资产未激活,资产不可用于其他业务(用户可更新状态) ACTIVED:主文件上传成功,资产激活,资产可用于其他业务(用户可更新状态) DELETING:资产删除中,资产不可用,资产可恢复 DELETED:资产文件已删除,资产不可用,资产不可恢复
规则匹配直播事件类型。接口的取值范围[0,100],实际业务取值如下所示: 1:弹幕事件 2:用户入场事件 3:用户点赞事件 4:用户送礼事件 10: 预置话术事件 请以实际业务取值为准。 说明: 1,2,3,4:与LiveEventReport中的event.type对应。 10:匹配预置剧本 约束限制: 不涉及。