检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
3D数字人风格化照片建模 创建照片建模任务 照片建模任务列表查询 照片建模任务详情查询 基于图片URL创建照片建模任务 父主题: 3D数字人
据安全法》以及其他适用的法律法规和相关的标准规范。 此文档用于帮助您更好地了解数字人智能交互Web SDK并合规使用数字人智能交互Web SDK服务,仅适用于华为云客户的业务区域为中国大陆地区的场景。 一、基本要求 您的产品及服务需要尊重用户隐私,遵守国家的数据保护法律和法规。禁
需要有扬声器。 触摸屏 需要有触摸屏。 带宽 4M以上。 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 智能交互界面对浏览器的要求,如表2所示。 表2 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows
Markup Language)标记语言。 需要使用的标签,如下所示: <speak>:此标签为所有文本的根节点。一切需要调用SSML标签的文本,都要包含在<speak> </speak>标记对中。 <emotion>:情感标签,对指定的一或多句话生效。标签开始在句子起始位置,标签结束在句子结尾。用法为:<emotion
操作前提 前提条件 需要申请开通智能交互权限后,才可集成智能交互SDK使用。 WebSDK使用限制 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 父主题: 智能交互客户端SDK
同名置换掉即可。 解决js引入HwICSUiSdk.css编译报错的问题。 2024-03-20 本次变更如下: 新增发布1.1.1版本SDK,相比1.1.0版本,修复如下问题: 修复多次调用create接口报错的问题。 2024-03-15 本次变更如下: 新增发布1.1.0版本SDK,相比1
如需查看声音合成的使用量,单击左下角的“已使用量”,跳转至费用中心的“流水和明细账单”页面,搜索查看声音合成的详细账单。 3D数字人 照片建模 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。 语音驱动 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。
文件管理 创建文件并获取上传URL 删除文件 确认文件已上传 创建大文件 父主题: 资产管理
number 识别流式响应时返回的各包顺序序号。 isLast boolean 是否是最后一条识别结果。 chatId string 对话ID,每轮问答的ID值唯一。 speechRecognized通知的流式返回跟semanticRecognized是有差异的,详细见:speechRe
其他数值:同一条弹幕规则重复触发的间隔时间,每条规则的触发时间互不影响。 默认值:120。 用户入场触发间隔时间 取值范围[-1,120],单位:秒。 取值含义如下所示: -1:只触发1次。 0:一直触发。 其他数值:同一条达到互动条件的用户入场规则重复触发的间隔时间,每条规则的触发时间互不影响。
训练任务和声音制作任务。 查看Flexus分身数字人训练任务。 用户可以单击“查看制作任务列表”,进入“任务中心 > 分身数字人”页面。 查看生成的Flexus分身数字人训练任务,其“服务类型”为“Flexus版”,任务名称为设置的“数字人名称”。这里的任务分身数字人训练耗时约3小时,请耐心等待。
用户与数字人进行智能交互的页面,富媒体展示效果支持使用SDK提供的默认展示方式。 下述智能交互客户端SDK的两个方法的配置字段enableCaption,默认值均为False,即用户自定义富媒体的展示效果。如果需要使用SDK提供的默认展示效果,需修改参数enableCaption的值为true。
建议Node 17+。 编译工具 建议Webpack 5 + babel 7。 浏览器 浏览器使用限制,请参见表2。 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 表2 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows
详细操作请参见购买出门问问声音套餐。 查看已购套餐余额的操作如下所示: 登录MetaStudio控制台。 在左侧导航栏中,选择“我的创作”。 选择“声音 > 已购”,单击已购套餐右侧的“付费管理”,可以查看余额,如图1所示。 图1 查看套餐余额 父主题: 视频制作
租户管理 查看租户资源用量信息 查看租户资源列表 统计时间段内过期的资源数量
} } 用户发送中断对话的消息 文本驱动数字人讲话过程中,支持使用INTERRUPT_CHAT命令,中断数字人与用户的对话。对话被打断后,数字人将停止说话,并发送下一次对话的START_CHAT消息给用户。 详细交互流程如下所示: 用户发送中断对话的消息。 代码示例如下所示: {
智能交互业务媒体流如何应对防火墙限制? 分身数字人智能交互业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,您的防火墙需要配置SparkRTC端口和域名的白名单,请参考直播业务媒体流如何应对防火墙限制?。 父主题: 智能交互
如果转移资产时,勾选了“资产转移后用户自动接收”和“是否自动激活”,则对应资产转移任务的状态为“已接收”,否则为“待接收”。 支持资产任务执行下述操作: 查看:单击任务右侧的“查看”,查看转移任务详情。 取消转移:未接收的资产,支持单击转移任务右侧的“取消转移”,收回资产。 图3 转移任务管理 父主题: 资产管理
训练完成并生成数字人。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,进入分身数字人定制任务列表页面,如图所示。 图3 任务列表 单击任务所在行的“查看详情”,进入“定制任务详情”页面,如图4所示。 查看分身数字人定制任务审核进展,当前状态为“系统审核中”。数字人定制
文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。