检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
石冀琳女士数字人埃及开服致辞 媒体服务吕阳明数字人 多国语言介绍华为云MetaStudio 01:57 媒体服务产品线总裁数字人 记者分身构建数智主播 华为云与中青报的双向奔赴 01:40 记者分身构建数智主播矩阵 银联数据“数小联” 通过数字人重构金融服务 01:01 银联数据“数小联”3.15上线 数字人教师AI知识培训
speechRecognized的流式返回是覆盖式返回。后一条通知中的text字段值包含前一条通知的内容。例如:第一条通知的text值为“你吃”,第二条新识别了“饭了么”,则第二条text值为“你吃饭了么”。 semanticRecognized的流式返回是分段式返回。后一条通知中的text字段值
右侧界面的预览效果就是数字人名片的实际生成效果,请输入适量的字符,以确保正常的展示效果。 公司 必填项,数字人公司。 内容较多时,最多支持在名片中分2行展示,超出2行后,默认不展示。为保证名片的效果展示,请保持合理的输入长度。 联系电话 必填项,数字人联系电话,请输入有效的联系方式。 公司地址
Flexus数字人采用实景拍摄,视频制作时不支持切换背景。 Flexus分身数字人左上角会有标识。未带有标识的数字人均为标准版形象。 需注意Flexus视频制作和标准版视频制作分开计费,从各自的套餐包中扣除费用。 Flexus视频制作:必须使用Flexus形象,声音使用不受限制。 按视频制作
单声道音频。 清晰人声无背景音乐与杂音。 音频格式要求,如下所示: 支持的格式为:MP3、WAV。 大小不超过20MB,时长不超过5分钟。 文本驱动 文本驱动方式的要求如下所示: 文本输入长度不超过2000字。 通过文本合成的音频时长不能超过5分钟。 在照片数字人制作页面,选择“文本驱动”
API概览 华为云MetaStudio服务对应的接口列表如下所示,在调用API前,您需要先获取用户Token,Token可以用于调用其他API时鉴权,具体如何调用API请参考应用示例。 数字资产管理 表1 数字资产管理接口 接口 说明 POST /v1/{project_id}/digital-assets
第十二次正式发布 本次变更如下: 语音合成管理接口组,新增接口:创建TTS异步任务、获取TTS异步任务。 声音制作任务管理接口组,新增接口:查询用户配置的个性化音频时长、设置任务批次。 2024-10-30 第十一次正式发布 本次变更如下: 新增接口组:租户管理。 2024-08-20 第十次正式发布
象,仅支持企业用户。 定制分身形象时,从平台下载的授权书中有明确说明,定制分身形象需授权给公司使用。 使用限制 制作好的数字人模型不支持下载或导出至本地。 数字人模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 数字人不支持换脸、换衣服。
分身数字人视频制作管理 创建分身数字人视频制作任务 查询分身数字人视频制作任务详情 取消等待中的分身数字人视频制作任务 父主题: 分身视频制作
照片数字人视频制作管理 创建照片分身数字人视频制作任务 查询照片分身数字人视频制作任务详情 取消等待中的照片分身数字人视频制作任务 创建照片检测任务 查询照片检测任务详情 父主题: 分身视频制作
模型审核和制作可以加快吗? 部分浏览器提交H265训练视频失败如何处理? 声音和形象模型支持在其他平台使用吗? 声音和形象模型和音视频内容的关系? Flexus数字人在走动录制时需要注意什么?
资源类型 MetaStudio计费中涉及的资源类型,包括商用资源类型、POC测试用需管理员分配的资源类型。 表1 商用资源类型(租户订购) 类别 资源名称 单位 计费模式 资源类型编码 备注 分身数字人 形象制作 个 一次性 hws.resource.type.metastudio
视频制作限制 视频制作配置 限制 视频制作剧本 一个视频制作剧本的场景数量不能超过50个。 一个视频制作剧本,仅支持使用一个数字人模型和一个音色模型。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。 每个单场景如果包含语音合成标记语言SSML标签,文字数量需小于128K。
支持通过背景、风格和布局的维度,筛选展示下方的图片。 图片列表 默认展示全量图片。选中场景,单击图片,可以替换当前场景的背景。 将鼠标放在图片上方,图片右上角展示图标。单击图标,可以将当前图片作为背景替换至所有场景。 贴图 贴图界面详情,如图3所示。 上传后的贴图不支持修改。如需修
直接单击文件右下角的图标,执行下述操作: 从下拉框中选择“删除”,删除当前文件。 从下拉框中选择“批量删除”,勾选所有需要删除的文件。单击界面右下角的“删除”,删除选中的所有文件。 文件上传成功后的操作如下所示: 在PPT页签的文件列表区域,单击上传成功的文件,弹出如图4所示的对话框。 图4
初始化语音唤醒资源,不使用语音唤醒能力则忽略该接口。 3.0.1之后的websdk包里面有如下两个资源文件,如果不使用语音唤醒,可忽略这两个文件。 wasmData.js:语音唤醒的算法资源文件。 modelData.js:语音唤醒的模型资源文件。 SDK内置默认唤醒模型,支持定制唤醒词,并更新本地模型,详见Web语音唤醒。
该声音是否支持SSML的say-as标签。 约束限制: 不涉及 取值范围: true: 支持SSML的say-as标签 false: 不支持SSML的say-as标签 默认取值: false is_support_ssml_sub 否 Boolean 参数解释: 该声音是否支持SSML的sub标签。
用于生成WHOLE_MODEL的模型file_id 约束限制: 如果当前记录的信息与MAIN文件的file_id一致,那就认为已经生成过,无需再进行全模型导出 取值范围: 字符长度0-64位。 默认取值: 不涉及。 load_model_file_id String 参数解释: 当前用于渲染加载的模型file_id
ADMIN_ALLOCATED,将返回商用资源与管理员分配资源。 PURCHASED: 用户购买的资源 SP_ALLOCATED: SP分配的资源 ADMIN_ALLOCATED: 系统管理员分配的资源 resource_id 否 String 资源id。 order_id 否 String
获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。