检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
修改TTS租户级自定义读法配置 功能介绍 该接口用于修改TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/ttsc/vocabulary-configs/{vocabulary_id} 表1 路径参数 参数 是否必选
再发送API请求。 “APIGW”开头的错误码列表,详见错误码说明。 表1 API流控限制 接口分类 接口名称 单租户接口流控 (华北-北京四) 单租户接口流控 (华东-上海一) 单租户接口流控 (亚太-新加坡) 数字资产管理 创建资产 10次/秒 5次/秒 5次/秒 查询资产列表
设置TTS租户级自定义读法配置 功能介绍 该接口用于设置TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsc/vocabulary-configs 表1 路径参数 参数 是否必选 参数类型 描述 project_id
获取TTS租户级自定义读法配置 功能介绍 该接口用于获取TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/ttsc/vocabulary-configs 表1 路径参数 参数 是否必选 参数类型 描述 project_id
形象制作 MetaStudio服务支持自定义生成分身数字人。 操作前准备 用户创建分身数字人定制任务前,需要参考操作步骤准备如下内容: 5~6分钟绿幕拍摄视频。 注意:如果制作分身形象的时候,选择保留拍摄背景,则需要准备实景背景拍摄视频。 身份证正反面照片。 形象授权签署文件,如授权书所示。
拉框中选择允许弹出窗口。 图1 直播间开播 单击“完成”,会新增弹出如图2和图3所示的2个浏览器窗口。 MetaStudio控制台超过10分钟不操作,默认会退出登录,导致第三方直播平台的直播画面也中断。需要确保图3的窗口始终是打开的,直播过程中一定不能关闭,这样第三方直播平台的直播才能顺利完成。
拉框中选择允许弹出窗口。 图1 直播间开播 单击“完成”,会新增弹出如图2和图3所示的2个浏览器窗口。 MetaStudio控制台超过10分钟不操作,默认会退出登录,导致第三方直播平台的直播画面也中断。需要确保图3的窗口始终是打开的,直播过程中一定不能关闭,这样第三方直播平台的直播才能顺利完成。
创建一次性鉴权码 功能介绍 该接口用于创建一次性鉴权码,有效期5分钟,鉴权码只能使用一次,每次使用后需要重新获取。 接口只能通过第三方后台调用,不能在浏览器前台直接调用,否则会有跨域问题。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/di
格式。 解决方法 单击webm2mov,将视频格式转换小工具webm2mov_20240814.rar下载至本地。 下载过程大约耗时3~5分钟,请耐心等待。 如果用户需要自定义工具,可以获取其源码。 本地解压工具包,得到ffmpeg目录和运行文件webm2mov.exe。 双击webm2mov
再发送API请求。 “APIGW”开头的错误码列表,详见错误码说明。 表2 API流控限制 接口分类 接口名称 单租户接口流控 (华北-北京四) 单租户接口流控 (华东-上海一) 单租户接口流控 (亚太-新加坡) 数字资产管理 创建资产 10次/秒 5次/秒 5次/秒 查询资产列表
duration60 有效期3个月 说明: 已废弃 视频制作60分钟套餐包 分钟 一次性 hws.resource.type.metastudio.modeling.avatarvideo.time60 有效期1年 视频制作600分钟套餐包 分钟 一次性 hws.resource.type.metastudio
描述 time_window 否 Integer 参数解释: 处理抑制时长。单位秒。 -1:表示整场直播仅触发一次。 0:表示无抑制,每次都触发。 其他值n:表示n秒内仅触发一次。 约束限制: 不涉及 默认取值: 不涉及 取值范围: -1-7200 reply_mode 否 String
数字人模型生成和驱动:基于一张照片或者一段3-5分钟视频,可以生成分身数字人模型,生成效率相比业界提升3倍以上。在数字人模型生成以后,可以通过模型驱动推理服务,让数字人动起来,包括声音、表情、口型、肢体动作等,口型匹配准确率>95%,表情、动作更自然。 直播话术智能生成:基于十万级高质量直播话术的预训练,
等。所以我们希望您在拍摄时尽可能保持自然,按照平时的说话习惯录制。 拍摄流程 支持手机或相机拍摄,需1080P或更高分辨率。 录制时长为2分钟,包含15秒静默转态和1分45秒的演讲过程。 允许使用中文、英文录制。 录制全程眼睛需注视镜头,周围环境保持安静,脸部光照明亮且均匀。 拍
参数类型 描述 time_window Integer 参数解释: 处理抑制时长。单位秒。 -1:表示整场直播仅触发一次。 0:表示无抑制,每次都触发。 其他值n:表示n秒内仅触发一次。 约束限制: 不涉及 默认取值: 不涉及 取值范围: -1-7200 reply_mode String
原因请参考媒体和Web Audio API 的自动播放指南,所以出现数字人没声音的问题时,建议按照下述步骤排查并做出相应处理。 添加按钮点击触发create接口后,测试是否有声音。如果有声音,就是浏览器的安全策略导致,需要引导用户在create之前点击页面。 检查扬声器设备是否正常。
分身数字人视频制作 按需计费 16元/分钟 10元/分钟 按需预付费套餐包(分身数字人视频制作60分钟套餐包) 768元/个 480元/个 按需预付费套餐包(分身数字人视频制作600分钟套餐包) 5760元/个 3600元/个 按需预付费套餐包(分身数字人视频制作6000分钟套餐包) 38400元/个
际需求评估录制流程: 不需要交互:15~20秒静默 + 4~5分钟自然表达 需要交互:15~20秒静默 + 无语义动作 + 4~5分钟自然表达,详见交互数字人拍摄要求。 需要动作编排:15~20秒静默 + 4~5分钟自然表达 + 单独拍摄动作编排片段(保持机位和人物位置不动,详细要求见附录二:动作编排定制采集指南)
智能交互业务媒体流如何应对防火墙限制? 分身数字人智能交互业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,您的防火墙需要配置SparkRTC端口和域名的白名单,请参考直播业务媒体流如何应对防火墙限制?。 父主题: 智能交互
直播业务媒体流如何应对防火墙限制? 分身数字人直播业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,防火墙需要放开如下限制: 解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。