检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Boolean 参数解释: 输出的视频是否带字幕。 约束限制: 分身数字人直播暂时不支持字幕。 取值范围: true: 打开字幕 false: 关闭字幕 默认取值: false subtitle_config 否 SubtitleConfig object 字幕配置。 dx 否 Integer
Boolean 参数解释: 输出的视频是否带字幕。 约束限制: 分身数字人直播暂时不支持字幕。 取值范围: true: 打开字幕 false: 关闭字幕 默认取值: false subtitle_config SubtitleConfig object 字幕配置。 dx Integer 参数解释:
Boolean 参数解释: 输出的视频是否带字幕。 约束限制: 分身数字人直播暂时不支持字幕。 取值范围: true: 打开字幕 false: 关闭字幕 默认取值: false subtitle_config 否 SubtitleConfig object 字幕配置。 dx 否 Integer
Boolean 参数解释: 输出的视频是否带字幕。 约束限制: 分身数字人直播暂时不支持字幕。 取值范围: true: 打开字幕 false: 关闭字幕 默认取值: false subtitle_config 否 SubtitleConfig object 字幕配置。 dx 否 Integer
Boolean 参数解释: 输出的视频是否带字幕。 约束限制: 分身数字人直播暂时不支持字幕。 取值范围: true: 打开字幕 false: 关闭字幕 默认取值: false subtitle_config 否 SubtitleConfig object 字幕配置。 dx 否 Integer
数字内容生产线MetaStudio是什么? 数字内容生产线(MetaStudio)解决方案,提供数字人视频与直播、智能交互等服务,使能千行百业场景应用。 父主题: 产品咨询
10次/秒 10次/秒 智能直播间管理 创建智能直播间 5次/秒 3次/秒 3次/秒 查询智能直播间列表 20次/秒 10次/秒 10次/秒 查询智能直播剧本详情 20次/秒 10次/秒 10次/秒 更新智能直播间信息 5次/秒 3次/秒 3次/秒 删除智能直播间 4次/秒 3次/秒 3次/秒
使用数字人形象,设置画布、音频,合成视频。 适用于各类培训、宣讲、知识分享等场景。 视频直播 使用数字人形象,设置画布、剧本、互动和开播配置,生成直播视频。 可在合作的第三方平台进行数字人视频直播,如淘宝、拼多多、抖音等。 智能交互 包含下述功能实现场景: 支持开箱即用的智能交互数字人。
String 字幕文件下载链接。 subtitle_file_upload_url String 字幕文件上传链接。 subtitle_file_state String 字幕文件生成状态。 GENERATING:字幕文件生成中。 GENERATE_SUCCEED:字幕文件生成成功。
String 字幕文件下载链接。 subtitle_file_upload_url 否 String 字幕文件上传链接。 subtitle_file_state 否 String 字幕文件生成状态。 GENERATING:字幕文件生成中。 GENERATE_SUCCEED:字幕文件生成成功。
ig 参数 参数类型 描述 dx Integer 字幕左上角像素点坐标。 说明: *横屏(16:9)视频像素为1920x1080;竖屏(9:16)视频像素为1080x1920。 取值范围: 0-1920 dy Integer 字幕左上角像素点坐标。 说明: *横屏(16:9)视频
综合对比数字人比真人成本低、效率高,且质量稳定。 数字人直播更真实、更沉浸 支持持物直播、实景直播、弹幕智能互动、真人随时接管,让数字人直播更真实、更沉浸。 支持数字人直播矩阵式管理,高级策略配置管理直播更灵活。 实时智能交互,提升客户满意度和品牌形象 开放的Web SDK及A
ig 参数 参数类型 描述 dx Integer 字幕左上角像素点坐标。 说明: *横屏(16:9)视频像素为1920x1080;竖屏(9:16)视频像素为1080x1920。 取值范围: 0-1920 dy Integer 字幕左上角像素点坐标。 说明: *横屏(16:9)视频
分身数字人智能交互业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,您的防火墙需要配置SparkRTC端口和域名的白名单,请参考直播业务媒体流如何应对防火墙限制?。 父主题: 智能交互
示例1:分身形象制作管理 示例2:声音制作任务管理 示例3:语音合成管理 示例4:视频制作 示例5:视频制作剧本管理 示例6:视频直播 示例7:视频直播对接实时音视频客户端SDK 示例8:资产管理 示例9:数字人名片制作 示例10:智能交互
开发者如何获取技术支持? 用户如何举报平台违规内容? 如何调用MetaStudio接口? 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 如何实时切换智能交互的语言和声音? 如何接收并激活声音和分身模型资产? 父主题: 附录
认展示效果,需修改参数enableCaption的值为true。 修改create方法中param参数的config配置项,即修改是否显示字幕字段enableCaption的值为true。 await HwICSUiSdk.create({ serverAddress: 'serverAddress'
原声录制音频和其对应生成的音色播报示例,如客户声音制作案例所示。 录音准备 表1 录音准备 声音类型 录制设备和软件 录音环境 录音文案 基础版 优先使用专业录音设备录制音频,推荐使用Adobe Audition软件进行录音。 如果不具备专业录音设备,可使用手机录制音频,详情请参见手机录制音频。 录音环
图片格式 图片支持的格式为:PNG、JPG、JPEG。 图片要求如下所示: 分辨率最大支持1080P。 图片素材总大小小于500MB。 字幕 字幕中正常断句的符号,如中文符号、,。:;!?….. 等;英文符号,.:;!?...等,系统会自动去除。 如果自动去除的符号在一段文字中间,自动去除后,会再增加一个空格。
速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。 4 视频场景区域 如果一个视频包含