检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用于互动回复。数字人不变,背景不变。params结构定义:PlayTextInfo。 INSERT_PLAY_AUDIO:插入驱动音频。用于音频直接驱动。数字人不变,背景不变。params结构定义:PlayAudioInfo。 REWRITE_PLAY_SCRIPT:动态编辑未
保护意识和能力。 接下来让我们一起走进今天的国际新闻。 科技创新引领全球发展,人工智能在各个领域取得了重大突破,包括自动驾驶、机器学习、语音识别等, 同时引发了一系列与伦理、隐私和就业等相关的讨论。 全球范围内的5G网络建设逐渐展开,提供了更快的数据传输速度和更低的延迟, 为物联
10次/秒 3次/秒 3次/秒 租户执行分身数字人模型训练任务命令 10次/秒 3次/秒 3次/秒 声音制作任务管理 查询用户配置的个性化音频时长 20次/秒 10次/秒 10次/秒 创建基础版语音训练任务 10次/秒 3次/秒 3次/秒 创建进阶版语音训练任务 10次/秒 3次/秒
产品优势 控制台自助服务,一站式快速生成所需内容 用户申请账号并上传相关授权,拍摄训练所需音视频素材,上传进行模型训练,生成自定义形象和声音。选择背景、声音、模特等内容,基于文本或语音智能驱动,实现视频制作、视频直播、智能交互等能力。 华为云盘古数字人大模型,赋能千行百业数字化营销新模式
查询音色ID 支持在MetaStudio控制台或通过API接口查询音色ID,详情如下所示: 在控制台查询音色ID(方式一):仅支持查询自定义音色ID。 在控制台查询音色ID(方式二):支持查询全量音色ID。 使用接口查询音色ID(方式三):支持查询全量音色ID。 在控制台查询音色ID(方式一)
按需计费 按需预付费套餐包 一次性计费 声音制作 按声音制作的个数计费。 包括如下类型: 基础版:20条语料音频 进阶版:100条语料音频 高级版:1小时以上的长音频WAV文件 每成功制作1个声音,从所购预付费资源包中扣除1个。 一次性计费 分身数字人视频直播 按数字人各路直播的总时长计费。
语音驱动时的动作配置。 audio_drive_file_external_url 否 String 语音驱动音频文件外部下载URL。 说明: 需要先申请开通白名单后,才允许通过外部URL的音频文件来驱动分身数字人视频。 background_config 否 Array of BackgroundConfigInfo
lse。 默认取值: false audio_source_type 否 String 声音来源类型 VIDEO:视频中抽取音频 AUDIO:单独上传的音频 默认取值: VIDEO voice_properties 否 VoiceProperties object 声音配置信息,
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
常见问题 智能交互SDK安装包里为什么有图片资源? SDK里面包含图片资源,是因为智能交互的动效、背景可能需要图片资源才能展示更好的效果。所以智能交互Web SDK为了方便用户集成使用,会同时包含UI相关资源。 speechRecognized和semanticRecognized通知的流式返回有什么差异?
创建角色 支持在奇妙问平台创建角色,并配置已上传的外部知识库和问答库给大模型学习使用,让角色的问答信息更丰富。 创建智能交互数字人中的“第三方应用”选择“奇妙问”时,才需要执行本节操作。 用户使用奇妙问前,需要联系奇妙问的客户经理注册开通服务。 客户经理的联系方式,可以在云商店语音合成商品页面查看,如图1所示。
查看名片 如果用户需要查看已生成的分身数字人名片,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“分身名片”页签,如图1所示。 在“分身名片”页面,可以看到已生成的名片列表,以卡片形式排列展示。 支持对名片进行如下操作: 单击,查看分身数字人的语音表达形态。
10次/秒 3次/秒 3次/秒 租户执行分身数字人模型训练任务命令 10次/秒 3次/秒 3次/秒 声音制作任务管理 查询用户配置的个性化音频时长 20次/秒 10次/秒 10次/秒 创建基础版语音训练任务 10次/秒 3次/秒 3次/秒 创建进阶版语音训练任务 10次/秒 3次/秒
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
购买简单,一次下单即可完成形象、声音和视频制作资源的购买。针对额外需求,支持客户选择不同档位套餐包进行充值。 极简体验 简化拍摄制作,使用一段2分钟的视频和1分钟的音频即可复刻自己的真人形象和声音,全程手机录制无需专业相机和专业绿幕环境。 高性价比 不到千元即可完成形象、声音定制,性价比超越业界。 应用场景
支持多选,支持添加新类别。 产品素材 合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作: 单击商品所在行的“查看
/v1/{project_id}/voice-training-manage/user/tenant-duration-cfg 查询用户配置的个性化音频时长 POST /v1/{project_id}/voice-training-manage/user/basic-jobs 创建基础版语音训练任务
而且能说80多种不同国家的语言,只需要输入一段文案,就能让数字人帮你念出来,生成一段数字人视频。 万兴喵影则是专为高级视频剪辑而生的工具,不仅如此,它还能处理音频,让你的视频在听觉和视觉上都更吸引人。 支持多轨道编辑,不仅有各种特效和转场效果,还有高级的色彩校正工具,各种炫酷的特效和过渡效果,都让视
objects 文本列表 asset_list 否 Array of ProductMediaInfo objects 资产列表,仅支持图片、视频、音频资产 auto_active 否 Boolean 参数解释: 自动激活商品 默认取值: true 表4 ProductCoverInfo 参数
objects 文本列表 asset_list 否 Array of ProductMediaInfo objects 资产列表,仅支持图片、视频、音频资产 state 否 String 商品状态枚举 ACTIVED:已激活 UNACTIVED:未激活 表4 ProductCoverInfo