检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
"分隔。详见资源类型。 business 否 String 业务类型。可填多个,用","分隔。 VOICE_CLONE:声音制作 SYNTHETICS_SOUND:声音合成 ASSET_MANAGER:资产管理 MODELING_2D:形象制作 LIVE_2D:分身数字人视频直播 VIDEO_2D:分身数字人视频制作
job_tag 是 String 任务标签,为Flexus版声音的配置。 ECOMMERCE: 电商 NEWS: 新闻 MARKETING: 营销 sex 是 String 语音性别,是男性声音还是女性声音,为Flexus版声音的配置。 FEMALE: 女性 MALE: 男性 默认取值:
数字人教师AI知识培训 数字人企业培训应用 07:40 数字人教师AI知识培训 听障用户北北数字人 数字人助听障手语者声音重焕新生 03:17 听障用户北北数字人 聋人画家数字人 数字人助听障手语者声音重焕新生 01:58 聋人画家数字人 3D数字人最佳实践 华为云3D写实数字人 提供自动化建模技术,帮用户快速打造
应用示例 示例1:上传资产 示例2:分身形象制作管理 示例3:声音制作任务管理 示例4:语音合成管理 示例5:视频制作 示例6:视频制作剧本管理 示例7:视频直播 示例8:视频直播对接实时音视频客户端SDK 示例9:资产管理 示例10:数字人名片制作 示例11:智能交互
在使用数字内容生产线服务前,您需要了解本服务的使用限制信息。 区域限制 预置模特使用限制 API使用限制 形象制作限制 声音制作限制 视频制作限制 视频直播限制 Flexus分身数字人限制 照片数字人限制 智能交互限制 资产管理说明 SP用户限制
图13 开播页面 表4 界面说明 界面元素 说明 00:01:20 直播计时,当前已直播1分20秒。 切换互动内容播报的声音。默认为主播声音,可切换为助播声音。 单击快捷图标,选择预置的互动内容发送播报。 请输入互动内容,回车发送内容 手工输入互动内容,发送成功后,主播或助播进行
智能交互 智能交互支持富媒体吗? 如何自定义域名方式访问智能交互页面? 智能交互业务媒体流如何应对防火墙限制? 如何实时切换智能交互的语言和声音?
配置特殊词表 支持全局设置多音字或者别名,设置完成后,所有视频草稿自动生效。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“声音”页签,单击界面右侧的“特殊词表”,进入如图1所示的界面。 图1 特殊词表 单击“新建词表”,界面新增一行特殊词,如图2所示。
选中所有的音频文件,单击“分享”,可选择隔空投送或其他第三方应用导出音频文件至PC中。 一个长音频文件无需压缩,可直接上传至MetaStudio控制台,进行声音训练。 安卓手机 安卓手机推荐下载软件“超级录音机”进行录音,如图2所示。 图2 超级录音机 音频录制说明,如表2所示。 表2 音频录制说明
描述 business 否 String 业务类型。可填多个用","分隔 VOICE_CLONE:声音制作 SYNTHETICS_SOUND:声音合成 ASSET_MANAGER:资产管理 MODELING_2D:形象制作 LIVE_2D:分身数字人视频直播 VIDEO_2D:分身数字人视频制作
新增接口组:智能交互数字人知识库技能管理。 新增接口组:智能交互数字人知识库意图管理。 新增接口组:智能交互数字人知识库问法管理。 新增接口组:智能交互数字人欢迎词管理。 新增接口组:智能交互数字人热点问题管理。 新增接口组:智能交互数字人热词记录管理。 新增接口组:智能交互数字人委托管理。 2024-03-04
成线条的旋律,赋予此诗以绘画美。作者又以夜的寂静为背景,把人们臆想中的海潮声、江流声、捣衣声、凄凉的雁叫声与游子思妇的叹息声,巧妙地编织成声音的旋律,赋予此诗以音乐美。此诗的这些美感对现代新月派诗人闻一多提出诗歌的“三美”(即绘画美、音乐美、建筑美)有着重要的直接影响。 《春江花
图2 背景界面 背景界面说明,如表2所示。 表2 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择PNG、JPG和JPEG格式的图片上传。暂不支持4K以上的图片。 也支持直接拖拽本地图片至图片列表区域,完成上传操作。 界面默认展示两列图片,单击图标后,缩小展示为1列图片。单击图标,可恢复为2列展示。
的形象中也包含麦克风。 FAQ: 如果我拍摄过程中有人闯入或有突发的声音,如雷声、汽车喇叭声等,我是否要重新拍摄? 根据我们的经验,小于3秒的短暂声音闯入不会对最终训练效果有明显的影响。您只需保证类似的突发声音越少越好。 我可能没有专业麦克风或者小蜜蜂设备,能否直接使用相机内置麦克风录制?
[{"key": "MATERIAL_VIDEO", "value": "Yes"}] 界面展示效果,如图5所示。 图5 素材视频 形象制作、声音制作、视频制作的音频驱动,不属于资产库管理范畴(详见资产范围说明),不适用于当前上传资产示例章节。 父主题: 应用示例
上传资产 支持从本地上传资产,包括:模型、PPT、动画、素材、视频、场景、图片、音乐。资产上传的操作均相同,下面以上传图片为例进行演示。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“资源”页签,如图1所示。 图1 资源页面 单击界面右上角
voice_train_job_id String 声音训练任务id。 flexus_retry_count Integer flexus版本任务剩余可以重训的次数,每重训一次减1,减到0时不可再重训。 取值范围: 0-10 audio_source_type String 声音来源类型 VIDEO:视频中抽取音频
API使用限制 使用API调用声音的限制说明 用户使用视频直播或智能交互接口调用音色时,需要先确认能否在MetaStudio控制台的视频直播间编辑界面或智能交互对话设置页面,选到当前音色。 如果界面正常展示且可以选择此音色使用,说明接口可以正常调用此音色,否则接口无法调用。 API流控
现象。 操作步骤 参考下载SDK安装包,下载SDK安装包至本地。 打开本地命令运行程序,输入如下命令,在本地生成SDK安装包的SHA256值。 其中,“D:\HwICSUiSdk-1.0.0.zip”为SDK安装包的本地存放路径及安装包名称,请根据实际情况修改。 certutil
击图标,可查看视频。 插入视频 将鼠标放在视频上方,视频右上角展示图标。单击图标,添加至当前场景的视频画面中。 插入的视频播放的时候默认无声音,仅有画面。 在视频画面预览区域,如果存在多种视频素材,支持对视频进行图层管理,如:循环1次、循环播放、上移一层、下移一层、置顶、置底、复