检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择“声音制作”,确认声音制作任务已训练完成。 在左侧导航栏中,单击“我的创作”。 选择“声音”,找到已生成的声音,单击声音卡片中的头像,即可试听声音效果。 用户还可以执行如下操作: 单击“视频制作”,基于已有声音,进行视频制作,操作请参考视频制作。 单击“视频直播”,基于已有声音,制作视频直播,操作请参考视频直播。
开通按需计费。 如需查看声音合成的使用量,单击左下角的“已使用量”,跳转至费用中心的“流水和明细账单”页面,搜索查看声音合成的详细账单。 3D数字人 照片建模 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。 语音驱动 左下角展示用户已购买资源的剩余量。
待。 确认声音制作任务已训练完成后,在左侧导航栏中,单击“我的创作”。 选择“声音”,找到已生成的声音,单击声音卡片中的头像,即可试听声音效果。 图3 声音
分身数字人资产: HUMAN_MODEL_2D: 分身数字人模型 BUSINESS_CARD_TEMPLET: 数字人名片模板 3D数字人资产: HUMAN_MODEL:3D数字人模型 SCENE:场景模型 ANIMATION:动作动画 MATERIAL:风格化素材 NORMAL_MODEL:
SDK概述 数字人智能交互SDK是基于数字内容生产线服务提供的能力进行封装,以简化用户的开发工作。用户直接调用智能交互Web SDK提供的接口,即可实现使用数字人智能交互业务能力的目的。 智能交互提供了如下主流平台SDK供开发者使用。 表1 客户端SDK 客户端 集成SDK 接口参考 Web
分段设置 选择文字分段的方式。 包含如下选项: 自动分段:自动对文档进行分段处理。单击“自动分段”,“分段预览”区域会展示自动分段后的文本效果。 手动分段:自定义分隔符和分隔长度的方式,对文档进行分段处理。 索引配置 配置索引的类型。 包含如下选项: 标准版 高配版 单击“保存”。
万兴喵影则是专为高级视频剪辑而生的工具,不仅如此,它还能处理音频,让你的视频在听觉和视觉上都更吸引人。 支持多轨道编辑,不仅有各种特效和转场效果,还有高级的色彩校正工具,各种炫酷的特效和过渡效果,都让视频变得更加具有吸引力,小白也能轻松上手剪辑。 既然是万兴播爆+万兴喵影的专场,那么肯定会给大家送到专场该有的福利。
源自动释放回原有资源包中,SP用户可再次分配给租户使用。 单击“确定”,界面右上角提示“分配资源成功”。 在“租户列表”页面,可以查看分配效果,如图4所示。 以001租户的“分身形象制作(个)”列为例进行说明,“2 / 2”中第一个2说明当前资源实例分配了2个分身形象制作资源给当
是 String 命令类型。 SUBMITVERIFYING: 提交审核 CONFIRM_ACCEPT:用户确认训练效果 CONFIRM_REJECT:用户驳回训练效果 CONFIRM_ANSWER:用户答复 CONFIRM_PENDING:用户挂起任务 CONFIRM_ACTIVE:用户激活任务
音频制作区域,可选择下述1种方式生成音频。 文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。
model_asset_type String 数字人模型类型。 HUMAN_MODEL_2D:分身数字人 HUMAN_MODEL_3D:3D数字人 script_cover_url String 剧本封面下载url。 script_type String 脚本类型,即视频制作的驱动方式。默认TEXT
视频、文本和音频内容。 文本:文本模板列表,可选择一个文本模板,在视频直播画面上添加文本。 ② 直播画面预览窗口,用于预览视频直播静态画面效果。 ③ 直播剧本由多个场景构成,每个场景由多个段落组成。 支持新增、复制场景,并为每个场景设置对应的数字人形象、背景、声音等内容。 支持新
QPCAUQS4SDA&Expires=1671241457&Signature=zVGMVbI5ji9rr8epD1Cir5OGIRk%3D" }, "error_info" : null, "create_time" : "2022-11-30T06:59:56Z"
每种声音制作方式后面都会展示剩余次数,需要保证剩余次数充足。录制过程中,每句之间有2~3秒的停顿。 其中,进阶版和高品质声音制作需要更多语料,训练时长更长,声音效果更佳。 请完善声音信息 输入声音名称。 示例:欢快女声。 请制作声音 制作声音的方式为“语料上传”。界面提供录音指导,需要按照指导,录制生
场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交互服务定义的API接口结构,自主开发第三方语言模型API,对接第三方语言模型到智能交互服务,实现智能交互能力。操作请参考创建智能交互数字人(第三方语言模型)。 场景三:用户使用智能交互API或SDK,自主开发实现与数字人对话场景。
数字人回复内容触发敏感信息时,使用的回复话术。 示例:哎呦,这个问题我没有听懂哦!请您重新提问。 单击“在线演示”,可以在界面右侧演示模型对话效果,如图4所示。 图4 在线演示 单击界面右上角的“保存”,在弹出的“保存成功”提示框中,单击“确定”。 角色创建完成。 查看角色信息 在奇
用户申请账号并上传相关授权,拍摄训练所需音视频素材,上传进行模型训练,生成自定义形象和声音。选择背景、声音、模特等内容,基于文本或语音智能驱动,实现视频制作、视频直播、智能交互等能力。 华为云盘古数字人大模型,赋能千行百业数字化营销新模式 MetaStudio服务依托华为云基础设施、海
设置TTS租户级自定义读法配置 功能介绍 该接口用于设置TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsc/vocabulary-configs 表1 路径参数 参数 是否必选 参数类型 描述 project_id
QPCAUQS4SDA&Expires=1671241457&Signature=zVGMVbI5ji9rr8epD1Cir5OGIRk%3D" }, "error_info" : null, "create_time" : "2022-11-30T06:59:56Z"
如果PPT中有动画、动效,是不支持在MetaStudio控制台展示的,建议将PPT导出为视频后再导入。 操作详情请参考如何在MetaStudio控制台呈现PPT的动画效果?。 界面默认展示两列文件,单击图标后,缩小展示为1列文件。单击图标,可恢复为2列展示。 关键词搜索框,可输入文件名称进行精准搜索。 示例:销售指导书。