检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在媒资行业,主播通常身兼数职,工作内容繁杂且高压。不仅需要前往现场进行调查和采访,收集第一手资料,还要在繁忙的工作中处理大量信息与素材,系统整理以撰写出高质量的文章用来播报。通过Flexus版数字人无需再进行繁琐的布景、拍摄与剪辑,大大简化传统制播流程,减少制播环节消耗的时间与成本,且提升了
智能交互驱动流程 流程图示例 用户与数字人进行智能交互的流程图示例,如下所示,对应流程的详细说明,如流程图总体说明所示。 智能交互非流式驱动流程图,如图1所示。 智能交互流式驱动流程图,如图2所示。 智能交互驱动打断对话流程图,如图3所示。 智能交互驱动停止对话流程图,如图4所示。
无论是从游客出行距离,消费活跃度还是客流量来看, 今年的旅游热度均创下近年来的历史新高。 便利快捷的交通出行方式,让民众实现旅游自由, 多样化的旅游选择,满足各类民众的游玩需求, “五一”旅游热潮,无疑成为各地经济发展的有效“助推器”。 中国梦的本质是国家富强,民族振兴,人民幸福。 实现伟
SDK概述 数字人智能交互SDK是基于数字内容生产线服务提供的能力进行封装,以简化用户的开发工作。用户直接调用智能交互Web SDK提供的接口,即可实现使用数字人智能交互业务能力的目的。 智能交互提供了如下主流平台SDK供开发者使用。 表1 客户端SDK 客户端 集成SDK 接口参考
数字人直播状态变化流程图,如图1所示。 图1 直播状态变化流程图 流程图说明,如下所示: PREPROCESSING:MetaStudio直播服务启动加载形象模型的状态。 PLAY_READY:形象模型加载完成的状态。此时数字人处于静默状态,等待开始播放剧本的指令。 PROCES
Flexus分身数字人形象采集指南 本节将协助您完成Flexus分身数字人形象的采集工作。请注意,您的数字人形象会与录制效果保持一致,包括服装、手部动作、面部表情以及各方面的姿态等。所以我们希望您在拍摄时尽可能保持自然,按照平时的说话习惯录制。 拍摄流程 支持手机或相机拍摄,需1080P或更高分辨率。 录
新闻播报风格文案 大家好,欢迎收听今天的新闻播报。我是主持人小A。现在为您带来最新的国内外要闻。 首先是国内新闻。 我们先来关注一下生活类新闻, 近年来,随着健康意识的提升,全国范围内的健身热潮愈发火爆。 从早晨的广场舞到晚上的健身房,人们纷纷加入到各种形式的健身运动中。 专家表示,通过持
录制? 大部分相机内置麦克风的录制效果也能满足我们对声音的要求。我们对声音的清晰度可以有适度的妥协,但请务必保证底噪不能太大,且不能有其他人声出现,尤其是被拍摄模特正在说话的时候。 模特形象 分身数字人不支持替换衣服,因此,您在录制时的着装会决定您的数字人穿着。 在拍摄前,我们建议参照如下条目,对您的形象进行检查。
如果训练生成的数字人形象满足需求,单击右下方的“通过”。在弹出的“确认”对话框中,单击“确认”,数字人形象生成完成。 如果训练生成的数字人形象不满足需求,单击右下方的“驳回”,进入“问题填写”界面。 输入“问题标题”、“问题描述”,并上传相应的附件,如更新后的绿幕视频文件等内
分声音使用场景。 请选择声音性别 声音的性别,用于匹配声音模型的精准度。 如下所示: 男生 女生 原始输入语言 上传语料所使用的语言。 包含如下语言: 中文 英文 须知:当前参数配置仅作为标识,对训练结果没有任何影响。 选择声音标签 声音的标签。作用为选择声音时,快速筛选领域。 包含如下选项:
在服务主界面,单击左侧导航栏中的“任务中心”。 查看“分身数字人”页签的数字人定制任务列表,找到被驳回的数字人定制任务。 任务状态为“审核未通过”。 单击任务右侧的“查看原因”,在弹出的“审核未通过”对话框中,查看审核未通过的原因。 按照规范重新录制或提供符合规范的视频。 单击任务右侧的“重新上传”,上传更新后的视频。
登录MetaStudio控制台。 单击“Flexus分身数字人”,进入Flexus分身数字人流程介绍页面,如图1所示。 请认真阅读界面上方的规范和避免出现的问题,并仔细观看下方的形象拍摄视频。 图1 流程介绍 单击“下一步”,进入Flexus分身数字人制作页面,如图2所示。 界面操作详情,如表1所示。
网信算备520111252474601240061号 算法基本原理 数字人语音驱动算法是指使用深度学习将语音转换成3D数字人表情和肢体驱动数据的一种技术。 其基本情况包括: 输入数据:语音音频数据。 算法原理:通过深度学习算法,提取语音音频中的特征,并转化为表情驱动的表情基系数。 输出结果:表情基系数。
嗨,大家好!欢迎来到我们的直播间!我是今天的主播Lan。 非常高兴能够和各位在今晚的直播间相聚,希望今天在直播间里能和大家一起度过一段非常有意义的时光! 感谢每一位在直播间停留观看的朋友们,感谢大家进来咱们的直播间参与今天的互动、留言。 稍后我们的直播间不但会教学一些数字人视频的剪辑技巧,还会跟大家推荐一些AI剪辑的功能。
购买出门问问声音套餐, 详见购买出门问问语音合成套餐的操作流程。 购买出门问问语音合成套餐的操作流程 如需使用系统预置的第三方声音,需要购买出门问问语音合成套餐包,详细的操作流程如下所示。第三方声音支持的语言类型,如第三方声音支持的语言类型所示。 购买出门问问语音合成套餐包:在云商
g格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 单击“提交制作”。 数据上传完成后,界面提示“制作任务提交成功!”,如图2所示。 数字人定制任务提交成功后,会在1个工作日内完成审核。任务审核通过后,才能进行算法训练,会在3个工作日内训练完成并生成数字人。
闲聊功能可以丰富数字人可问答的内容,如:天气、旅游、假期等日常闲聊信息。 闲聊为可选功能,如需开启,可参考下述步骤进行操作: 在界面上方的主菜单中,单击“我的应用”。 进入“我的应用”页面,如图12所示。 图12 我的应用页面 单击应用所在行的图标,进入当前应用的“应用配置”页面。 开启应用的闲聊功能
请选择输出模型语言 选择输出的声音模型支持的语言。 支持如下语言: 多语种:输出的声音模型,支持合成的语言类型包括中文、英文、德语、法语、土耳其语、菲律宾语、日语、意大利语、马来语、俄罗斯语、韩语、芬兰语、西班牙语、印尼语、阿拉伯语、葡萄牙语、荷兰语。 粤语 选择声音标签 声音的标签。作用为选择声音时,快速筛选领域。
配置完成后,还需执行下述操作,对应的操作流程图,如图3所示。 下载并集成智能交互Web SDK,操作请参考智能交互SDK。 在Web SDK的create接口入参eventListeners中,监听jobInfoChange事件通知,用于获取任务ID。 建立用户与数字人对话的WebSocket连
机录制音频。 具体的录音注意事项,如表2所示。 表2 录音注意事项 录音事项 说明 话筒间距 调整与麦克风之间的距离,以一拳距离为宜。不宜离麦太近,防止喷麦或录入呼吸声。 录音内容 每句文案起始数字编号无需阅读。 示例:4. 它不仅拥有出色的功能,还具备卓越的性能,序号4无需阅读。