检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单独上传语料包:单独录制音频文件,需要单击下方的“点击上传音频文件”,上传音频。 音频格式支持WAV、MP3,单段音频时长1~5分钟,建议1分钟。语料中的语言仅支持中文和英文。 视频中提取声音:直接提取训练视频中的声音,训练生成Flexus声音。 视频中的语言仅支持中文和英文。 须知:“单独上传语料包”的方式生成Flexus声音的效果会更好。
支持在奇妙问平台创建角色,并配置已上传的外部知识库和问答库给大模型学习使用,让角色的问答信息更丰富。 创建智能交互数字人中的“第三方应用”选择“奇妙问”时,才需要执行本节操作。 用户使用奇妙问前,需要联系奇妙问的客户经理注册开通服务。 客户经理的联系方式,可以在云商店语音合成商品页面查看,如图1所示。 图1
假期等日常闲聊信息。 需要在应用中,依次完成下述配置 开启讯飞闲聊功能,即开启“兜底设置”及其下的“讯飞闲聊”。 配置热词。 配置可用于闲聊的预置技能。 新增设备人设,并在应用中启用人设。 目前仅支持开启“播报类”的闲聊技能,即有“播报类”标识的技能。 模拟测试:在应用配置界面的
关闭:默认关闭,即当前账号下各IAM子账号的已购资源和资产均可共享使用。 开启:各IAM子账户在开启之前上传或制作的资产,在开启之后均无法查看和使用。开启之后上传和制作的资产,各自独立管理和使用。 须知: 无论开启或关闭IAM子账户隔离能力,下述能力不发生变化: 所有IAM子账户的已购资源,始终共享使用。
登录MetaStudio控制台。 在左侧导航栏中,选择“我的创作 > 视频制作”。 在“我的视频”页签,可以看到所有已合成视频列表。 单击视频卡片右下角的图标,可以对已合成视频,执行下述操作: 下载:从下拉框中选择“下载”,将视频下载至本地。 查看详情:从下拉框中选择“查看详情”,可以查看视频资产编号、分辨率、码率等详细信息。
行对应一条知识。 星火大模型会理解文档库文档的内容,重新组织语言来回答问题,不会完全按照问答对提供的答案去答复。 图1 标题 图2 分级标题 配置应用:应用先开启“星火大模型”,再开启文档问答库,然后启用创建技能中已创建的技能。 查看应用信息:在MetaStudio服务创建“科大
图2 制作任务提交成功 用户可以单击“查看制作任务列表”,进入分身数字人定制任务列表页面,如图所示。 图3 任务列表 单击任务所在行的“查看详情”,进入“定制任务详情”页面,如图4所示。 查看分身数字人定制任务审核进展,当前状态为“系统审核中”。数字人定制任务提交成功后,会在1个工作日内完成审核。
连读 选中需要连读的文本内容,单击“连读”。 多音字 选中文本中的多音字,单击“多音字”,在弹出的提示框中,选择正确的发音或者自定义发音。 须知: 这里设置的多音字,仅对当前视频制作剧本有效,如需全局生效,可参考配置特殊词表配置。 别名 选中需要通过别名播报的文本内容 ,单击“别名”,设置为实际播报的内容。
数充足。录制过程中,每句之间有2~3秒的停顿。 其中,进阶版和高品质声音制作需要更多语料,训练时长更长,声音效果更佳。 请完善声音信息 输入声音名称。 示例:欢快女声。 须知: 声音训练完成后,可以在“我的创作 > 声音”页面,找到训练好的声音卡片,单击右下角的图标,从下拉框中选择“重命名”,修改声音名称。
获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。
每句之间有2~3秒的停顿。音频时长3~10分钟,建议5分钟。 请完善声音信息 输入声音名称,示例:欢快女声。 请制作声音 使用“语料上传”的方式,直接上传一个已录制好的长音频WAV或MP3文件,无需压缩,无需携带文案txt文件。 请选择声音性别 选择声音的性别,示例:女生。 原始输入语言
照片数字人视频制作管理 创建照片分身数字人视频制作任务 查询照片分身数字人视频制作任务详情 取消等待中的照片分身数字人视频制作任务 创建照片检测任务 查询照片检测任务详情 父主题: 分身视频制作
SDK包 开发者 个人信息处理规则 合规使用指南 HwICSUiSDK 参见表2下载链接 华为云计算技术有限公司 SDK如何处理个人信息请参见SDK隐私声明 您集成和使用我们的SDK时需要遵从个人信息保护基本要求,详情请参见SDK合规使用指南。 表2 Web SDK下载 版本 日期 下载链接
如果转移资产时,勾选了“资产转移后用户自动接收”和“是否自动激活”,则对应资产转移任务的状态为“已接收”,否则为“待接收”。 支持资产任务执行下述操作: 查看:单击任务右侧的“查看”,查看转移任务详情。 取消转移:未接收的资产,支持单击转移任务右侧的“取消转移”,收回资产。 图3 转移任务管理 父主题: 资产管理
请选择输出模型语言 选择输出的声音模型支持的语言。 支持如下语言: 多语种:输出的声音模型,支持合成的语言类型包括中文、英文、德语、法语、土耳其语、菲律宾语、日语、意大利语、马来语、俄罗斯语、韩语、芬兰语、西班牙语、印尼语、阿拉伯语、葡萄牙语、荷兰语。 粤语 选择声音标签 声音的标签。作用为选择声音时,快速筛选领域。
图3 待接收资产 单击界面左上方的“返回”,回到“资源 > 已激活”页面。 选择“未激活”页签,单击已接收资产卡片中的“激活”,在弹出的“提示”对话框中,单击“确认”。 界面提示“资产已激活”,说明资产已激活成功。用户可以在“已激活”页签中查看已激活的分身模型资产。 图4 激活资产
支持通过视频来源的维度,筛选展示下方的视频。 视频列表 默认展示全量视频。 查看视频 将鼠标放在视频上方,视频右上角展示图标。单击图标,可查看视频。 插入视频 将鼠标放在视频上方,视频右上角展示图标。单击图标,添加至当前场景的视频直播画面中。 插入的视频播放的时候默认无声音,仅有画面。 在视频直播画面预览区域,如
分身数字人视频制作管理 创建分身数字人视频制作任务 查询分身数字人视频制作任务详情 取消等待中的分身数字人视频制作任务 父主题: 分身视频制作
避免动作幅度过大超出画面;避免相机距离人过远;建议人脸在画面中的占比超过1/5。 15秒静默状态时,需正视镜头,面带微笑,嘴巴闭合,保持静默。 演讲过程中不限制说话的内容,出现失误可直接略过或从错误位置继续说话,无需打断拍摄。 背景尽量维持静态,不能出现规律性或大幅度的背景变化。 画面保持稳定,建议使用手机支架或手机稳定器。
大家好,今天我很高兴能来到这里进行数字人形象和声音的采集。接下来,我将和大家一起复盘一下数字人的形象拍摄要求。 第一步,我们需要在拍摄前检查自己的穿着,在绿幕的拍摄环境下,不能穿绿色或者透明的衣服、也不要穿含有密集条纹的衣服。我们需要确保面部没有零散的发丝,尽量不要佩戴眼镜或者项链、耳环、手