检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
设置完成后,单击“生成视频”,弹出如图2所示的对话框,显示照片数字人视频的生成进度。 可执行下述操作: 单击图中第一个链接“任务中心-视频”,可进入“任务中心 > 照片数字人”页面,查看任务进度,详情请参见查看任务。 单击图中第二个链接“我的创作-视频”,可进入“我的创作 > 视频”界面,查看已生成的视频,详情请参见查看视频。
dio服务进行结算。 资源有效期 套餐包从订单付款成功后的生效时间开始计费,请在有效期内使用套餐包中的资源。按需付费则按照资源的实际使用情况进行计费,无有效期的限制。 资源包的“到期时间”可以在MetaStudio控制台的服务概览页面查看,如图1所示。 图1 资源列表 续费 数字内容生产线续费说明,如下所示:
仅分身数字人动作自由度受限于采集视频的动作范围,综合对比数字人比真人成本低、效率高,且质量稳定。 数字人直播更真实、更沉浸 支持持物直播、实景直播、弹幕智能互动、真人随时接管,让数字人直播更真实、更沉浸。 支持数字人直播矩阵式管理,高级策略配置管理直播更灵活。 实时智能交互,提升客户满意度和品牌形象 开放的Web
在服务主界面,单击左侧导航栏中的“任务中心”。 查看“分身数字人”页签的数字人定制任务列表,找到被驳回的数字人定制任务。 任务状态为“审核未通过”。 单击任务右侧的“查看原因”,在弹出的“审核未通过”对话框中,查看审核未通过的原因。 按照规范重新录制或提供符合规范的视频。 单击任务右侧的“重新上传”,上传更新后的视频。
用户需要参考视频制作,生成一个可以成功合成视频的视频草稿。然后将这个视频草稿作为模板进行复制,生成更多的视频草稿,再修改合成所需视频。 详细操作如下所示: 登录MetaStudio控制台。 在左侧导航栏中,选择“我的创作 ”。 选择“视频制作 > 视频草稿”页签,找到需要作为模板的视频草稿,单击卡片右下角的图标,从下
图2所示。 查看生成的分身数字人形象是否满足。用户可以在“定制任务详情”界面,执行下述操作。 如果训练生成的数字人形象满足需求,单击右下方的“通过”。在弹出的“确认”对话框中,单击“确认”,数字人形象生成完成。 如果训练生成的数字人形象不满足需求,单击右下方的“驳回”,进入“问题填写”界面。
分身视频直播首页面的“商品管理”页签,支持新增商品。商品会自动展示在直播间的“商品”页签中,供直播间添加使用。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“商品管理”,进入如图1所示的页面。 图1 商品管理页面 单击“新建”,进入“创建商品”页面,如图2所示。
大讯飞)。 出门问问的数字人平台对接至智能交互服务,开发者基于SDK完成web界面开发,操作请参考创建智能交互数字人(奇妙问)。 开发者自己提供LLM或者大模型,调用智能交互的文本驱动数字人能力。智能交互服务不感知用户自己的LLM或者大模型,只提供API接口和Web SDK。操作
形象拍摄指导文档下载 如需查看拍摄形象采集视频的PDF文件,请单击形象拍摄指导下载文件。 父主题: 形象制作
每个单场景中所有段落输入文字的总量需大于200字。 每个段落的文本字符数量需小于2000,如果包含语音合成标记语言SSML标签,需小于3000。 整个直播间所有段落的文本总字符数,如果包含语音合成标记语言SSML标签时,需小于30万。 音频驱动 每个单场景上传音频的时长需大于1分钟,大小不超过100M。
用户与数字人进行智能交互的页面,富媒体展示效果支持使用SDK提供的默认展示方式。 下述智能交互客户端SDK的两个方法的配置字段enableCaption,默认值均为False,即用户自定义富媒体的展示效果。如果需要使用SDK提供的默认展示效果,需修改参数enableCaption的值为true。
Markup Language)标记语言。 需要使用的标签,如下所示: <speak>:此标签为所有文本的根节点。一切需要调用SSML标签的文本,都要包含在<speak> </speak>标记对中。 <emotion>:情感标签,对指定的一或多句话生效。标签开始在句子起始位置,标签结束在句子结尾。用法为:<emotion
00020006 token和path中的projectId不匹配 token和path中的projectId不匹配 请检查使用的token和接口调用中的projectId是否为同一个用户项目 403 MSS.00020009 无效参数 非法参数 请检查接口文档和接口参数 403 MSS
用户Token。通过调用IAM服务获取用户Token接口获取,响应消息头中X-Subject-Token的值。 请求参数 表5、表6和表7中的请求参数为WebSocket建连成功后,用户与数字人对话的请求参数。 表5 请求Message参数 参数 是否必选 参数类型 描述 request_id
资产管理 如何接收并激活声音和分身模型资产?
进入当前智能交互对话项目链接的用户数大于该项目配置的并发数。 解决方案是修改当前项目的并发数,以满足实际所需。详细操作如下所示: 登录MetaStudio控制台。 选择“我的创作 > 智能交互”,找到需要修改并发数的智能交互对话项目。 单击项目所在行的“编辑”,进入对话项目编辑界面。
文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。
每句之间有2~3秒的停顿。音频时长3~10分钟,建议5分钟。 请完善声音信息 输入声音名称,示例:欢快女声。 请制作声音 使用“语料上传”的方式,直接上传一个已录制好的长音频WAV或MP3文件,无需压缩,无需携带文案txt文件。 请选择声音性别 选择声音的性别,示例:女生。 原始输入语言
MetaStudio访问第三方平台的鉴权密钥。 商品api地址 商品的API地址和直播回调地址,需要至少配置一项。 直播回调地址 单击“确定”,第三方平台新增成功。 新增的第三方平台,以卡片的形式展示在当前界面。 支持对第三方平台执行如下操作: 单击卡片右上角的,修改第三方平台信息。 单击卡片右上角的,删除当前第三方平台。
bsocket接口驱动数字人的方案,是不支持websdk内置语音唤醒能力的)。预制的唤醒能力支持使用“你好云笙”、“稍等一下”、“谢谢再见”三个唤醒词,进行数字人唤醒、打断和退出。 可以通过调用create接口,设置接口参数param中config里的enableLocalWakeup参数来开启Web语音唤醒能力。