检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
智能交互数字人委托管理 查询委托 创建委托 删除委托 父主题: 智能交互管理
音色ID的查询操作,详见查询预置音色ID。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 speed 否 Integer 参数解释: 语速。50表示0.5倍语速,100表示正常语速,200表示2倍语速。 当取值为“100”时,表示一个成年人的正常语速,约为250字/分钟。
分身数字人字幕文件生成管理 创建分身数字人视频字幕文件 查询分身数字人视频字幕文件任务详情 父主题: 分身视频制作
ShootScriptItem objects 拍摄脚本列表。 表4 VoiceConfig 参数 是否必选 参数类型 描述 voice_asset_id 是 String 参数解释: 音色资产ID,可以从资产库中查询。 音色ID的查询操作,详见查询预置音色ID。 约束限制: 不涉及。 取值范围:
智能交互数字人对话任务管理 创建对话链接 启动数字人智能交互任务 结束数字人智能交互任务 查询数字人智能交互任务 父主题: 智能交互管理
素材使用。有时PPT的字体、公式、图表等不支持在MetaStudio控制台展示,建议将PPT转存为PDF文件后,在导入本地PPT的位置,重新导入PDF文件,进行视频制作。 MetaStudio平台仅支持上传通过PPT转存的PDF文件,不支持使用Adobe导出的PDF文件。 PPT转PDF的操作如下所示:
ShootScriptItem objects 拍摄脚本列表。 表4 VoiceConfig 参数 是否必选 参数类型 描述 voice_asset_id 是 String 参数解释: 音色资产ID,可以从资产库中查询。 音色ID的查询操作,详见查询预置音色ID。 约束限制: 不涉及。 取值范围:
获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。
Boolean 是否为尾部(任务数据已全部生成,后续没有新的数据) 默认取值: false audio String 音频数据,Base64编码,1秒内的数据。 blendshapes Array of strings 语音驱动的表情基数据。 animations Array of AnimationItem
获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。
现代融合 随着杭州城市的现代化发展,西湖也得到了更好的保护和开发。环湖步道、自行车道等公共设施的完善,使得游客能够更加便捷地游览西湖。同时,西湖的夜景灯光工程,也为游客提供了全新的观赏体验。 社会影响 西湖不仅是杭州的象征,更是中国乃至世界文化的重要组成部分。它的影响力体现在多个层面:
单击“确定”,进入如图3所示的页面。 参考表3设置第一个问答对。单击“添加问答”,可以增加更多的问答对。一个技能可以最多添加40个问答对。 为方便添加问答对,用户可以在本地使用Excel文件,提前准备好技能问答对内容,然后一一填充至线上的技能问答对中,示例如表2所示。 表2 问答对样例 序号
bulary-configs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。 表2 Query参数 参数 是否必选 参数类型 描述 offset 否 Integer 查询偏移量,若超过最大数量,则返回最后一页
编译工具 建议Webpack 5 + babel 7。 浏览器 浏览器使用限制,请参见表2。 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 表2 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器
嗨,大家好!欢迎来到我们的直播间!我是今天的主播Lan。 非常高兴能够和各位在今晚的直播间相聚,希望今天在直播间里能和大家一起度过一段非常有意义的时光! 感谢每一位在直播间停留观看的朋友们,感谢大家进来咱们的直播间参与今天的互动、留言。 稍后我们的直播间不但会教学一些数字人视频的剪辑技巧,还会跟大家推荐一些AI剪辑的功能。
大家好,今天我很高兴能来到这里进行数字人形象和声音的采集。接下来,我将和大家一起复盘一下数字人的形象拍摄要求。 第一步,我们需要在拍摄前检查自己的穿着,在绿幕的拍摄环境下,不能穿绿色或者透明的衣服、也不要穿含有密集条纹的衣服。我们需要确保面部没有零散的发丝,尽量不要佩戴眼镜或者项链、耳环、手表等首饰。因为银饰或
Flexus分身数字人形象采集指南 本节将协助您完成Flexus分身数字人形象的采集工作。请注意,您的数字人形象会与录制效果保持一致,包括服装、手部动作、面部表情以及各方面的姿态等。所以我们希望您在拍摄时尽可能保持自然,按照平时的说话习惯录制。 拍摄流程 支持手机或相机拍摄,需1080P或更高分辨率。
解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。 表1 防火墙端口白名单 端口类型 端口 TCP端口 443、6447 UDP端口 20000-20063 配置SparkRTC域名的防火墙白名单,如表2所示。
模型审核和制作可以加快吗? 为了保证模型质量,确保素材符合拍摄要求,训练前素材会经过人工审核。原则上不支持催审和加速,请耐心等待。模型审核制作耗时详情,如表1所示。 表1 模型制作耗时 模型类型 制作耗时 声音模型 声音模型制作耗时,如下所示: 基础版:约1~3个工作日。 进阶版:约1~3个工作日。 高品质:约5个工作日。
文明。聋哑画家史晓慧,通过数字分身以有声的方式解读作品背后的故事,让更多人能够听懂无声世界的斑斓。 我国有4.91亿乡村人口从事农产品生产,有10万多个特色小宗类乡土产业。“土特产”背后连着千家万户的生计。直播助农,正在为乡村产业带来广阔的市场空间。然而村民想做直播却面临着很多困