检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
String 文件下载URL,有效期为24小时。 state String 文件状态枚举: CREATING:文件上传中 CREATED:文件已上传(自动审核通过) FAILED:文件上传失败 CANCELLED:文件上传已取消 DELETING:文件删除中 DELETED:文件已删除
数字人定制任务审核通过后,启动算法训练,会在3个工作日内训练完成并生成数字人,请耐心等待。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 在“分身数字人”页签,单击数字人定制任务右侧的“查看详情”,进入“定制任务详情”页面。 审核通过后,任务状态变更为“算法训练中”,如图1所示。
粒度资源包,并分配资源给关联租户使用。 使用限制 SP用户仅对大客户开放申请和使用。 SP用户不支持自己使用购买的资源包。 SP用户不支持访问MetaStudio控制台,进行控制台操作。 SP用户购买形象制作时,不会赠送视频制作时长。 如果用户先购买资源,再申请成为SP用户,那么
删除分身数字人模型训练任务 功能介绍 该接口用于删除分身数字人模型训练任务。同时需要删除训练任务相关的训练视频、身份证照片、授权文件、模型资产等。 该接口应当在任务处于以下状态时调用:WAIT_FILE_UPLOAD、AUTO_VERIFY_FAILED、MANUAL_VERIF
音频数据训练上传URL。该url在文件上传成功后失效,只能上传一次 说明: 通过该地址上传时,需设置content-type为application/zip。 cover_upload_url String 模型封面上传URL。该URL在文件上传成功后失效,只能上传一次。 说明: 通过该地址上传时,
客户声音制作案例 单击声音样例.zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav
String 字幕文件下载链接。 subtitle_file_upload_url String 字幕文件上传链接。 subtitle_file_state String 字幕文件生成状态。 GENERATING:字幕文件生成中。 GENERATE_SUCCEED:字幕文件生成成功。
互动页面的网址,分享给其他用户使用。 获取数字人互动页面URL的方式还有:进入“我的创作 > 智能交互 > 对话项目”页面,单击智能交互对话项目右侧的“生成URL并复制”,将URL分享给其他用户使用。 图4 智能交互对话项目 复制URL至浏览器中,访问数字人互动页面。 界面弹出激
激发公众参与环境保护的热情, 并通过民间组织、学校和媒体等渠道促进信息的传播与共享。 各国通过国际组织、跨国合作机制和多边环境协议等平台加强合作与协调, 共同制定环境保护政策、分享经验和技术,并解决跨国界环境问题。 国际社会关注灾害风险管理, 通过建立早期预警系统、加强应急响应和灾后重建等措施,
约束限制: 该配置仅用于模板 取值范围: PRIVATE:私有,仅本租户可访问。 PUBLIC:公开,所有租户可访问。当前仅提供系统资产可公开访问。 SHARED:共享,指定租户可访问。拥有者指定租户可访问。 默认取值: 不涉及。 shared_state 否 String 参数解释:
方声音。 获取第三方声音使用凭证:查看已购套餐包的“用户账号”和“登录密码”,作为MetaStudio控制台第三方声音使用凭证。 激活第三方声音使用凭证:在MetaStudio控制台新增凭证,输入已购套餐包的“用户账号”和“登录密码”作为使用凭证。 在MetaStudio控制台查
(算网融合、超低时延),通过华为云盘古数字人大模型,训练生成数字人、数字物、数字空间,实现数字人视频制作、直播、智能交互和数字人IP代言等场景。 数字人升级迭代快,提升产品竞争力 口型精准:口型匹配度>95%,多语种无缝切换,泛化能力强。 表情自然:通过AI眼神矫正,矫正前后眼部ID一致,避免眼神不聚焦。
开发者如何获取技术支持? 如果开发过程中遇到问题,可以提单MetaStudio服务处理。 详细操作如下所示: 访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。
model file down fail 请检查人物模型资产文件是否存在,不存在请更换人物模型,如果存在请联系技术支持 MSS.47000014 background file down fail 请检背景图片资产文件是否存在,不存在请更换背景,如果存在请联系技术支持 MSS.47000015
需整段录制所有语料生成一个长音频WAV或MP3格式文件,每句之间有2~3秒的停顿。WAV或MP3格式文件可直接上传MetaStudio控制台,无需压缩,无需提供语料txt文件。 推荐使用服务预置语料,也可自定义语料。系统会自动根据停顿做切割,自动识别文本内容。 音频文件命名无要求,可自定义,命名示例:Voice
如果华为云账号无法满足用户的使用诉求,可参考创建用户并授权使用MetaStudio,创建IAM用户,进行精细化的权限管理。 推荐浏览器 推荐使用Chrome浏览器访问MetaStudio控制台。
传等。 通过分身数字人进行教育宣传和教育资源推广,进行线上教学和培训,不仅可以大幅节约师资成本,还可以提升教学质量。通过减少对人力的依赖,使教育机构可以将更多精力投入到创新和教学内容的优化上,从而实现更高效的教育体系。 医疗健康 医学科普是近年来政策倡导的一大方向。通过医学科普,
PUBLIC:公开,所有租户可访问。当前仅提供系统资产可公开访问。 SHARED:共享,指定租户可访问。拥有者指定租户可访问。 默认取值: 不涉及。 shared_state 否 String 参数解释: 共享状态。 约束限制: 该配置仅用于shared_type为SHARED的模板。
系统的声音输出设备不一致导致。 检查方法如下所示: 检查OBS桌面音频设备 检查Windows系统的声音输出设备 检查OBS桌面音频设备 本地打开OBS视频采集工具。 在界面下方,选择“混音器”。 图1 OBS工具 单击“桌面音频”区域的图标,在弹出的下拉框中,选择“属性”,弹出桌面音频属性设置对话框,如图2所示。
在界面上方的主菜单中,单击“我的应用”。 单击应用所在行的图标,进入当前应用的“应用配置”页面。 在左侧导航栏中,单击“服务统计”,进入“服务统计”页面,如图1所示。 通过下图可以看出,科大讯飞免费赠送500次/天的问答交互。 图1 服务统计页面 单击“剩余(次数)”“500”下方的“提升交互次数”,可以按照