检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
【下线公告】华为云ModelArts服务模型转换下线公告 【下线公告】华为云ModelArts MindStudio/ML Studio/ModelBox镜像下线公告 【下线公告】华为云ModelArts算法套件下线公告 【下线公告】华为云ModelArts服务旧版训练管理下线公告
ts中,创建为AI应用,进行统一管理。 1、如果您是在ModelArts中训练得到的模型,可直接从训练中导入模型。 2、如果您在本地或其他平台训练得到模型,可先将模型上传至OBS,再从OBS中导入模型。 从OBS导入元模型(手动配置) 从训练中选择元模型 使用自定义镜像创建AI应用
训练作业调测 使用SDK调测单机训练作业 使用SDK调测多机分布式训练作业 父主题: 训练作业
间内为专属资源池续费,否则资源会自动释放,数据丢失且不可恢复。 续费操作仅适用于包年/包月专属资源池,按需计费专属资源池不需要续费,只需要保证账户余额充足即可。 专属资源池在到期前续费成功,所有资源得以保留,且ModelArts使用不受影响。专属资源池到期后的状态说明,请参见到期后影响。
为推理服务,您可以进行在线推理预测,也可以通过调用API把AI推理能力集成到自己的IT平台。具体请参见推理部署使用场景。 Standard使用流程说明 ModelArts Standard平台提供了从数据准备到模型部署的AI全流程开发,兼容开发者的使用习惯,支持多种引擎和用户场景
创建训练实验 创建训练作业 查询训练作业详情 更新训练作业描述 删除训练作业 终止训练作业 查询训练作业指定任务的日志(预览) 查询训练作业指定任务的日志(OBS链接) 查询训练作业指定任务的运行指标 查询训练作业列表 查询超参搜索所有trial的结果 查询超参搜索某个trial的结果 获取超参敏感度分析结果
数据集如何切分 在发布数据集时,仅“图像分类”、“物体检测”、“文本分类”和“声音分类”类型数据集支持进行数据切分功能。 一般默认不启用该功能。启用后,需设置对应的训练验证比例。 输入“训练集比例”,数值只能是0~1区间内的数。设置好“训练集比例”后,“验证集比例”自动填充。“训练集比例”加“验证集比例”等于1。
架构强调高可用性,多数据中心部署确保数据与任务备份,即使遭遇故障,也能无缝切换至备用系统,维持模型训练不中断,保护长期项目免受时间与资源损耗,确保进展与收益。 大模型应用开发,帮助开发者快速构建智能Agents 在企业中,项目级复杂任务通常需要理解任务并拆解成多个问题再进行决策,然后调用
开发环境(旧版) 创建开发环境实例 查询开发环境实例列表 查询开发环境实例详情 更新开发环境实例信息 删除开发环境实例 管理开发环境实例 父主题: 历史API
Cluster使用的都是专属资源池。 MoXing MoXing是ModelArts自研的组件,是一种轻型的分布式框架,构建于TensorFlow、PyTorch、MXNet、MindSpore等深度学习引擎之上,使得这些计算引擎分布式性能更高,同时易用性更好。MoXing包含很多组件,其中MoXing Fra
“调优”。 在“创建模型调优任务”页面,配置参数。 由于需要分析模型调优效果,需要创建多个调优任务,不同调优任务的参数值配置请参见表2和表3。 表2 创建调优任务 参数 说明 取值样例 任务设置 任务名称 自定义调优任务名称。 参见表3 描述 调优任务简介。 - 模型设置 来源模型
部署在线服务时,您可以增加“计算节点个数”。 如果节点个数设置为1,表示后台的计算模式是单机模式;如果节点个数设置大于1,表示后台的计算模式为分布式的。您可以根据实际需求进行选择。 推理速度与模型复杂度强相关,您可以尝试优化模型提高预测速度。 ModelArts中提供了模型版本管理的功能,方便溯源和模型反复调优。
如何查看ModelArts中正在收费的作业? 如何查看ModelArts消费详情? ModelArts上传数据集收费吗? ModelArts标注完样本集后,如何保证退出后不再产生计费? ModelArts自动学习所创建项目一直在扣费,如何停止计费? 如果不再使用ModelArts,如何停止收费? 训练作业如何收费?
少客户自行配置环境的复杂度。 范围 本文涉及PyTorch训练的单卡和分布式业务迁移到昇腾的业务范围。当前针对常见的开源LLM/AIGC等领域的开源模型,ModelArts已经提供了迁移好的开箱即用模型,且保证了较优的精度和性能。如果用户业务同样使用这些开源模型,建议直接使用Mo
拉取镜像失败 服务启动失败,提示拉取镜像失败,请参考服务部署、启动、升级和修改时,拉取镜像失败如何处理? 资源不足,服务调度失败 服务启动失败,提示资源不足,服务调度失败,请参考服务部署、启动、升级和修改时,资源不足如何处理? 内存不足 服务启动失败,提示内存不足,请参考内存不足如何处理?
OOM导致训练作业失败 问题现象 因为OOM导致的训练作业失败,会有如下几种现象。 错误码返回137,如下图所示。 Modelarts Service Log Trainina end with return code: 137 Modelarts Service Log]handle
LabelTaskProperties 属性 描述 是否必填 数据类型 task_type 标注任务类型,返回指定标注任务类型的任务列表。 是 LabelTaskTypeEnum task_name 标注任务名称,名称只能包含中文、字母、数字、中划线和下划线,长度为1-100位。 当输入是数据集对象时,该参数必填
模型发布失败 模型发布任务提交失败和模型发布失败问题,一般是因为后台服务故障导致的,建议稍等片刻,然后重新创建训练作业。如果重试超过3次仍无法解决,请获取如下信息,并联系华为云技术支持协助解决故障。 获取模型ID。 进入“模型管理”页面,在模型管理页面找到自动学习任务中自动创建的模型,
R的更多信息请参见《容器镜像服务用户指南》。 与智能边缘平台的关系 ModelArts可将模型部署至智能边缘平台(Intelligent EdgeFabric,简称IEF)纳管的边缘节点。IEF的更多信息请参见《智能边缘平台用户指南》。 与云监控的关系 ModelArts使用云监控服务(Cloud
具体使用到该功能时,才会发生问题。例如,用户在创建训练任务时打开了“消息通知”,该功能依赖SMN委托授权,但只有训练任务运行过程中,真正需要发送消息时,系统才会“出错”,而有些错误系统会选择“忽略”,另一些错误则可能导致任务直接失败。当您做深入的“权限最小化”限制时,请确保您在M