搜索_华为云

查询服务详情 - AI开发平台ModelArts

返回。 load_balancer_policy String 在线同步服务设置elb后端转发策略详情枚举值：ROUND_ROBIN(加权轮询算法)，LEAST_CONNECTIONS(加权最少连接)，SOURCE_IP(源ip算法) 表4 QueryServiceConfig 参数

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
自定义镜像训练作业配置节点间SSH免密互信 - AI开发平台ModelArts

keys config id_rsa id_rsa.pub”。提交创建训练作业后，训练过程中，训练作业的节点可通过域名+端口的方式SSH连接到其他节点，示例代码如下所示： ssh modelarts-job-a0978141-1712-4f9b-8a83-000000000000-worker-1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
注册自定义镜像 - AI开发平台ModelArts

镜像支持的服务，默认值NOTEBOOK、SSH。枚举值如下: NOTEBOOK：镜像支持通过https协议访问Notebook。 SSH：镜像支持本地IDE通过SSH协议远程连接Notebook。 swr_path 是 String SWR镜像地址。 visibility 否 String 镜像可见度，默认值PRIVATE。枚举值：

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
使用Prometheus查看Lite Cluster监控指标 - AI开发平台ModelArts

个节点上都没有被其他应用占用。 Kubernetes下Prometheus对接ModelArts 使用kubectl连接集群，详细操作请参考通过kubectl连接集群。配置Kubernetes的访问授权。使用任意文本编辑器创建prometheus-rbac-setup.yml，YAML文件内容如下：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
Standard Notebook - AI开发平台ModelArts

赖？在ModelArts的Notebook中安装远端插件时不稳定要怎么办？在ModelArts的Notebook中实例重新启动后要怎么连接？在ModelArts的Notebook中使用VS Code调试代码无法进入源码怎么办？在ModelArts的Notebook中使用VS

帮助中心 > AI开发平台ModelArts > 常见问题
权限相关 - AI开发平台ModelArts
权限相关 - AI开发平台ModelArts

权限相关使用ModelArts时提示“权限不足”，如何解决？在Notebook中如何实现IAM用户隔离？如何获取访问密钥？

帮助中心 > AI开发平台ModelArts > 常见问题
ModelArts在线服务处于运行中时，如何填写request header和request body？ - AI开发平台ModelArts

IAM/AKSK认证方式：需要在header的X-Auth-Token字段上填入该租户在该region的domain级别的token。具体指导参见连接：获取IAM用户Token。 APP认证的方式：APP认证方式又可以细分为AppCode认证和APP签名认证。 AppCode认证需要在h

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
Standard模型训练 - AI开发平台ModelArts

Standard模型训练使用ModelArts Standard自定义算法实现手写数字识别基于ModelArts Standard运行GPU训练作业

 帮助中心 > AI开发平台ModelArts > 最佳实践
ECS中构建新镜像 - AI开发平台ModelArts

\ git config --global user.name "Your Name" && \ 执行以下命令制作训练镜像。安装过程需要连接互联网git clone，请确保ECS可以访问公网 docker build -t <镜像名称>:<版本名称> . 如果无法访问公网，则

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Turbo内的目录与OBS对象存储桶进行关联，然后通过创建导入导出任务实现数据同步。通过OBS与SFS Turbo存储联动，可以将最新的训练数据导入到SFS Turbo，然后在训练作业中挂载SFS Turbo到容器对应ckpt目录，实现分布式读取训练数据文件。创建SFS Turbo文件系统，详细操作指导请参考创建SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Turbo内的目录与OBS对象存储桶进行关联，然后通过创建导入导出任务实现数据同步。通过OBS与SFS Turbo存储联动，可以将最新的训练数据导入到SFS Turbo，然后在训练作业中挂载SFS Turbo到容器对应ckpt目录，实现分布式读取训练数据文件。创建SFS Turbo文件系统，详细操作指导请参考创建SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
ECS中构建新镜像 - AI开发平台ModelArts

\ git config --global user.name "Your Name" && \ 执行以下命令制作训练镜像。安装过程需要连接互联网git clone，请确保ECS可以访问公网 docker build -t <镜像名称>:<版本名称> . 如果无法访问公网，则

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
上传镜像 - AI开发平台ModelArts
上传镜像 - AI开发平台ModelArts

约束与限制使用客户端上传镜像，镜像的每个layer大小不能大于10G。上传镜像的容器引擎客户端版本必须为1.11.2及以上。操作步骤连接容器镜像服务。登录容器镜像服务控制台。单击右上角“创建组织”，输入组织名称完成组织创建。请自定义组织名称，本示例使用“deep-lea

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
ECS中构建新镜像 - AI开发平台ModelArts

由默认 transformers==4.45.0 修改为：transformers==4.44.2 执行以下命令制作训练镜像。安装过程需要连接互联网git clone，请确保ECS可以访问公网 docker build -t <镜像名称>:<版本名称> . 如果无法访问公网，则

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作 > 准备镜像
ECS中构建新镜像 - AI开发平台ModelArts

由默认 transformers==4.47.0 修改为：transformers==4.44.2 执行以下命令制作训练镜像。安装过程需要连接互联网git clone，请确保ECS可以访问公网 docker build -t <镜像名称>:<版本名称> . 如果无法访问公网，则

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
释放Lite Cluster资源 - AI开发平台ModelArts

如果是“包年/包月”且资源未到期的节点，您可单击操作列的“退订”，即可实现对单个节点的资源释放。支持批量退订节点。如果是“包年/包月”且资源到期的节点（处于宽限期），您可单击操作列的“释放”，即可实现对单个节点的资源释放。不支持批量释放处于宽限期的节点。退订/释放操作无法恢复，请谨慎操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
ECS中构建新镜像 - AI开发平台ModelArts

\ git config --global user.name "Your Name" && \ 执行以下命令制作训练镜像。安装过程需要连接互联网git clone，请确保ECS可以访问公网 docker build -t <镜像名称>:<版本名称> . 若无法访问公网，则可

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

IFA算子（增量decode阶段的flash-attention）是否使用高精度模式；默认值为0表示不开启。针对Qwen2-7B、Qwen2-57b、Qwen2-72B，在长序列下需要开启，否则会有概率性精度异常；其他模型不建议开启，会影响增量时延增加5%~10%。 export USE_PREFIX_HIGH_PRECISION_MODE=1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
管理Lite Cluster资源池 - AI开发平台ModelArts

池详情页面。在资源池详情页面，单击“标签”页签查看标签信息。支持添加、修改、删除标签。标签详细用法请参见ModelArts如何通过标签实现资源分组管理。图3 标签最多支持添加20个标签。 Lite Cluster资源池配置管理在资源池详情页面，单击“配置管理”，在配置管

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
释放Standard专属资源池和删除网络 - AI开发平台ModelArts

如果是“包年/包月”且资源未到期的节点，您可单击操作列的“退订”，即可实现对单个节点的资源释放。支持批量退订节点。如果是“包年/包月”且资源到期的节点（处于宽限期），您可单击操作列的“释放”，即可实现对单个节点的资源释放。不支持批量释放处于宽限期的节点。退订/释放操作无法恢复，请谨慎操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池

总条数： 692

上一页
1
...
21
22
23
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询服务详情 - AI开发平台ModelArts

自定义镜像训练作业配置节点间SSH免密互信 - AI开发平台ModelArts

注册自定义镜像 - AI开发平台ModelArts

使用Prometheus查看Lite Cluster监控指标 - AI开发平台ModelArts

Standard Notebook - AI开发平台ModelArts

权限相关 - AI开发平台ModelArts

ModelArts在线服务处于运行中时，如何填写request header和request body？ - AI开发平台ModelArts

Standard模型训练 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

上传镜像 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

释放Lite Cluster资源 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

管理Lite Cluster资源池 - AI开发平台ModelArts

释放Standard专属资源池和删除网络 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线