搜索_华为云

如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

device 原因分析因为编译的时候需要设置setup.py中编译的参数arch和code和电脑的显卡匹配。解决方法对于GP Vnt1的显卡，GPU算力为-gencode arch=compute_70,code=[sm_70,compute_70]，设置setup.py中的编译参数即可解决。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
在ModelArts的Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

昇腾多卡训练任务是多进程多卡模式，跑几卡需要起几个python进程。昇腾底层会读取环境变量：RANK_TABLE_FILE，开发环境已经设置，用户无需关注。比如跑八卡，可以如下片段代码： export RANK_SIZE=8 current_exec_path=$(pwd)

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

推理业务迁移到昇腾的通用流程，可参考GPU推理业务迁移至昇腾的通用指导。由于Huggingface网站的限制，访问Stable Diffusion链接时需使用代理服务器，否则可能无法访问网站。在Stable Diffusion迁移适配时，更多的时候是在适配Diffusers和Stable Diffusion

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

site-packages\pip (python *.*) 在Windows环境中，如果提示“不是内部或外部命令”，请您在“环境变量”中设置“Path”，增加Python和pip的安装路径，具体步骤如下。pip的安装路径一般为Python所在目录的Scripts文件夹。快捷键

 帮助中心 > AI开发平台ModelArts > SDK参考
在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

理”，单击“创建”，进入模型管理。设置模型的参数，如图13所示。元模型来源：从容器镜像中选择。容器镜像所在的路径：单击选择前面创建的镜像。容器调用接口：选择HTTPS。 host：设置为8443。部署类型：选择在线部署。图13 设置模型参数填写apis定义，单击“保

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

在“我的算法”管理页面，单击“创建”，进入“创建算法”页面。填写算法的基本信息，包含“名称”和“描述”。设置算法启动方式，有以下三种方式可以选择。设置算法启动方式（预置框架）图1 使用预置框架创建算法需根据实际算法代码情况设置“代码目录”和“启动文件”。选择的预置框架和编写算法代码时选择的框架必须一致

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
日志提示“no socket interface found” - AI开发平台ModelArts

原因分析可能原因如下：原因1：未设置环境变量NCCL_IB_TC、NCCL_IB_GID_INDEX、NCCL_IB_TIMEOUT，因此会导致通信速度慢且不稳定，最后造成IB通信断连，偶发上述现象。原因2：NCCL_SOCKET_IFNAME设置错误。当用户的NCCL版本低于2

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
创建DevServer - AI开发平台ModelArts

String> 通过应用专属URL直接打开应用进入远程开发模式。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。表10 EndpointsRes 参数参数类型描述 allowed_access_ips Array

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

您可以在当前的终端会话中直接执行TMOUT=0使设置立即生效，或者将export TMOUT=0添加到/etc/profile文件中，以确保所有用户的新会话都不会因为空闲而断开。但是在生产环境或多人使用的公共服务器上，不建议设置TMOUT=0，关闭自动注销功能会带来一定的安全风险。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
在ModelArts中物体检测标注时能否自定义标签？ - AI开发平台ModelArts

在ModelArts中物体检测标注时能否自定义标签？可以通过修改数据集给标签添加自定义属性来设置一些自定义的属性。图1 修改数据集父主题： Standard数据准备

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
训练作业的自定义镜像制作流程 - AI开发平台ModelArts

low+GPU）从0制作自定义镜像用于创建训练作业（MindSpore+Ascend）训练框架的自定义镜像约束推荐自定义镜像使用ubuntu-18.04的操作系统，避免出现版本不兼容的问题。自定义镜像的大小推荐15GB以内，最大不要超过资源池的容器引擎空间大小的一半。镜像过大会直接影响训练作业的启动时间。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
TensorFlow-1.8作业连接OBS时反复出现提示错误 - AI开发平台ModelArts

8中会出现的情况，该日志是Info级别的，并不是错误信息，可以通过设置环境变量来屏蔽INFO级别的日志信息。环境变量的设置一定要在import tensorflow或者import moxing之前。处理方法您需要通过在代码中设置环境变量“TF_CPP_MIN_LOG_LEVEL”来屏

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

/xxx/pytorch.tar.gz . 将pytorch.tar.gz上传到OBS并设置公共读，并在构建时使用wget命令获取、解压、清理。构建新镜像。基础镜像一般选用“ubuntu 18.04”的官方镜像，或者nvidia官方提供的带cuda驱动的镜像。相关镜像直接到dockerhub官网查找即可。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
管理AI Gallery模型 - AI开发平台ModelArts

量，能更好的支撑用户使用该资产。在模型详情页，选择“模型介绍”页签，单击右侧“编辑介绍”。编辑模型基础设置和模型描述。表1 模型介绍的参数说明参数名称说明基础设置中文名称显示模型的名称，不可编辑。许可证模型遵循的使用许可协议，根据业务需求选择合适的许可证类型。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
切换Lite Server服务器操作系统 - AI开发平台ModelArts

或者环境变量中密文存放，使用时解密，确保安全； // 本示例以ak和sk保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_AK和HUAWEICLOUD_SDK_SK。 ak := os.Getenv("HUAWEICLOUD_SDK_AK")

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
资源选择推荐 - AI开发平台ModelArts

包月购买。免费。 × 按需购买。单机多卡 × 包月购买。（HPC型500G）免费。免费。包月购买。免费。包月购买。（Ubuntu 18.04，建议不小于2U8G，本地存储空间100G，带EIP全动态BGP，按流量10M带宽） × 多机多卡按需购买。（普通OBS桶）

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
通过Function Calling扩展大语言模型对外部环境的理解 - AI开发平台ModelArts

Calling扩展大语言模型对外部环境的理解本示例将展示如何定义一个获取送货日期的函数，并通过LLM来调用外部API来获取外部信息。操作步骤设置Maas的api key和模型服务地址。 import requests from openai import OpenAI client

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 通过Function Calling扩展大语言模型交互能力
在ModelArts的Notebook中使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

run”中，修改“log_dir”参数，并新增“checkpoint_path”参数。其中“log_dir”参数建议设置为一个新的目录，“checkpoint_path”参数设置为上一次训练结果输出路径，如果是OBS目录，路径填写时建议使用“obs://”开头。如果标注数据中的标签发生了变化，在运行“mox

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
注册自定义镜像 - AI开发平台ModelArts

INFERENCE: 建议仅在推理部署场景使用。 TRAIN: 建议仅在训练任务场景使用。 DEV: 建议仅在开发调测场景使用。 UNKNOWN: 未明确设置的镜像支持的服务类型。 services 否 Array of strings 镜像支持的服务，默认值NOTEBOOK、SSH。枚举值如下:

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
创建ModelArts委托 - AI开发平台ModelArts

m-user01。默认为空，表示创建名称为modelarts_agency的委托。响应参数无请求示例创建ModelArts委托。设置委托名称后缀为“iam-user01”。 POST https://{endpoint}/v2/{project_id}/agency {

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理

总条数： 993

上一页
1
...
4
5
6
...
50
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

在ModelArts的Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

日志提示“no socket interface found” - AI开发平台ModelArts

创建DevServer - AI开发平台ModelArts

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

在ModelArts中物体检测标注时能否自定义标签？ - AI开发平台ModelArts

训练作业的自定义镜像制作流程 - AI开发平台ModelArts

TensorFlow-1.8作业连接OBS时反复出现提示错误 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

管理AI Gallery模型 - AI开发平台ModelArts

切换Lite Server服务器操作系统 - AI开发平台ModelArts

资源选择推荐 - AI开发平台ModelArts

通过Function Calling扩展大语言模型对外部环境的理解 - AI开发平台ModelArts

在ModelArts的Notebook中使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

注册自定义镜像 - AI开发平台ModelArts

创建ModelArts委托 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线