搜索_华为云

在ModelArts的Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

昇腾多卡训练任务是多进程多卡模式，跑几卡需要起几个python进程。昇腾底层会读取环境变量：RANK_TABLE_FILE，开发环境已经设置，用户无需关注。比如跑八卡，可以如下片段代码： export RANK_SIZE=8 current_exec_path=$(pwd)

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

选择EulerOS；ECS服务器确保可以访问公网，用于获取镜像和构建镜像。图3 购买ECS ECS服务器挂载SFS Turbo ECS服务器中手动挂载SFS Turbo步骤如下：用户可通过CloudShell或SSH等方式登录并访问ECS服务器，进入ECS终端界面。创建/mnt/sfs_turbo目录作为挂载目录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

选择EulerOS；ECS服务器确保可以访问公网，用于获取镜像和构建镜像。图3 购买ECS ECS服务器挂载SFS Turbo ECS服务器中手动挂载SFS Turbo步骤如下：用户可通过CloudShell或SSH等方式登录并访问ECS服务器，进入ECS终端界面。创建/mnt/sfs_turbo目录作为挂载目录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

device 原因分析因为编译的时候需要设置setup.py中编译的参数arch和code和电脑的显卡匹配。解决方法对于GP Vnt1的显卡，GPU算力为-gencode arch=compute_70,code=[sm_70,compute_70]，设置setup.py中的编译参数即可解决。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

选择EulerOS；ECS服务器确保可以访问公网，用于获取镜像和构建镜像。图3 购买ECS ECS服务器挂载SFS Turbo ECS服务器中手动挂载SFS Turbo步骤如下：用户可通过CloudShell或SSH等方式登录并访问ECS服务器，进入ECS终端界面。创建/mnt/sfs_turbo目录作为挂载目录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

选择EulerOS；ECS服务器确保可以访问公网，用于获取镜像和构建镜像。图3 购买ECS ECS服务器挂载SFS Turbo ECS服务器中手动挂载SFS Turbo步骤如下：用户可通过CloudShell或SSH等方式登录并访问ECS服务器，进入ECS终端界面。创建/mnt/sfs_turbo目录作为挂载目录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

ModelArts服务具备资源池和隔离能力，避免单租户资源被攻击导致爆炸半径过大风险。 ModelArts服务定义并维护了性能规格用于自身的抗攻击性。例如：设置API访问限制，防止恶意接口调用等场景。 ModelArts服务在攻击场景下，具备告警能力及自我保护能力。 ModelArts服务提供了业

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
使用MaaS部署模型服务 - AI开发平台ModelArts

单击“选择模型”，选择“模型广场”或“我的模型”下面的模型。资源设置资源池类型资源池分为公共资源池与专属资源池。公共资源池供所有租户共享使用。专属资源池需单独创建，不与其他租户共享。实例规格选择实例规格，规格中描述了服务器类型、型号等信息。流量限制（QPS）设置待部署模型的流量限制QPS。单位：次/秒

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

选择EulerOS；ECS服务器确保可以访问公网，用于获取镜像和构建镜像。图3 购买ECS ECS服务器挂载SFS Turbo ECS服务器中手动挂载SFS Turbo步骤如下：用户可通过CloudShell或SSH等方式登录并访问ECS服务器，进入ECS终端界面。创建/mnt/sfs_turbo目录作为挂载目录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
日志提示“no socket interface found” - AI开发平台ModelArts

原因分析可能原因如下：原因1：未设置环境变量NCCL_IB_TC、NCCL_IB_GID_INDEX、NCCL_IB_TIMEOUT，因此会导致通信速度慢且不稳定，最后造成IB通信断连，偶发上述现象。原因2：NCCL_SOCKET_IFNAME设置错误。当用户的NCCL版本低于2

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
在ModelArts中1个节点的专属资源池，能否部署多个服务？ - AI开发平台ModelArts

自定义规格”，设置小一些或者选择小规格的服务节点规格，当资源池节点可以容纳多个服务节点规格时，就可以部署多个服务。如果使用此方式进行部署推理，选择的规格务必满足模型的要求，当设置的规格过小，无法满足模型的最小推理要求时，则会出现部署失败或预测失败的情况。图1 设置自定义规格父主题：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池
通过SSH工具远程使用Notebook - AI开发平台ModelArts

PuTTY时就可以单击保存的任务名称，即可打开远程连接。图3 设置Session 选择“Window > Translation”，在“Remote character set:”中选择“UTF-8”。图4 设置字符格式选择“Connection > Data”，在“Auto-login

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
在ModelArts中物体检测标注时能否自定义标签？ - AI开发平台ModelArts

在ModelArts中物体检测标注时能否自定义标签？可以通过修改数据集给标签添加自定义属性来设置一些自定义的属性。图1 修改数据集父主题： Standard数据准备

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
在Dify中配置支持Function Calling的模型使用 - AI开发平台ModelArts

Function calling 设置为“Tool Call”。 Stream function calling 暂不支持。在Dify中创建Agent进行编配，在右上角单击“Agent 设置”，选择上一步配置好的模型进行使用。在Agent设置中可以看到Dify已自动将Agent

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 通过Function Calling扩展大语言模型交互能力
Lite Server资源开通 - AI开发平台ModelArts

信息。表2 基础配置参数说明参数名称说明资源类型裸金属服务器是一款兼具弹性云服务器和物理机性能的计算类服务器，为您和您的企业提供专属的云上物理服务器。弹性云服务器是一种可随时自助获取、可弹性伸缩的云服务器，可帮助您打造可靠、安全、灵活、高效的应用环境，确保服务持久稳定运行，提升运维效率。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server）
调用MaaS部署的模型服务 - AI开发平台ModelArts

Int 控制要考虑的前几个Tokens的数量的整数。设置为“-1”表示考虑所有Tokens。适当降低该值可以减少采样时间。 top_p 否 1.0 Float 控制要考虑的前几个Tokens的累积概率的浮点数。取值范围：0~1 设置为“1”表示考虑所有Tokens。 temperature

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
安装Gallery CLI配置工具 - AI开发平台ModelArts

CLI配置工具包（云服务器）如果是在ModelArts Lite等云服务器安装Gallery CLI配置工具，则参考本节将工具包下载至云服务器。登录AI Gallery，单击右上角“我的Gallery”进入我的Gallery页面。左侧菜单栏选择“我的资源 > 云服务器”，单击专属资源池页签进入云服务详情页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
TensorFlow-1.8作业连接OBS时反复出现提示错误 - AI开发平台ModelArts

8中会出现的情况，该日志是Info级别的，并不是错误信息，可以通过设置环境变量来屏蔽INFO级别的日志信息。环境变量的设置一定要在import tensorflow或者import moxing之前。处理方法您需要通过在代码中设置环境变量“TF_CPP_MIN_LOG_LEVEL”来屏

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
约束与限制 - AI开发平台ModelArts

Lite Server使用裸金属服务器时，如果升级/修改操作系统内核或者驱动，很可能导致驱动和内核版本不兼容，从而导致OS无法启动，或者基本功能不可用。如果需要升级或修改，请联系华为云技术支持。 ModelArts Lite Server使用ECS服务器时不支持重装操作系统，部分区

 帮助中心 > AI开发平台ModelArts > 产品介绍
在线服务鉴权 - AI开发平台ModelArts

响应参数状态码： 201 表4 响应Body参数参数参数类型描述 result String 认证结果。请求示例对在线服务进行鉴权。设置付费工作流计费周期为“day”，付费工作流可使用的时间为“100”。 POST https://{endpoint}/v2/{projec

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理

总条数： 1941

上一页
1
...
5
6
7
...
98
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在ModelArts的Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

使用MaaS部署模型服务 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

日志提示“no socket interface found” - AI开发平台ModelArts

在ModelArts中1个节点的专属资源池，能否部署多个服务？ - AI开发平台ModelArts

通过SSH工具远程使用Notebook - AI开发平台ModelArts

在ModelArts中物体检测标注时能否自定义标签？ - AI开发平台ModelArts

在Dify中配置支持Function Calling的模型使用 - AI开发平台ModelArts

Lite Server资源开通 - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

安装Gallery CLI配置工具 - AI开发平台ModelArts

TensorFlow-1.8作业连接OBS时反复出现提示错误 - AI开发平台ModelArts

约束与限制 - AI开发平台ModelArts

在线服务鉴权 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线