搜索_华为云

委托授权ModelArts云服务使用SFS Turbo - AI开发平台ModelArts

“授权对象类型”：根据需要选择"IAM子用户"、"联邦用户"、"委托用户"、"所有用户" “授权对象”：选择授权对象 “委托选择”：新增委托 “权限配置”：普通模式，选中弹性文件服务(SFSTurbo)下的"sfsturbo:shares:addShareNic"、"sfsturbo:shares:delete

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
msprobe梯度监控 - AI开发平台ModelArts

将模型权重的梯度数据导出。这种功能可以将模型权重的梯度值以统计量的形式采集出来，用以分析问题，例如检测确定性问题，使用训练状态监控工具监控NPU训练过程中的确定性计算问题。将两份梯度数据进行相似度对比。在有标杆问题中，可以确认训练过程中精度问题出现的Step，以及抓取反向过程中的问题。使用步骤如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
使用Msprobe工具分析偏差 - AI开发平台ModelArts

ed等自动化方式固定，先通过切换CPU侧计算初始化之后再切回device侧。在train.py中做如下图第215行代码修改。重新训练Dump比对分析后续计算是否存在偏差。比对之后发现：Tensor.__mul__.2在forward计算阶段的第一个input存在偏差。追溯代码

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 精度对齐
查询服务详情 - AI开发平台ModelArts

additional_properties Map<String,String> 服务附加属性。 pool_name String 在线/批量服务使用的AI专属资源池弹性集群的资源池ID，仅当配置专属资源池时返回。 load_balancer_policy String 在线同步服务设置elb后端转发策略详

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
功能总览 - AI开发平台ModelArts
功能总览 - AI开发平台ModelArts

资源池使用ModelArts进行AI开发时，需要使用一些计算资源进行训练或推理。为满足不同开发业务，ModelArts提供了按需付费的公共资源池和无需排队的专属资源池。 OBS 2.0支持公共资源池公共资源池提供公共的大规模计算集群，根据用户作业参数分配使用，资源按作业隔离。按资

 帮助中心 > AI开发平台ModelArts > 功能总览
使用Notebook进行代码调试 - AI开发平台ModelArts

规格：选择8卡GPU规格，“run.sh”文件中默认MA_NUM_GPUS为8卡，因此选择notebook规格时需要与MA_NUM_GPUS默认值相同。存储配置：选择“弹性文件服务SFS”作为存储位置。子目录挂载可不填写，如果需挂载SFS指定目录，则在子目录挂载处填写具体路径。如果需要通过VS Code连接

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

定义镜像的部署参数。计算规格选择 - 按需选择计算规格。单击“选择”，在弹窗中选择资源规格并设置运行时长控制，单击“确定”。在“所在区”选择计算规格所在的区域。默认显示全部区域的计算规格。选择计算规格不可用的资源会置灰。右侧“配置信息”区域会显示计算规格的详细数据，AI G

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

训练作业中存在2个代码目录，一个是从OBS上传到ModelArts Standard训练容器中的代码目录OBS_CODE_DIR，一个是后续构建新镜像步骤ECS中构建新镜像（二选一）中镜像的代码目录CODE_DIR。修改代码如图1。图1 修改区分训练作业中2个代码目录使用环境变量SAVE_PA

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

训练作业中存在2个代码目录，一个是从OBS上传到ModelArts Standard训练容器中的代码目录OBS_CODE_DIR，一个是后续构建新镜像步骤ECS中构建新镜像中镜像的代码目录CODE_DIR。修改代码如图1。图1 修改区分训练作业中2个代码目录使用环境变量SAVE_PATH重新覆

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
在Workflow中更新已部署的服务 - AI开发平台ModelArts

wf.AlgorithmParameters(name="save_model_secs", value=wf.Placeholder(name="save_model_secs", placeholder_type=wf.PlaceholderType.INT, default=60

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

SFS Turbo的存储加速实践。表1 不同场景所需服务及购买推荐场景 OBS SFS SWR DEW ModelArts VPC ECS EVS 单机单卡按需购买（并行文件系统） × 免费免费包月购买免费 × 按需购买单机多卡 × 包月购买（HPC型500G）免费

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
连接远端开发环境时，一直处于"Setting up SSH Host xxx: Copying VS Code Server to host with scp"超过10分钟以上，如何解决？ - AI开发平台ModelArts

连接远端开发环境时，一直处于"Setting up SSH Host xxx: Copying VS Code Server to host with scp"超过10分钟以上，如何解决？问题现象原因分析通过查看日志发现本地vscode-scp-done.flag显示成功上传，但远端未接收到。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
查询服务详情 - AI开发平台ModelArts

运行模型需要的环境变量键值对。 instance_count Integer 模型部署的实例数。 scaling Boolean 是否启用弹性伸缩。表3 batch config结构参数参数类型描述 model_id String 模型ID。“model_id”可以通过查

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

IDL中的WebSocket API由W3C标准化。 WebSocket使得客户端和服务器之间的数据交换变得更加简单，允许服务端主动向客户端推送数据。在WebSocket API中，浏览器和服务器只需要完成一次握手，两者之间就可以建立持久性的连接，并进行双向数据传输。前提条件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

**test_kwargs) # 初始化神经网络模型并复制模型到计算设备上 model = Net().to(device) # 定义训练优化器和学习率策略，用于梯度下降计算 optimizer = optim.Adadelta(model.parameters()

帮助中心 > AI开发平台ModelArts > 快速入门
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

|── alpaca_gpt4_data.json # 微调数据文件在ECS服务器中安装obsutil工具，具体命令可参考obsutil工具快速使用，将OBS桶中的数据下载至SFS Turbo中。注意：需要使用用户账

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
在ModelArts的Notebook中使用VS Code如何查看远端日志？ - AI开发平台ModelArts

在ModelArts的Notebook中使用VS Code如何查看远端日志？在VS Code环境中执行Ctrl+Shift+P 搜show logs 选择Remote Server。也可在如下截图的红框处切换至其他的Log 父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
在Notebook上安装配置Grafana - AI开发平台ModelArts

py中，增加以下代码后按ESC退出然后输入:wq保存。 c.ServerProxy.servers = { 'grafana': { 'command': ['/home/ma-user/work/grf/grafana-9.1.6/bin/grafana-server', '--homepath'

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标 > 安装配置Grafana
ModelArts Standard训练作业和模型部署如何收费？ - AI开发平台ModelArts

ModelArts支持将模型按照业务需求部署为服务。训练类型不同，部署后的计费方式不同。将模型部署为服务时，根据数据集大小评估模型的计算节点个数，根据实际编码情况选择计算模式。具体计费方式请参见ModelArts产品价格详情。父主题：计费FAQ

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件在服务器（ModelArts Lite云服务器或者是本地Windows/Linux等服务器）上登录Gallery CLI配置工具后，通过命令“gallery-cli download”可以从AI Gallery仓库下载资源。命令说明登录Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南

总条数： 1047

上一页
1
...
35
36
37
...
53
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

委托授权ModelArts云服务使用SFS Turbo - AI开发平台ModelArts

msprobe梯度监控 - AI开发平台ModelArts

使用Msprobe工具分析偏差 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

功能总览 - AI开发平台ModelArts

使用Notebook进行代码调试 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

在Workflow中更新已部署的服务 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

连接远端开发环境时，一直处于"Setting up SSH Host xxx: Copying VS Code Server to host with scp"超过10分钟以上，如何解决？ - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

在ModelArts的Notebook中使用VS Code如何查看远端日志？ - AI开发平台ModelArts

在Notebook上安装配置Grafana - AI开发平台ModelArts

ModelArts Standard训练作业和模型部署如何收费？ - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线