搜索_华为云

JupyterLab中文件保存失败，如何解决？ - AI开发平台ModelArts

浏览器安装了第三方插件proxy进行了拦截，导致无法进行保存。在Notebook中的运行文件超过指定大小就会提示此报错。 jupyter页面打开时间太长。网络环境原因，是否有连接网络代理。解决方法关掉插件然后重新保存。减少文件大小。重新打开jupyter页面。请检查网络。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
下载JupyterLab文件到本地 - AI开发平台ModelArts

rLab中下载大于100MB的文件到本地。从JupyterLab中下载不大于100MB的文件至本地在JupyterLab文件列表中，选择需要下载的文件，单击右键，在操作菜单中选择“Download”下载至本地。下载的目的路径，为您本地浏览器设置的下载目录。图1 下载文件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

各个模型深度学习训练加速框架的选择 LlamaFactory框架使用两种训练框架： DeepSpeed和Accelerate都是针对深度学习训练加速的工具，但是它们的实现方式和应用场景有所不同。 DeepSpeed是一种深度学习加速框架，主要针对大规模模型和大规模数据集的训练。DeepSp

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
打开Notebook实例提示token不存在或者token丢失如何处理？ - AI开发平台ModelArts

打开Notebook实例提示token不存在或者token丢失如何处理？问题现象把已打开的Notebook url发送给他人使用，他人无法打开，报错“……lost token or incorrect token……”。原因分析原因是由于其他人没有此账号的令牌导致。解决方案

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
各模型支持的最小卡数和最大序列 - AI开发平台ModelArts

下推荐的最大max-model-len长度，不代表最佳性能。以llama2-13b为例，NPU卡显存为32GB时，至少需要2张卡运行推理业务，2张卡运行的情况下，推荐的最大序列max-model-len长度最大是16K，此处的单位K是1024，即16*1024。测试方法：gp

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 附录
使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

此处实际创建的组织名称。单击右上角“登录指令”，获取登录访问指令。以root用户登录ECS环境，输入登录指令。图1 在ECS中执行登录指令登录SWR后，使用docker tag命令给上传镜像打标签。下面命令中的组织名称deep-learning，请替换为a.登录容器镜像服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

= pd.read_csv(ff, **param) 必现的问题，使用本地Pycharm远程连接Notebook调试。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
创建Notebook文件后，右上角的Kernel状态为“No Kernel”如何处理？ - AI开发平台ModelArts

eway”开头的最新日志文件，搜索“Starting kernel”附近的日志。如果看到如下类似的堆栈，可看到是因为用户工作目录下的“code.py”和创建kernel依赖的import code文件名冲突：重命名当前工作目录下和创建kernel依赖的库文件冲突的文件名称。常见容易冲突的文件：code

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
停止计费 - AI开发平台ModelArts
停止计费 - AI开发平台ModelArts

对于Notebook，可使用资源ID查找资源。具体方法如下：使用公共资源池创建的Notebook实例，通过此方式删除实例后，即可停止计算资源计费。使用专属资源池创建的Notebook实例，需删除对应的专属资源池。删除后，即可停止计算资源计费。在运行Notebook实例时，如果使用了存储资源，例如

 帮助中心 > AI开发平台ModelArts > 计费说明
从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

下面的命令中涉及到组织名称“deep-learning”也请替换为自定义的值。单击右上角“登录指令”，获取登录访问指令，本文选择复制临时登录指令。以root用户登录本地环境，输入复制的SWR临时登录指令。上传镜像至容器镜像服务镜像仓库。使用docker tag命令给上传镜像打标签。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

为自定义的值。选择左侧导航栏的“总览”，单击页面右上角的“登录指令”，在弹出的页面中单击复制登录指令。此处生成的登录指令有效期为24小时，如果需要长期有效的登录指令，请参见获取长期有效登录指令。获取了长期有效的登录指令后，在有效期内的临时登录指令仍然可以使用。登录指令末尾的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
训练的数据集预处理说明 - AI开发平台ModelArts

tokenizer的存放路径，与HF权重存放在一个文件夹下。 --seq-length：要处理的最大seq length。 --workers：设置数据处理时，要执行的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
在VS Code中上传下载文件 - AI开发平台ModelArts

SDK上传本地文件至OBS，详情请参考文件传输进行OBS传输操作。上传OBS文件到Notebook。在远程连接VS Code的Terminal中使用ModelArts SDK上传OBS文件到Notebook的操作示例如下：图1 远程连接VS Code环境开启Terminal #手动source进入开发环境

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
推理性能测试 - AI开发平台ModelArts

工单设置请求超时时间。 benchmark方法介绍性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
云上迁移适配故障 - AI开发平台ModelArts

云上迁移适配故障无法导入模块训练作业日志中提示“No module named .*” 如何安装第三方包，安装报错的处理方法下载代码目录失败训练作业日志中提示“No such file or directory” 训练过程中无法找到so文件 ModelArts训练作业无法解析参数，日志报错

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
部署文本分类服务 - AI开发平台ModelArts

在服务部署页面，选择模型部署使用的资源规格。模型来源：默认为生成的模型。选择模型版本：自动匹配当前使用的模型版本，支持选择版本。资源池：默认公共资源池。分流：默认为100，输入值必须是0-100之间。计算节点规格：请根据界面显示的列表，选择可用的规格，置灰的规格表示当前环境无法使用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现文本分类
保存镜像时报错“too many layers in your image”如何解决？ - AI开发平台ModelArts

layers in your image”。原因分析用户创建Notebook时所选用的镜像是经过多次保存的自定义镜像或用户自行注册的镜像，基于该镜像所创建的Notebook已经无法再执行镜像保存的操作了。解决方法使用公共镜像或其他的自定义镜像来创建Notebook，完成镜像保存操作。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
删除工作空间 - AI开发平台ModelArts

描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workspace_id 是 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。请求参数表2 请求Header参数

 帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
自动学习训练作业失败 - AI开发平台ModelArts

体检测等类型，可在自动学习的数据标注页面，单击“同步数据源”，将OBS中的数据重新同步至ModelArts中。检查OBS的访问权限如果OBS桶的访问权限设置无法满足训练要求时，将会出现训练失败。请排查如下几个OBS的权限设置。当前账号具备OBS桶的读写权限（桶ACLs）进

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 模型训练
使用python3.6-torch1.4版本镜像环境安装MMCV报错 - AI开发平台ModelArts

Please install mmcv>=1.3.1, <=1.5.0。原因分析 MMCV的依赖与PyTorch版本不匹配。处理方法可参考链接的内容，根据PyTorch和CUDA版本安装对应版本的MMCV。父主题：预置算法运行故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障

总条数： 2362

上一页
1
...
48
49
50
...
119
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

JupyterLab中文件保存失败，如何解决？ - AI开发平台ModelArts

下载JupyterLab文件到本地 - AI开发平台ModelArts

各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

打开Notebook实例提示token不存在或者token丢失如何处理？ - AI开发平台ModelArts

各模型支持的最小卡数和最大序列 - AI开发平台ModelArts

使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

创建Notebook文件后，右上角的Kernel状态为“No Kernel”如何处理？ - AI开发平台ModelArts

停止计费 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

在VS Code中上传下载文件 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

云上迁移适配故障 - AI开发平台ModelArts

部署文本分类服务 - AI开发平台ModelArts

保存镜像时报错“too many layers in your image”如何解决？ - AI开发平台ModelArts

删除工作空间 - AI开发平台ModelArts

自动学习训练作业失败 - AI开发平台ModelArts

使用python3.6-torch1.4版本镜像环境安装MMCV报错 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线