检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
复制的文件需要放在Dockerfile同级文件夹或者子目录中,不能放在Dockerfile上层目录。 图2 Dockerfile复制文件路径错误 解决方案 查看用户Dockerfile中的COPY命令中的文件的路径。将要复制的文件放到Dockerfile同级目录或子目录中,如图,Dockerfile在“
配置MobaXterm工具时,没有勾选“SSH keepalive”或专业版MobaXterm工具的“Stop server after”时间设置太短。 解决方案 打开MobaXterm,单击菜单栏“Settings”,如图1 打开“Settings”所示。 图1 打开“Settings” 在打开的“MobaXterm
在ModelArts的Notebook中如何使用pandas库处理OBS桶中的数据? 参考下载OBS文件到Notebook中的指导,将OBS中的数据下载至Notebook本地处理。 参考pandas用户指南处理pandas数据。 父主题: Standard Notebook
形框”标注。针对您提供的数据集,MetaValidation算子支持对图片和xml文件进行数据校验: 表1 图片类数据校验 异常情况 处理方案 图片本身损坏无法解码 过滤掉不能解码的图片 图片通道可能是1通道、2通道,不是常用的3通道 转换图片成RGB三通道 图片格式不在ModelArts支持的格式范围内
为了避免因网络下载不稳定而产生不必要的困扰,建议开发者合理安排下载时间,尽量避开高峰时段。同时,对于一些对下载速度有较高要求的场景,建议提前做好规划,或者考虑使用其他备选方案。 父主题: Standard Notebook
Kernel。 图1 报错Server Connection Error截图 图2 选不到Kernel 原因分析 用户误操作引起的。 解决方案 打开Terminal窗口,执行以下命令启动kernelgateway服务。 API_TYPE=kernel_gateway.jupyter_websocket
code_dir+boot_file:取训练作业的代码目录和启动文件。 tasks Array of TaskResponse objects 异构训练作业的任务列表。 spec SpecResponce object 训练作业规格参数。 endpoints JobEndpointsResp
的public镜像,而这个镜像又被镜像所有者设置成private,导致不可使用,用户需要联系对应的SWR镜像负责人,确认镜像的属性。 解决方案 按照原因分析分别解决。 父主题: Standard镜像相关
Code连接实例时,发现VS Code端的实例目录和云上目录不匹配。 原因分析 实例连接错误,可能是配置文件写的不规范导致连接到别的实例。 解决方案 检查用户.ssh配置文件(路径一般在“C:\Users\{User}\.ssh\config”下),检查每组配置文件是否规范:Host必
若出现AttributeError:'IbisTokenizer' object has no atrribute 'cache_path' 问题。 详细解决方案参考ModelZoo社区。 父主题: DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
${your_image:tag} 在容器中输入如下命令,得到pytorch.tar.gz: # run on container # 基于想要迁移的base环境创建一个名为pytorch的conda环境 conda create --name pytorch --clone base
ssh/config”。 原因分析 文件夹“.ssh”的权限不仅是Windows当前用户拥有,或者当前用户权限不足,故修改权限即可。 解决方案 找到.ssh文件夹。一般位于“C:\Users”,例如“C:\Users\xxx”。 “C:\Users”目录下的文件名必须和Windows登录用户名完全一致。
会自动对Cann软件与Ascend驱动的版本匹配情况进行检查。如果平台发现版本不匹配,则会立即训练失败,避免后续无意义的运行时长。 解决方案 专属资源池的Ascend驱动版本需与训练基础镜像中的Cann软件版本版本匹配。 ModelArts上支持的Ascend驱动版本可以在Mo
申请扩大资源配额 集群所需的ECS实例数、内存大小、CPU核数和EVS硬盘大小等资源会超出华为云默认提供的资源配额,因此需要申请扩大配额。 具体的配额方案请联系客户经理获取。 配额需大于要开通的资源,且在购买开通前完成配额提升,否则会导致资源开通失败。 Step5 购买CCE集群 购买Clu
size %dG is greater than threshold %dG”。 原因分析 Notebook容器当前的大小超过了阈值。 解决方案 需要减少容器大小。Notebook容器的大小分为两部分:镜像大小和容器中新安装文件的大小。因此有两种方法来解决该问题: 减少容器中新安装文件的大小
级服务,授权时“选择授权范围方案”可以选择“指定区域项目资源”,如果授权时指定了区域(如华北-北京4)对应的项目(cn-north-4),则该权限仅对此项目生效;简单的做法是直接选择“所有资源”。 ModelArts也支持企业项目,所以选择授权范围方案时,也可以指定企业项目。具体操作参见《创建用户组并授权》。
ModelArts训练作业为什么存在/work和/ma-user两种超参目录? 如何查看ModelArts训练作业资源占用情况? 如何将在ModelArts中训练好的模型下载或迁移到其他账号?
Decoding特性不能和multi-step同时使用。 离线推理使用Guided Decoding 离线推理,要使用guided-decoding,需要通过SamplingParams类中的GuidedDecodingParams进行配置。 下面是一种离线使用方式示例: from vllm import
ReadOnlyAccess仅限容器镜像服务企业版使用,目前企业版已暂停公测。非企业版用户暂不支持使用此权限。因此需要在此勾选“SWR Admin” 策略。 选择授权范围方案为“所有资源”,单击“确定”。 精细化授权管理 如果您需要进行精细的权限管理,可参考《ModelArts API参考》中的权限策略和授权项。
Decoding特性不能和multi-step同时使用。 离线推理使用Guided Decoding 离线推理,要使用guided-decoding,需要通过SamplingParams类中的GuidedDecodingParams进行配置。 下面是一种离线使用方式示例: from vllm import