检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
=0x91, [the model stream execute failed] 原因分析 出现该问题的可能原因如下: 数据读入的速度跟不上模型迭代的速度。
上传OBS文件到JupyterLab 在Notebook的JupyterLab中,支持将OBS中的文件下载到Notebook。注意:文件大小不能超过10GB,否则会上传失败。 通过JupyterLab打开一个运行中的Notebook。 单击JupyterLab窗口上方导航栏的ModelArts
下载华为侧插件代码包AscendCloud-AIGC-6.3.907-xxx.zip文件,获取路径参见表1。本案例使用的是解压到子目录aigc_train->torch_npu->koyha_ss的所有文件,将koyha_ss整个目录上传到宿主机上。
GET https://endpoint/v1/{project_id}/training-jobs/10/versions/10/aom-log?
VS Code连接远端Notebook时报错“XHR failed” 问题现象 VS Code连接远端Notebook时报错“XHR failed”。 原因分析 可能是所在环境的网络有问题,无法自动下载VS Code Server,请手动安装。
API/SDK 安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” ModelArts SDK下载文件目标路径设置为文件名,部署服务时报错 调用API创建训练作业,训练作业异常 用户执行huaweicloud.com
如何调用API 构造请求 认证鉴权 返回结果
节点池管理 查询节点池列表 创建节点池 查询指定节点池详情 更新节点池 删除节点池 查询节点池的节点列表
mode String 搜索方向。 max指定时表示指标值越大越好; min指定时表示指标值越小越好。 regex String 指标正则表达式。 表17 search_params 参数 参数类型 描述 name String 超参名称。
请求示例 GET https://endpoint/v2/{project_id }/trainJob/{training_job_id}/tags 响应示例 状态码:200 查询成功。
安全 责任共担 资产识别与管理 身份认证与访问控制 数据保护技术 审计与日志 服务韧性 监控安全风险 故障恢复 更新管理 认证证书 安全边界
假设您计划购买按需计费的专属资源池,可在ModelArts控制台“AI专属资源池 > 弹性集群Cluster > Standard资源池”中,单击“购买AI专属集群”,选择“计费模式”为“按需计费”,在页面左下角查看所需费用。费用指的是资源池根据所选配置计算的费用。
GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML 训练速度突然下降以及执行nvidia-smi卡顿如何解决?
准备预测分析数据 使用ModelArts自动学习构建预测分析模型时,您需要将数据上传至对象存储服务(OBS)中。OBS桶需要与ModelArts在同一区域,例如OBS桶区域为“北京四”时,必须保证ModelArts管理控制台区域也在“北京四”区域,否则会导致无法获取到相关数据。 数据集要求
ModelArts提供了包年/包月的AI专属资源池,包括Standard资源池、弹性集群Lite Cluster资源池和弹性节点Server资源池 假设您计划购买包年/包月的Standard专属资源池,可在ModelArts控制台“AI专属资源池 > 弹性集群Cluster”页面中的
镜像保存时报错“The container size (xG) is greater than the threshold (25G)”如何解决?
ma-job ModelArts job submission and query job details. dli-job DLI spark job submission and query job details.
否 Any placeholder_format 支持的format格式数据,当前支持obs、flavor、train_flavor、swr、pacific。 否 str delay 参数是否运行时输入,默认为“False”,在工作流启动运行前进行配置。
弹性集群Cluster:在ModelArts控制台“AI专属资源池 > 弹性集群Cluster”页面中的Standard资源池或Lite资源池页签中,在包年包月资源池名称的右侧,进入详情页,单击,选择“续费”,按照页面提示跳转到费用中心进行续费操作。
cd /home/ma-user/diffusers sh diffusers_sdxl_controlnet_train.sh 训练执行成功如下图所示。