检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Shell”页签,登录训练容器。 连接成功后,Cloud Shell界面提示如下。 图1 Cloud Shell界面 当作业处于非运行状态或权限不足时会导致无法使用Cloud Shell,请根据提示定位原因即可。 图2 报错提示 部分用户登录Cloud Shell界面时,可能会出现路径显示异常情况,此时在Cloud
表1 SDXL模型参数及其含义 参数名称 说明 是否必选 默认值 prompt 提示词,根据提示词生成含有对应内容的图像 是 无 negative_prompt 反向提示词,图像生成过程中应避免的提示 否 无 num_inference_steps 推理步骤数,控制推理的步数 否
响应Body参数 参数 参数类型 描述 dataset_id String 数据集ID。 error_code String 错误码。 error_msg String 错误信息。 import_task_id String 导入任务ID。 请求示例 创建图像分类的数据集 { "workspace_id"
响应Body参数 参数 参数类型 描述 create_time Long 任务创建时间。 error_code String 错误码。 error_msg String 错误信息。 export_format Integer 导出的目录格式。可选值如下: 1:树状结构。如:rabbits/1
共享池和专属池的区别是什么? 如何通过ssh登录专属资源池节点? 训练任务的排队逻辑是什么? 专属资源池下的在线服务停止后,启动新的在线服务,提示资源不足 不同实例的资源池安装的cuda和驱动版本号分别是什么? 算法运行时需要依赖鉴权服务,公共资源池是否支持两者打通网络? 创建失败的
y > 我的资产 > 数据”,进入“我的数据”。 在“我的发布”页签,查看发布异常的数据集。 图5 查看发布异常的数据集 根据异常状态的错误提示修改源数据后,单击目标数据集右侧的“重试”重新发布数据集。 删除发布的数据集 当您需要删除发布在AI Gallery中的数据集时,可以执行如下步骤进行删除。
x_out_len建议设置小一些,比如16。在运行human_eval等生成式回答(生成式回答是对整体进行评测,少一个字符就可能会导致判断错误)时,max_out_len设置建议长一些,比如512,至少包含第一个回答的全部字段。 batch_size:输入的batch_size大小,不影响精度,只影响得到结果速度。
x_out_len建议设置小一些,比如16。在运行human_eval等生成式回答(生成式回答是对整体进行评测,少一个字符就可能会导致判断错误)时,max_out_len设置建议长一些,比如512,至少包含第一个回答的全部字段。 batch_size:输入的batch_size大小,不影响精度,只影响得到结果速度。
>”,进入实践首页。 在实践列表选择您感兴趣的实践活动。 报名实践活动: 方式一:单击实践活动简介下的“立即报名”,进入邀请函页面,根据提示填写个人信息,单击“报名”。 图2 活动邀请函 方式二:单击实践活动标题进入活动详情页面,在详情页面单击“立即报名”,进入邀请函页面报名。
pretrained目录需手动创建。 https://huggingface.co/OpenGVLab/InternVL2-8B/tree/main https://huggingface.co/OpenGVLab/InternVL2-26B/tree/main https://huggingface
StrictHostKeyChecking no UserKnownHostsFile=/dev/null ForwardAgent yes 提示:增加参数后SSH登录时会忽略known_hosts文件,有安全风险。 父主题: VS Code连接开发环境失败常见问题
在每个实例节点上运行此命令可以看到NPU卡状态 npu-smi info -l | grep Total # 在每个实例节点上运行此命令可以看到总卡数 如出现错误,可能是机器上的NPU设备没有正常安装,或者NPU镜像被其他容器挂载。请先正常安装固件和驱动,或释放被挂载的NPU。 检查docker是否安装。
[耗时: 秒] 预检完成 [worker-0] [耗时: 秒] 检查失败。发现异常: [worker-0] [耗时: 秒] 检查失败。发现错误: [worker-0] 训练代码下载中 [worker-0] [耗时: 秒] 训练代码下载完成 [worker-0] [耗时: 秒] 训练代码下载失败,失败原因:
} 状态码 状态码 描述 200 OK 401 Unauthorized 403 Forbidden 404 Not Found 错误码 请参见错误码。 父主题: 数据管理(旧版)
} 状态码 状态码 描述 200 OK 401 Unauthorized 403 Forbidden 404 Not Found 错误码 请参见错误码。 父主题: 数据管理(旧版)
训练作业状态。 说明: 如果昇腾以及MindSpore框架的训练作业运行失败,您可以在作业状态的提示信息中,单击昇腾论坛进行发帖提问或者搜索问题。 非昇腾规格的作业运行失败后,您可以在作业状态的提示信息中,单击ModelArts开发者论坛进行发帖或者搜索已有问题。 “创建时间” 记录训练作业创建时间。
StrictHostKeyChecking no UserKnownHostsFile=/dev/null ForwardAgent yes 提示:增加参数后SSH登录时会忽略known_hosts文件,有安全风险。 父主题: VS Code连接开发环境失败故障处理
用户名:输入DWS集群管理员用户的用户名。 密码:输入DWS集群管理员用户的密码。 从DWS导入数据,需要借助DLI的功能,如果用户没有访问DLI服务的权限,需根据页面提示创建DLI的委托。 父主题: 导入数据到ModelArts数据集
400 表99 响应Body参数 参数 参数类型 描述 error_msg String 错误信息。 error_code String 错误码。 error_solution String 错误解决建议。 请求示例 创建免费规格的训练作业。设置作业名称为“TestModelArtsJob”,描述为“This
任务创建时间。 elapsed_time Long 执行时间。 error_code String 错误码。 error_detail String 错误详情。 error_msg String 错误信息。 message String 任务的运行信息。 progress Float 任务当前进度百分比。