检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
启动。 stopped:stopped为停止节点实例,只有处于running状态的节点实例支持停止。 响应参数 无 请求示例 PUT https://{endpoint}/v1/{project_id}/services/{service_id}/nodes/{node_id}/status
调用成功时无此字段。 请求示例 如下以更新作业ID为10的作业描述为“This is a ModelArts job”为例。 PUT https://endpoint/v1/{project_id}/visualization-jobs/10 { "job_desc": "This
String 工作空间ID。未创建工作空间时默认值为“0”,存在创建并使用的工作空间,以实际取值为准。 请求示例 查询标注团队详情 GET https://{endpoint}/v2/{project_id}/workforces/{workforce_id} 响应示例 状态码: 200
如下查询training_job_id为04f679b17380d32a2f32c00335c4b5ba作业的超参敏感度分析结果。 GET https://endpoint/v2/{project_id}/training-jobs/04f679b17380d32a2f32c00335
job id is 6ABxxx [2022/08/12 00:03:25 GMT+0800][INFO]Request url is https://modelarts.xxx.xxx.com/v1/88exxxta/models?model_name=query_vec_recall_model
and does not support subscribing to your own model. 账户ID相同,不支持订阅自己的模型 用户不能订阅自己的发布的模型,换个账号进行订阅。 400 ModelArts.3074 Unable to delete subscribed
POST https://{endpoint}/v1/{project_id}/models { "model_name" : "mnist", "model_version" : "1.0.0", "source_location" : "https://models
hostPath: path: ${node-path} 参数说明: ${container_name}:容器名称,此处可以自己定义一个容器名称,例如ascend-vllm。 ${image_name}:Step3 制作推理镜像构建的推理镜像名称。 ${node-p
hostPath: path: ${node-path} 参数说明: ${container_name}:容器名称,此处可以自己定义一个容器名称,例如ascend-vllm。 ${image_name}:Step3 制作推理镜像构建的推理镜像名称。 ${node-p
议先停止当前Notebook实例,然后重新启动。 报错504 如果报此错误时,请提工单或拨打热线电话协助解决。提工单和热线电话请参见:https://www.huaweicloud.com/service/contact.html。 报错500 Notebook JupyterL
task_id String 同步任务ID。 total_sample_count Long 总样本数量。 请求示例 获取数据集同步状态 GET https://{endpoint}/v2/{project_id}/datasets/{dataset_id}/sync-data/status
创建训练作业标签。设置TMS标签的key/value为“111”和“k3”,TMS标签的key/value为"k3"和“v2”。 POST https://endpoint/v2/{project_id }/trainJob/{training_job_id}/tags/create
工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”,存在创建并使用的工作空间,以实际取值为准。 请求示例 DELETE https://{endpoint}/v1/{project_id}/workspaces/ccd05d1a553b4e188ea878e7dcb85e47
&& \ pip install ipykernel==6.7.0 --trusted-host https://repo.huaweicloud.com -i https://repo.huaweicloud.com/repository/pypi/simple && \
管理训练容器环境变量 什么是环境变量 本章节展示了训练容器环境中预置的环境变量,方便用户查看,主要包括以下类型。 路径相关环境变量 分布式训练作业环境变量 NCCL(Nvidia Collective multi-GPU Communication Library)环境变量 OBS环境变量
idle:空闲停止。 update_at Long 实例最后更新(不包括探活心跳)的时间,UTC毫秒。 请求示例 延长运行中的Notebook时长。 https://{endpoint}/v1/{project_id}/notebooks/{id}/lease { "duration" :
如果是触发了欧拉操作系统的限制,有如下建议措施。 分目录处理,减少单个目录文件量。 减慢创建文件的速度。 关闭ext4文件系统的dir_index属性,具体可参考:https://access.redhat.com/solutions/29894,(可能会影响文件检索性能)。 建议与总结 在创建训练作业前,推
json.json)按照下面的数据存放目录要求放置。 指令微调样例数据集alpaca_gpt4_data.json.json的下载链接:https://huggingface.co/datasets/QingyiSi/Alpaca-CoT/blob/main/alpacaGPT4/alpaca_gpt4_data
json.json)按照下面的数据存放目录要求放置。 指令微调样例数据集alpaca_gpt4_data.json.json的下载链接:https://huggingface.co/datasets/QingyiSi/Alpaca-CoT/blob/main/alpacaGPT4/alpaca_gpt4_data
如果需要多个全量实例,每个全量都需要启动一个容器,只挂载对应的NPU --name ${container_name}:容器名称,进入容器时会用到,此处可以自己定义一个容器名称。 {image_id} 为docker镜像的ID,即第四步中生成的新镜像id,在宿主机上可通过docker images查询得到。