检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
gpu": "auto", "gradient_accumulation_steps": "auto", "gradient_clipping": "auto", "zero_allow_untested_optimizer": true, "fp16": {
8b8d018a", "step_name" : "condition_step", "step_title" : "skip training", "status" : "wait_inputs" }, { "time" : "2022-10-20T15:01:42
clear_hard_property 否 Boolean 是否清空难例属性。可选值如下: true:清空难例属性(默认值) false:不清空难例属性 description 否 String 版本描述信息,默认为空,长度为0-256位,不能包含!<>=&"'特殊字符。 export_images 否 Boolean
annotations object 资源池的注释信息。 表5 annotations 参数 是否必选 参数类型 描述 os.modelarts/description 否 String 资源池描述信息,用于说明资源池用于某种指定场景。不能包含特殊字符!<>=&"'。 os.modelarts/order
训练作业启动命令中输入: cd /home/ma-user/work/llm_train/AscendSpeed; sh ./scripts/install.sh; sh ./scripts/llama2/0_pl_lora_13b.sh 选择用户自己的专属资源池,以及规格与节点数。防止训练过程中出
训练作业启动命令中输入: cd /home/ma-user/work/llm_train/AscendSpeed; sh ./scripts/install.sh; sh ./scripts/llama2/0_pl_pretrain_13b.sh 选择用户自己的专属资源池,以及规格与节点数。防止训练
团队标注任务ID。 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 dataset_id 否 String 数据集ID。 description 否 String 团队标注任务描述,长度为0-256位,不能包含^!<>=&"'特殊字符。 task_id 否 String 团队标注任务ID。
profiler._ExperimentalConfig aic_metrics=torch_npu.profiler.AiCMetrics.PipeUtilization profiler_level=torch_npu.profiler.ProfilerLevel.Level1 d
–json-key标志来选择用于训练的列。 { 'id': '1', 'url': 'https://simple.wikipedia.org/wiki/April', 'title': 'April', 'text': 'April is the
响应参数如表2所示。 表2 响应参数 参数 参数类型 说明 id String 实例ID。 name String 实例名称。 description String 实例描述。 status String 实例状态。 creation_timestamp String 实例的创建时间。
系统会自动生成一个名称,您可以根据业务需求重新命名,命名规则如下: 支持1~64位字符。 并包含大小写字母、数字、中划线(-)或下划线(_)。 Job Description 训练作业的简要描述。 Algorithm Source 训练算法来源,分为“常用框架”和“自定义镜像”两种,二者选一项即可。 常
--name TEXT Job name. --description TEXT Job description. --image-url TEXT Full swr custom
训练作业启动命令中输入: cd /home/ma-user/work/llm_train/AscendSpeed; sh ./scripts/install.sh; sh ./scripts/llama2/0_pl_sft_13b.sh 选择用户自己的专属资源池,以及规格与节点数。防止训练过程中出现
vscode-server/bin/ 参数说明: - IdentityFile:本地密钥路径 - User:用户名,例如:ma-user - HostName:IP地址 - Port:端口号 vscode-server相关问题也可以使用上述的解决方法。 父主题: VS Code连接开发环境失败故障处理
表4 instances字段响应参数说明 参数 参数类型 说明 id String 实例ID。 name String 实例名称。 description String 实例描述。 status String 实例状态。 creation_timestamp String 实例的创建时间。
自定义节点名称前缀。 表6 PoolAnnotationsCreation 参数 是否必选 参数类型 描述 os.modelarts/description 否 String 资源池的描述信息。 os.modelarts/billing.mode 否 String 计费模式,可选值如下:
工具使用包含以下三步:dump、run_ut以及api_precision_compare。基本步骤如下: 通过pip安装msprobe工具。 # shell pip install mindstudio-probe 获取NPU和GPU的dump数据。 PyTorch训练脚本插入dump接口方式如下:
Ratio(双千分之五)这几种评价指标,工具通过阈值过滤筛选出不达标API的输入输出提示用户进行重点关注。使用步骤如下: 通过pip安装msprobe工具。 # shell pip install mindstudio-probe 获取NPU和标杆的dump数据。 PyTorch训练脚本插入dump接口方式如下:
ServiceOutput或者ServiceOutput的列表 title title信息,主要用于前端的名称展示 否 str description 服务部署节点的描述信息 否 str policy 节点执行的policy 否 StepPolicy depend_steps 依赖的节点列表
gpu": "auto", "gradient_accumulation_steps": "auto", "gradient_clipping": "auto", "zero_allow_untested_optimizer": true, "fp16": {