检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
list_tasks_resp = dataset.list_import_tasks() print(list_tasks_resp) # 打印导入任务列表 参数说明 无。 父主题: 导入任务管理
dataset_id) version_list = dataset.list_versions() print(version_list) # 打印数据集的版本列表 参数说明 无。 父主题: 数据集版本管理
list_tasks_resp = dataset.list_export_tasks() print(list_tasks_resp) # 打印导出任务列表 参数说明 无。 父主题: 导出任务管理
cn-southwest-2.myhuaweicloud.com/GPOUP_NAME/llama_ascend_pytorch_2_1:0.5.3 打印如下信息,表示构建镜像成功。 图4 成功构建镜像 Step7 上传镜像 在ECS服务器中输入Step4登录指令后,使用下列示例命令将Standard镜像上传至SWR。
pod已全部启动,则状态为:Running。 kubectl get pod -A -o wide 若查看启动作业日志信息,可通过以下命令打印正在启动的日志信息。其中${pod_name}为上述pod信息中的NAME,例如vcjob-main-0。 kubectl logs -f
export DETAIL_TIME_LOG=1 #打开打印详细日志 export RAY_DEDUP_LOGS=0 #打开打印详细日志 unset DETAIL_TIME_LOG #关闭打印详细日志 配置后重启服务生效。 启动服务与请求。此处提供vLLM
减排序,默认是“desc”。 workspace_id 否 String 工作空间ID,默认为“0”。 表2 get_model_list打印参数说明 参数 参数类型 描述 total_count Integer 不分页的情况下,符合查询条件的总模型数量。 count Integer
pod已全部启动,则状态为:Running。 kubectl get pod -A -o wide 若查看启动作业日志信息,可通过以下命令打印正在启动的日志信息。其中${pod_name}为上述pod信息中的NAME,例如vcjob-main-0。 kubectl logs -f
pod已全部启动,则状态为:Running。 kubectl get pod -A -o wide 若查看启动作业日志信息,可通过以下命令打印正在启动的日志信息。其中${pod_name}为上述pod信息中的NAME,例如vcjob-main-0。 kubectl logs -f
get_sample_info(sample_id="2551e78974aed9b60156d8376232f6bd") print(sample_info) # 打印样本的详细信息 参数说明 表1 请求参数 参数 是否必选 参数类型 描述 sample_id 是 String 样本ID。 父主题: 样本管理
get_import_task_info(task_id="r4R52nJ4VJKcivuioCU") print(task_info) # 打印导入任务的详细信息 参数说明 表1 请求参数 参数 是否必选 参数类型 描述 task_id 是 String 导入任务的任务ID。 父主题:
查看日志信息进行定位分析。 多数场景下的问题可以通过日志报错信息直接定位。如果日志的信息不能定位问题,您可以通过设置环境变量调整日志等级,打印更多调试日志。 关于如何对MindSpore Lite遇到的问题进行定位与解决,请参见MindSpore Lite官网提供的问题定位指南。
VAE_V1_2/epochX-global_step1000/model,X为按顺序自动生成的数字) 具体位置打印在日志中,注意:输出文件夹是自动生成,只有日志中打印的位置才是保存权重的位置。 图3 VAE第一阶段训练日志 第二阶段训练 export pretrain_path="上阶段训练的权重,例如
get_version_info(version_id="cSPuXPgnYp7ObRs6LaR") print(version_info) # 打印数据集版本的详情 参数说明 表1 请求参数 参数 是否必选 参数类型 描述 version_id 是 String 数据集版本ID。 父主题:
"true"} 状态码 表1 状态码 状态码 编码 状态码说明 200 OK 请求成功 日志文件输出 为保证日志内容可以正常显示,日志信息需要打印到标准输出。 镜像启动入口 如果需要部署批量服务,镜像的启动入口文件需要为“/home/run.sh”,采用CMD设置默认启动路径,例如Dockerfile配置如下:
进行配置执行(在管理控制台Workflow页面配置)。 执行如下命令: workflow.release() 上述命令执行完成后,如果日志打印显示发布成功,则可前往ModelArts的Workflow页面中查看新发布的工作流,进入Workflow详情,单击“配置”进行参数配置。工
aoe_mode="subgraph tuning, operator tuning" op_select_impl_mode=high_performance 配置打印ASCEND日志。其中,ASCEND_GLOBAL_LOG_LEVEL的值对应的日志级别分别为:0-debug、1-info、2-warning、3-error。
等待模型载入 执行训练启动命令后,等待模型载入,当出现“training”关键字时,表示开始训练。训练过程中,训练日志会在最后的Rank节点打印。 图1 等待模型载入 更多查看训练日志和性能操作,请参考查看日志和性能章节。 父主题: 主流开源大模型基于Lite Server适配PyTorch
he Tomcat服务后,默认服务端口为8080。 NetBIOS 137、138、139 NetBIOS协议常被用于Windows文件、打印机共享和Samba。 137、138:UDP端口,通过网上邻居传输文件时使用的端口。 139:通过这个端口进入的连接试图获得NetBIOS/SMB服务。
如果模型较大,并且较频繁地进行保存,就会影响GPU/NPU利用率。同理,其他非GPU/NPU操作尽量不要阻塞训练主进程太多的时间,如日志打印,保存训练指标信息等。 父主题: 管理模型训练作业