搜索_华为云

ModelArts训练中不同规格资源“/cache”目录的大小是多少？ - AI开发平台ModelArts

数据，SFS支持扩容。 GPU规格的资源表1 GPU cache目录容量 GPU规格 cache目录容量 GP Vnt1 800G 8*GP Vnt1 3T GP Pnt1 800G CPU规格的资源表2 CPU cache目录容量 CPU规格 cache目录容量 2 核 8GiB

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
更新训练作业参数 - AI开发平台ModelArts

自定义镜像训练作业的时候，此参数为容器环境变量。该样例请参考表4。 spec_id 是 Long 训练作业选择的资源规格ID。请从查询作业资源规格接口获取资源规格ID。 data_url 否 String 训练作业需要的数据集OBS URL。如：“/usr/data/”。不可与

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
查询节点池的节点列表 - AI开发平台ModelArts

creationTimestamp String 创建时间。表7 NodeSpec 参数参数类型描述 flavor String 节点规格。表8 NodeStatus 参数参数类型描述 phase String 节点当前状态。可选值如下： Available：节点可用 Creating：节点创建中

 帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
查询节点列表 - AI开发平台ModelArts

creationTimestamp String 创建时间。表7 NodeSpec 参数参数类型描述 flavor String 节点规格。表8 NodeStatus 参数参数类型描述 phase String 节点当前状态。可选值如下： Available：节点可用 Creating：节点创建中

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
msprobe API预检 - AI开发平台ModelArts

/dump.json 这里-api_info指定的是步骤2导出的dump.json文件，表示整网计算过程中API的输入输出情况。执行完成run_ut命令之后将输出api_precision_compare_result_{timestamp}.csv和 api_precision_comp

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

install.sh # 环境部署脚本 |——src/ # 启动命令行封装脚本，在install.sh里面自动构建 |──llm_inference # 推理代码包 |──llm_tools

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
使用GPTQ量化 - AI开发平台ModelArts

"bits": 8, "group_size": -1, "desc_act": false } 2. 启动vLLM，如果是使用命令行的方式，指定--quantization "gptq"参数，其他参数请参考Step3 创建服务启动脚本 python -m vllm.entrypoints

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

"bits": 8, "group_size": -1, "desc_act": false } 2. 启动vLLM，如果是使用命令行的方式，指定--quantization "gptq"参数，其他参数请参考Step6 启动推理服务 python -m vllm.entrypoints

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

"bits": 8, "group_size": -1, "desc_act": false } 2. 启动vLLM，如果是使用命令行的方式，指定--quantization "gptq"参数，其他参数请参考步骤六启动推理服务 python -m vllm.entrypoints

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

"bits": 8, "group_size": -1, "desc_act": false } 2. 启动vLLM，如果是使用命令行的方式，指定--quantization "gptq"参数，其他参数请参考Step3 创建服务启动脚本 python -m vllm.entrypoints

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

"bits": 8, "group_size": -1, "desc_act": false } 2. 启动vLLM，如果是使用命令行的方式，指定--quantization "gptq"参数，其他参数请参考步骤六启动推理服务 python -m vllm.entrypoints

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

"bits": 8, "group_size": -1, "desc_act": false } 2. 启动vLLM，如果是使用命令行的方式，指定--quantization "gptq"参数，其他参数请参考Step3 启动推理服务 python -m vllm.entrypoints

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
删除资源池 - AI开发平台ModelArts

objects 资源池中的资源规格信列表，包括资源规格和相应规格的资源数量。 network network object 资源池网络参数。物理资源池时必选。 jobFlavors Array of strings 资源池支持的作业规格信息列表，内容为作业规格名称。 driver PoolDriver

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询资源池列表 - AI开发平台ModelArts

objects 资源池中的资源规格信列表，包括资源规格和相应规格的资源数量。 network network object 资源池网络参数。物理资源池时必选。 jobFlavors Array of strings 资源池支持的作业规格信息列表，内容为作业规格名称。 driver PoolDriver

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

服务名称：填入步骤1中获取的“终端节点服务地址”。单击右侧验证按钮，系统将为您自动填入虚拟私有云、子网和节点IP。创建内网域名：保持默认值。确认规格无误后，单击“立即购买”后提交任务，界面自动跳转至终端节点列表页面。创建DNS内网域名新创建的在线服务对接的是专享版APIG，需要使用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
使用GPTQ量化 - AI开发平台ModelArts

"bits": 8, "group_size": -1, "desc_act": false } 2. 启动vLLM，如果是使用命令行的方式，指定--quantization "gptq"参数，其他参数请参考Step3 创建服务启动脚本 python -m vllm.entrypoints

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
查询资源池 - AI开发平台ModelArts

objects 资源池中的资源规格信列表，包括资源规格和相应规格的资源数量。 network network object 资源池网络参数。物理资源池时必选。 jobFlavors Array of strings 资源池支持的作业规格信息列表，内容为作业规格名称。 driver PoolDriver

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

server的keep-alive的参数值，尽量避免由服务端发起关闭连接。如您使用的Gunicorn来作为web server，可以通过Gunicorn命令的--keep-alive参数来设置该值。其他方式导入的模型，服务内部已做处理。协议错误请求报错：{"error_code":"ModelArts

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

则放在新的conversation_id下。 Human: 数据集中每条数据的输入。 assistant: 数据集中每条数据的输出。运行命令示例： 1. python ExcelToJson.py --user_id=001 --excel_addr=xxx.xlsx(.csv)

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
使用GPTQ量化 - AI开发平台ModelArts

"bits": 8, "group_size": -1, "desc_act": false } 2. 启动vLLM，如果是使用命令行的方式，指定--quantization "gptq"参数，其他参数请参考Step3 启动推理服务 python -m vllm.entrypoints

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化

总条数： 1262

上一页
1
...
42
43
44
...
64
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts训练中不同规格资源“/cache”目录的大小是多少？ - AI开发平台ModelArts

更新训练作业参数 - AI开发平台ModelArts

查询节点池的节点列表 - AI开发平台ModelArts

查询节点列表 - AI开发平台ModelArts

msprobe API预检 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

删除资源池 - AI开发平台ModelArts

查询资源池列表 - AI开发平台ModelArts

通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

查询资源池 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线