搜索_华为云

动态扩充云硬盘EVS容量 - AI开发平台ModelArts

面。选择运行中的Notebook实例，单击实例名称，进入Notebook实例详情页面，单击“扩容”。图2 Notebook实例详情页设置待扩充的存储容量大小，单击“确定”。系统显示“扩容中”，扩容成功后，可以看到扩容后的存储容量。图3 扩容图4 扩容中父主题：管理Notebook实例

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
使用CES监控Lite Server资源 - AI开发平台ModelArts

修改/etc/docker/daemon.json配置文件default-shm-size字段方式二： docker run 命令中使用 --shm-size 参数来设置单个容器的共享内存大小 NPU：RoCE网卡down RoCELinkStatusDown 重要 NPU 卡 %d RoCE Link 状态Down

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
训练作业失败，返回错误码139 - AI开发平台ModelArts

reeturn code: 139 INFO:root:Using MoXing-v1.17.2-c806a92f INFO;root:Using OBS-Python-SDK-3.1.2 原因分析出现该问题的可能原因如下 pip源中的pip包更新了，之前能跑通的代码，在包更新之后产生了不

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
发布模型到AI Gallery - AI开发平台ModelArts

在模型详情页，单击右侧“发布”，在发布模型页面编辑发布信息后，单击“发布”。表1 发布模型的参数说明参数名称说明中文名称模型发布后显示的名称，在创建模型时设置的名称，此处不可编辑。任务类型选择合适的任务类型。许可证必填项，根据业务需求选择合适的许可证类型。描述必填项，填写资产简介，模

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
使用llm-compressor工具量化 - AI开发平台ModelArts

torch_dtype=torch.bfloat16, trust_remote_code=True, ) 3）为减少量化时间，建议将以下参数设置为512； NUM_CALIBRATION_SAMPLES = 512 执行权重量化： python deepseek_moe_w8a8_int8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用llm-compressor工具量化 - AI开发平台ModelArts

torch_dtype=torch.bfloat16, trust_remote_code=True, ) 3）为减少量化时间，建议将以下参数设置为512； NUM_CALIBRATION_SAMPLES = 512 执行权重量化： python deepseek_moe_w8a8_int8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

任务说明准备工作准备资源本教程案例是基于ModelArts Standard运行的，需要购买并开通ModelArts专属资源池和OBS桶。准备数据准备训练数据，可以用本案使用的数据集，也可以使用自己准备的数据集。准备权重准备所需的权重文件。准备代码准备AscendSpeed训练代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
推理精度测试 - AI开发平台ModelArts

host：与起服务的host保持一致，比如起服务为0.0.0.0，host设置也为0.0.0.0。 service_port：服务端口，与启动服务时的端口保持，比如8080。 max_out_len：在运行类似mmlu、ceval等判别式回答时，max_out_len建议设置小一些，比如16。在运行human_ev

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
状态码 - AI开发平台ModelArts
状态码 - AI开发平台ModelArts

403 Forbidden 请求被拒绝访问。返回该状态码，表明请求能够到达服务端，且服务端能够理解用户请求，但是拒绝做更多的事情，因为该请求被设置为拒绝访问，建议直接修改该请求，不要重试该请求。 404 NotFound 所请求的资源不存在。建议直接修改该请求，不要重试该请求。 405

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
重试/停止/运行Workflow节点 - AI开发平台ModelArts

试启动后新修改的配置信息可以在当前执行中立即生效。停止单击指定节点查看详情，可以对运行中的节点进行停止操作。继续运行对于单个节点中设置了需要运行中配置的参数时，节点运行会处于“等待操作”状态，用户完成相关数据的配置后，可单击“继续运行”按钮并确认继续执行当前节点。部分运行Workflow节点

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
提交验收任务的样本评审意见 - AI开发平台ModelArts

worker_id 否 String 标注成员ID，可调用标注成员列表接口获取。响应参数无请求示例提交验收任务的样本评审意见。设置是否通过为“true”，评审分数为“A”。 { "comments" : [ { "worker_id" : "8c15ad0

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Ascend-vLLM推理常见问题 - AI开发平台ModelArts

oken和大于max_model_len，服务端返回报错Response payload is not completed，见图2。再次设置输入输出的token和小于max_model_len访问推理服务，服务端响应200，见图3。客户端仍返回报错Response payload

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 附录
查询AI应用详情 - AI开发平台ModelArts

模型版本。 source_job_version String 来源训练作业的版本。 source_location String 模型所在的OBS路径或SWR镜像的模板地址。 source_job_id String 来源训练作业的ID。 source_copy String 镜像复

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
发布数据集到AI Gallery - AI开发平台ModelArts

在数据集详情页，单击右侧“发布”，在发布数据集页面编辑发布信息后，单击“发布”。表1 发布数据集的参数说明参数名称说明中文名称数据集发布后显示的名称，在创建数据集时设置的名称，此处不可编辑。任务类型选择合适的任务类型。许可证必填项，根据业务需求选择合适的许可证类型。描述必填项，填写资产简介，数

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
附录：大模型推理常见问题 - AI开发平台ModelArts

zer/chatglm3-6b/config.json 问题3：使用离线推理时，性能较差或精度异常。解决方法：将block_size大小设置为128。 from vllm import LLM, SamplingParams llm = LLM(model="facebook/opt-125m"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
附录：大模型推理常见问题 - AI开发平台ModelArts

zer/chatglm3-6b/config.json 问题3：使用离线推理时，性能较差或精度异常。解决方法：将block_size大小设置为128。 from vllm import LLM, SamplingParams llm = LLM(model="facebook/opt-125m"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908）
附录：Standard大模型推理常见问题 - AI开发平台ModelArts

zer/chatglm3-6b/config.json 问题3：使用离线推理时，性能较差或精度异常。解决方法：将block_size大小设置为128。 from vllm import LLM, SamplingParams llm = LLM(model="facebook/opt-125m"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
删除节点池 - AI开发平台ModelArts

节点池名称。比如：nodePool-1。 taints Array of Taint objects 支持给创建出来的节点加taints来设置反亲和性，非特权池不能指定。 labels Map<String,String> k8s标签，格式为key/value键值对。 tags Array

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
附录：大模型推理常见问题 - AI开发平台ModelArts

oken和大于max_model_len，服务端返回报错Response payload is not completed，见图2。再次设置输入输出的token和小于max_model_len访问推理服务，服务端响应200，见图3。客户端仍返回报错Response payload

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
创建训练作业标签 - AI开发平台ModelArts

有空格，不能以_sys_开头。 value String TMS标签的value。长度不能超过255个字符。请求示例创建训练作业标签。设置TMS标签的key/value为“111”和“k3”，TMS标签的key/value为"k3"和“v2”。 POST https:/

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理

总条数： 1853

上一页
1
...
87
88
89
...
93
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

动态扩充云硬盘EVS容量 - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

训练作业失败，返回错误码139 - AI开发平台ModelArts

发布模型到AI Gallery - AI开发平台ModelArts

使用llm-compressor工具量化 - AI开发平台ModelArts

使用llm-compressor工具量化 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

状态码 - AI开发平台ModelArts

重试/停止/运行Workflow节点 - AI开发平台ModelArts

提交验收任务的样本评审意见 - AI开发平台ModelArts

Ascend-vLLM推理常见问题 - AI开发平台ModelArts

查询AI应用详情 - AI开发平台ModelArts

发布数据集到AI Gallery - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：Standard大模型推理常见问题 - AI开发平台ModelArts

删除节点池 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

创建训练作业标签 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线