搜索_华为云

推理场景介绍 - AI开发平台ModelArts

软件配套版本和获取地址软件名称说明下载地址 AscendCloud-6.3.911-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的推理部署代码和推理评测代码、推理依赖的算子包。代码包具体说明请参见模型软件包结构说明。获取路径：Suppor

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
通过APP认证的方式访问在线服务 - AI开发平台ModelArts

证鉴权方式发送预测请求约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。前提条件数据已完成准备：已在ModelArts中创建状态“正常”可用的模型。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
使用SDK调测单机训练作业 - AI开发平台ModelArts

训练脚本需要将输出的模型或其他数据保存在该目录下。 obs_path：必选参数，一个OBS目录。SDK会将local_path中的模型文件自动上传到这里。查看训练支持的AI框架。 from modelarts.estimatorV2 import Estimator Estimator

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
ModelArts中提示OBS相关错误 - AI开发平台ModelArts

没有，请参考配置访问授权（全局配置）。检查OBS桶是否为非加密桶进入OBS管理控制台，单击桶名称进入概览页。确保此OBS桶的加密功能关闭。如果此OBS桶为加密桶，可单击“默认加密”选项进行修改。创建OBS桶时，桶的存储类别请勿选择“归档存储”和“深度归档存储”，归档存储的OBS桶会导致模型训练失败。

帮助中心 > AI开发平台ModelArts > 故障排除 > 通用问题
部署在线服务 - AI开发平台ModelArts

String 调度类型，当前仅支持取值为“stop”。 time_unit 是 String 调度时间单位，可选： DAYS HOURS MINUTES duration 是 Integer 对应时间单位的数值，比如2小时后停止，则“time_unit”填“HOURS”，“duration”填“2”。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
使用llm-compressor工具量化 - AI开发平台ModelArts

torch_dtype=torch.bfloat16, trust_remote_code=True, ) 3）为减少量化时间，建议将以下参数设置为512； NUM_CALIBRATION_SAMPLES = 512 执行权重量化： python deepseek_moe_w8a8_int8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用llm-compressor工具量化 - AI开发平台ModelArts

torch_dtype=torch.bfloat16, trust_remote_code=True, ) 3）为减少量化时间，建议将以下参数设置为512； NUM_CALIBRATION_SAMPLES = 512 执行权重量化： python deepseek_moe_w8a8_int8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
如果不再使用ModelArts，如何停止收费？ - AI开发平台ModelArts

检查是否有“运行中”的Workflow列表。如果有，单击Workflow列表中“操作 > 删除”即可停止计费。进入“ModelArts>自动学习”页面，检查是否有“运行中”的项目。如果有，单击项目列表中“操作 > 删除”即可停止计费。进入“ModelArts>开发空间>Not

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

|── alpaca_gpt4_data.json # 微调数据文件在ECS服务器中安装obsutil工具，具体命令可参考obsutil工具快速使用，将OBS桶中的数据下载至SFS Turbo中。注意：需要使用用户账

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
在ModelArts上如何提升训练效率并减少与OBS的交互？ - AI开发平台ModelArts

中将数据从OBS复制到“/cache”目录，然后每次从“/cache”目录读取数据，直到训练结束。训练结束以后“/cache”目录的内容会自动被清空。优化方式以TensorFlow代码为例。优化前代码如下所示： 1 2 3 4 ... tf.flags.DEFINE_string('data_url'

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
使用llm-compressor工具量化 - AI开发平台ModelArts

torch_dtype=torch.bfloat16, trust_remote_code=True, ) 3）为减少量化时间，建议将以下参数设置为512； NUM_CALIBRATION_SAMPLES = 512 执行权重量化： python deepseek_moe_w8a8_int8

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
包年/包月 - AI开发平台ModelArts
包年/包月 - AI开发平台ModelArts

“包年/包月”，在页面左下角查看所需费用。计费周期包年/包月资源的计费周期是根据您购买的时长来确定的（以北京时间为准）。一个计费周期的起点是您开通或续费资源的时间（精确到秒），终点则是到期日的23:59:59。例如，如果您在2023/03/08 15:50:04购买了一个时

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
监控资源 - AI开发平台ModelArts
监控资源 - AI开发平台ModelArts

emUsage”“npuMemUsage”、“npuUtil”、可以添加或取消对应参数的使用情况图。操作三：鼠标悬浮在图片上的时间节点，可查看对应时间节点的占用率情况。表1 参数说明参数说明 cpuUsage cpu使用率。 gpuMemUsage gpu内存使用率。 gpuUtil

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
发布技术文章（AI说） - AI开发平台ModelArts

cx，xls，xlsx，ppt，pptx，pdf，txt格式的附件，单个附件大小不超过20M，最多可传5个附件。编辑AI说时，30秒钟后自动保存草稿，用户可单击“草稿箱”查看。草稿箱可支持保存草稿记录共三条，存满后请手动删除；建议您及时发布重要内容，以免重要内容无法保存。单击“发布”，跳转至技术文章详情页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 参加活动
Yaml配置文件参数配置说明 - AI开发平台ModelArts

disable_gradient_checkpointing true 关闭重计算，用于禁用梯度检查点，默认开启梯度检查点;在深度学习模型训练中用于保存模型的状态，以便在需要时恢复。这种技术可以帮助减少内存使用，特别是在训练大型模型时，但同时影响性能。True表示关闭重计算功能。 include_tokens_per_second

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
续费 - AI开发平台ModelArts
续费 - AI开发平台ModelArts

续费续费概述手动续费自动续费

 帮助中心 > AI开发平台ModelArts > 计费说明
计算规格说明 - AI开发平台ModelArts

付欠款，那么付费资源（如计算规格、OBS桶）、等都将被冻结，资源进入保留期。保留期的资源不支持任何操作。如果用户在宽限期内充值，则华为云会自动扣取欠费金额（含宽限期内产生的费用）保留期到期时仍未支付欠款（含宽限期内产生的费用），则付费资源将释放，数据无法恢复。宽限期和保留期的详细规则请参见宽限期保留期。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
从AI Gallery订阅模型 - AI开发平台ModelArts

由于商用模型支持同时购买多种配额模式的资产，所以仅部署商用模型时需要进行配额选择。免费模型仅一种配额模式无需选择。图2 修改配额如果您选择部署的非商业模型，系统自动跳转至“部署”页面。在部署页面中，无需再选择模型及其版本，参考部署模型的操作指导完成其他参数填写，即可部署为您需要的服务。父主题：创建模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
通过智能标注方式标注数据 - AI开发平台ModelArts

通过智能标注方式标注数据创建智能标注作业确认智能标注作业的数据难例使用自动分组智能标注作业父主题：标注ModelArts数据集中的数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据
SFT全参微调训练 - AI开发平台ModelArts

/home/ma-user/work/data/log 保存训练过程记录的日志LOG文件。 Step3 开启训练故障自动重启功能创建训练作业时，可开启自动重启功能。当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。图4 开启故障重启 Step4 其他配置

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）

总条数： 1399

上一页
1
...
57
58
59
...
70
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理场景介绍 - AI开发平台ModelArts

通过APP认证的方式访问在线服务 - AI开发平台ModelArts

使用SDK调测单机训练作业 - AI开发平台ModelArts

ModelArts中提示OBS相关错误 - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

使用llm-compressor工具量化 - AI开发平台ModelArts

使用llm-compressor工具量化 - AI开发平台ModelArts

如果不再使用ModelArts，如何停止收费？ - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

在ModelArts上如何提升训练效率并减少与OBS的交互？ - AI开发平台ModelArts

使用llm-compressor工具量化 - AI开发平台ModelArts

包年/包月 - AI开发平台ModelArts

监控资源 - AI开发平台ModelArts

发布技术文章（AI说） - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

续费 - AI开发平台ModelArts

计算规格说明 - AI开发平台ModelArts

从AI Gallery订阅模型 - AI开发平台ModelArts

通过智能标注方式标注数据 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线