搜索_华为云

在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类 - AI开发平台ModelArts

创建调优任务参数说明取值样例任务设置任务名称自定义调优任务名称。参见表3 描述自定义调优任务简介。 - 模型设置来源模型当从“我的模型”列表进入创建调优作业页面时，此处默认呈现选择的模型。 Qwen2-7B_template 调优类型全参微调：直接在模型上训练，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
创建诊断任务 - AI开发平台ModelArts

e来提升分析速度。 6 disable_affinity_api False 否关闭亲和算子（融合算子、亲和优化器）API分析。对于首次从gpu迁移至npu的训练任务性能分析，建议保留该参数，替换亲和算子API通常能获得一定性能收益。对于完成迁移后在npu上长训的训练任务，如果

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
查询节点池的节点列表 - AI开发平台ModelArts

os.modelarts/npu-topology-placement String 910卡占用拓扑信息。将16进制转换成二进制后，比特位从右往左卡编号0-15，比特位1代表占用。表8 NodeSpec 参数参数类型描述 flavor String 节点规格。 extendParams

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
附录：大模型推理常见问题 - AI开发平台ModelArts

moothquant/utils/utils.py中的build_model_and_tokenizer函数，将torch_dtype类型从torch.float16改成torch.bfloat16 kwargs = {"torch_dtype": torch.bfloat16,

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

登录弹性云服务器（ECS），可以通过Linux命令行访问在线服务，也可以创建Python环境运行Python代码访问在线服务。schema、 ip、port参数值从3获取。执行命令示例如下，直接访问在线服务。 curl --location --request POST 'http://192.168

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
使用Prometheus查看Lite Cluster监控指标 - AI开发平台ModelArts

relabel_configs: - source_labels: [__meta_kubernetes_pod_name] # 指定从maos-node-agent-字符串开头的POD收集指标数据 action: keep regex:

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

业运行期间获取训练日志并展示到本地。使用PyCharm ToolKit创建并调试训练作业 OBS上传下载上传本地文件或文件夹至OBS，从OBS下载文件或文件夹到本地。使用PyCharm上传数据至Notebook 前提条件本地已安装2019.2-2023.2之间（包含2019

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

# ModelLink端到端的大语言模型方案 |——megatron/ # 注意：该文件夹从Megatron-LM中复制得到 |——... 如果git下载代码时报错，请参见Git下载代码时报错解决。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.907） > 准备工作
使用AWQ量化 - AI开发平台ModelArts

可以在Huggingface开源社区获取AWQ量化后的模型权重；或者获取FP16/BF16的模型权重之后，通过autoAWQ工具进行量化。方式一：从开源社区下载发布的AWQ量化模型。 https://huggingface.co/models?sort=trending&search=QWEN+AWQ

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

可以在Huggingface开源社区获取AWQ量化后的模型权重；或者获取FP16/BF16的模型权重之后，通过autoAWQ工具进行量化。方式一：从开源社区下载发布的AWQ量化模型。 https://huggingface.co/models?sort=trending&search=QWEN+AWQ

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

左上角选择Raw，不要选择Socket.IO（一种WebSocket实现，要求客户端跟服务端都要基于Socket.IO），地址栏中填入从服务详情页“调用指南”页签中获取“API接口调用公网地址”后面的地址。如果自定义镜像中有更细粒度的地址，则在地址后面追加该URL。如果有qu

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

提供模型配置的通用属性和两个主要方法，用于序列化和反序列化配置文件。 PretrainedConfig.from_pretrained(dir) # 从目录中加载序列化对象（本地或者是url），配置文件为dir/config.json PretrainedConfig.save_pretrained(dir)

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
获取Workflow工作流列表 - AI开发平台ModelArts

of WorkflowParameter objects Workflow包含的参数。 source_workflow_id String 从指定Workflow工作流进行复制。通过复制来创建Workflow时必填。 gallery_subscription WorkflowGallerySubscription

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
执行训练任务（推荐） - AI开发平台ModelArts

train_auto_resume false 【可选】是否开启【故障快恢】功能，【true、false】默认false不开启，当训练中断时重启任务会从最新生成权重文件处继续训练。详见断点续训和故障快恢说明 handler-name GeneralPretrainHandler GeneralInstructionHandler

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练任务
在推理生产环境中部署推理服务 - AI开发平台ModelArts

创建”，开始创建AI应用。图2 创建AI应用设置创建AI应用的相应参数。此处仅介绍关键参数，设置AI应用的详细参数解释请参见从OBS中选择元模型。根据需要自定义应用的名称和版本。模型来源选择“从对象存储服务（OBS）中选择”，元模型选择转换后模型的存储路径，AI引擎选择“Custom”，引擎包选择准备镜像中上传的推理镜像。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

6-linux-arm64.tar.gz -C /usr/bin/ # 查看是否安装成功 nerdctl -v 安装buildkit工具。buildkit是从Docker从公司开源出来的下一代镜像构建工具，支持OCI标准的镜像构建，nerdctl需要结合buildkit一起使用。buildkit由两部分组成：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 准备工作
使用AWQ量化 - AI开发平台ModelArts

可以在Huggingface开源社区获取AWQ量化后的模型权重；或者获取FP16/BF16的模型权重之后，通过autoAWQ工具进行量化。方式一：从开源社区下载发布的AWQ量化模型。 https://huggingface.co/models?sort=trending&search=QWEN+AWQ

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
昇腾云服务6.3.908版本说明 - AI开发平台ModelArts

rc3-py_3.10-hce_2.0.2312-aarch64-snt9b-20240829092203-4ccf328 镜像发布到SWR，从SWR拉取固件驱动：23.0.6 CANN：cann_8.0.rc3 容器镜像OS：hce_2.0 PyTorch：pytorch_2.1

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
MoXing进阶用法的样例代码 - AI开发平台ModelArts

通过重写pandas源码API的方式，将该API改造成支持OBS路径的形式。写h5到OBS = 写h5到本地缓存 + 上传本地缓存到OBS + 删除本地缓存从OBS读h5 = 下载h5到本地缓存 + 读取本地缓存 + 删除本地缓存即将以下代码写在运行脚本的最前面，就能使运行过程中的to_hdf和read_hdf支持OBS路径。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
更新服务配置 - AI开发平台ModelArts

参数下配置index参数，指定使用csv数据中对应索引下标的数据作为此参数的值去发送推理请求，csv数据必须以英文半角逗号分隔，index从0开始计数，特殊地，当index为-1时忽略此参数。表4 update_service_config返回参数说明参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理

总条数： 636

上一页
1
...
23
24
25
...
32
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类 - AI开发平台ModelArts

创建诊断任务 - AI开发平台ModelArts

查询节点池的节点列表 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

使用Prometheus查看Lite Cluster监控指标 - AI开发平台ModelArts

使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

获取Workflow工作流列表 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

昇腾云服务6.3.908版本说明 - AI开发平台ModelArts

MoXing进阶用法的样例代码 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线