搜索_华为云

裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

service实现将VPC子网分配的私有IP写入网卡配置文件中。NetworkManager.service会优先读取网卡配置文件中的IP设置为主机IP，此时无论DH Cient是否关闭，服务器都可以获取分配IP。当服务器没有网卡配置文件时，DH Client开启，此时服务器会分配私有IP。如果关闭DH

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
使用AWQ量化工具转换权重 - AI开发平台ModelArts

transformers sentencepiece #安装量化工具依赖 export ASCEND_RT_VISIBLE_DEVICES=0 #设置使用NPU单卡执行模型量化 python examples/quantize.py 详细说明可以参考vLLM官网：https://docs

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
pipeline代码适配 - AI开发平台ModelArts

Lite进行推理时一般需要先设置目标设备的上下文信息，然后构建推理模型，获取输入数据，模型预测并得到最终的结果。一个基础的推理框架写法如下所示： # base_mslite_demo.py import mindspore_lite as mslite # 设置目标设备上下文为Ascend，指定device_id为0。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
查看在线服务详情 - AI开发平台ModelArts

的操作。预测对在线服务进行预测。具体操作请参见使用预测功能测试在线服务。实例查看异步在线服务的实例信息。这里的实例个数和部署服务时设置的“实例数”相对应，如果修改服务或服务异常，实例数会有变化。如果存在某个实例异常希望重建实例，您可单击“删除”按钮，该实例被删除后会自动新建一个相同计算规格的实例。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
自动学习训练作业失败 - AI开发平台ModelArts

数据源”，将OBS中的数据重新同步至ModelArts中。检查OBS的访问权限如果OBS桶的访问权限设置无法满足训练要求时，将会出现训练失败。请排查如下几个OBS的权限设置。当前账号具备OBS桶的读写权限（桶ACLs）进入OBS管理控制台，选择当前自动学习项目使用的OBS桶，单击桶名称进入概览页。

帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 模型训练
示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

ain.py”。超参当资源规格为单机多卡时，需要指定超参world_size和rank。当资源规格为多机时（即实例数大于 1），无需设置超参world_size和rank，超参会由平台自动注入。方式二：使用自定义镜像功能，通过torch.distributed.launch命令启动训练作业。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
添加资源标签 - AI开发平台ModelArts

error_code String ModelArts错误码。 error_msg String 具体错误信息。请求示例为指定服务添加标签。设置TMS标签的key为“test”和“model_version”，TMS标签的value为“service-gpu”和“0.1”。 htt

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
服务启动失败 - AI开发平台ModelArts

创建模型界面上配置的健康检查地址与实际配置的是否一致如果使用的是ModelArts提供的基础镜像创建模型，健康检查URL默认必须为/health。图4 设置健康检查URL 模型推理代码customize_service.py编写有问题如果模型推理代码customize_service.py编

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
更新算法 - AI开发平台ModelArts
更新算法 - AI开发平台ModelArts

resource_requirements 否 Array of ResourceRequirement objects 算法资源约束。可不设置。设置后，在算法使用于训练作业时，控制台会过滤可用的公共资源池。 advanced_config 否 AlgorithmAdvancedConfig

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询用户所有DevServer实例列表 - AI开发平台ModelArts

String> 通过应用专属URL直接打开应用进入远程开发模式。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。表7 EndpointsRes 参数参数类型描述 allowed_access_ips Array

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

String> 通过应用专属URL直接打开应用进入远程开发模式。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。表7 EndpointsRes 参数参数类型描述 allowed_access_ips Array

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

模型基本信息参数说明参数名称说明名称模型名称。支持1～64位可见字符（含中文），名称可以包含字母、中文、数字、中划线、下划线。版本设置所创建模型的版本。第一次导入时，默认为0.0.1。说明：模型创建完成后，可以通过创建新版本，导入不同的元模型进行调优。描述模型的简要描述。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
训练启动脚本说明和参数配置 - AI开发平台ModelArts

规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量文本序列长度并行参数设置规格与节点数 1 llama2 llama2-7b SEQ_LEN=4096 TP(tensor model

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
推理精度测试 - AI开发平台ModelArts

model_args：标志向模型构造函数提供额外参数，比如指定运行模型的数据类型； vllm_path是模型权重路径； max_model_len 是最大模型长度，默认设置为4096； gpu_memory_utilization是gpu利用率，如果模型出现oom报错，调小参数； tensor_parallel_size是使用的卡数；

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
推理精度测试 - AI开发平台ModelArts

model_args：标志向模型构造函数提供额外参数，比如指定运行模型的数据类型； vllm_path是模型权重路径； max_model_len 是最大模型长度，默认设置为4096； gpu_memory_utilization是gpu利用率，如果模型出现oom报错，调小参数； tensor_parallel_size是使用的卡数；

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

服务接口是否升级为WebSocket。部署服务时，默认值为false；更新服务配置时，默认值为上一次设置的值。 false：不升级为WebSocket。 true：升级为WebSocket。开启后，不支持修改。开启WebSocket时，不支持同时设置“服务流量限制”。表15 SmnNotification 参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

用。 “计算节点规格”：在下拉框中选择限时免费的CPU资源，如果限时免费资源售罄，建议选择收费CPU资源进行部署。 “计算节点个数”，默认设置为“1”。其他参数可使用默认值。选择CPU资源部署模型会收取少量费用，具体费用以界面信息为准。如果需要使用GPU资源部署上线，需要进

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
查询服务列表 - AI开发平台ModelArts

total_count Integer 不分页的情况下，符合查询条件的总服务数量。 count Integer 当前查询结果的服务数量，不设置offset、limit查询参数时，count与total相同。 services service结构数组查询到的服务集合。表3 service结构

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
推理精度测试 - AI开发平台ModelArts

model_args：标志向模型构造函数提供额外参数，比如指定运行模型的数据类型； vllm_path是模型权重路径； max_model_len 是最大模型长度，默认设置为4096； gpu_memory_utilization是gpu利用率，如果模型出现oom报错，调小参数； tensor_parallel_size是使用的卡数；

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

# 原始数据目录 # 训练输出目录路径：根据{OUTPUT_SAVE_DIR}或yaml文件{output_dir}参数设置 |──{output_dir} # 输出目录，以下目录在训练过程中自动生成 |──conv

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作

总条数： 941

上一页
1
...
36
37
38
...
48
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

pipeline代码适配 - AI开发平台ModelArts

查看在线服务详情 - AI开发平台ModelArts

自动学习训练作业失败 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

添加资源标签 - AI开发平台ModelArts

服务启动失败 - AI开发平台ModelArts

更新算法 - AI开发平台ModelArts

查询用户所有DevServer实例列表 - AI开发平台ModelArts

实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线