搜索_华为云

推理精度测试 - AI开发平台ModelArts

host：与起服务的host保持一致，比如起服务为0.0.0.0，host设置也为0.0.0.0。 service_port：服务端口，与启动服务时的端口保持，比如8080。 max_out_len：在运行类似mmlu、ceval等判别式回答时，max_out_len建议设置小一些，比如16。在运行human_ev

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

|── alpaca_gpt4_data.json # 微调数据文件在ECS服务器中安装obsutil工具，具体命令可参考obsutil工具快速使用，将OBS桶中的数据下载至SFS Turbo中。注意：需要使用用户账

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
自定义镜像导入模型部署上线调用API报错 - AI开发平台ModelArts

“/predictions/poetry”（默认为“/”）。确认API调用中body体中的调用路径是否拼接自定义路径。如：“{API接口地址}/predictions/poetry”。父主题：服务预测

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
创建训练作业 - AI开发平台ModelArts

训练作业选择的自定义镜像地址，地址从swr服务获取。 install_sys_packages 否 Boolean 是否需要安装训练平台指定的 moxing 版本。true为需要。只有填写了engine_name，engine_version，image_url参数时支持该设置。表15 Summary

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
投机推理使用说明 - AI开发平台ModelArts

执行一次完整投机流程的时间也仅为大模型的1.5倍左右（投机步数设置为3步）。而这一次投机流程，平均可以生成3个有效token，即用1.5倍的时间代价，生成了3倍的token数量，性能提升了100%。投机推理参数设置在启动离线或在线推理服务时参考表1所示配置参数，使用投机推理功能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

|── alpaca_gpt4_data.json # 微调数据文件在ECS服务器中安装obsutil工具，具体命令可参考obsutil工具快速使用，将OBS桶中的数据下载至SFS Turbo中。注意：需要使用用户账

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

|── alpaca_gpt4_data.json # 微调数据文件在ECS服务器中安装obsutil工具，具体命令可参考obsutil工具快速使用，将OBS桶中的数据下载至SFS Turbo中。注意：需要使用用户账

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
ModelArts中提示OBS相关错误 - AI开发平台ModelArts

ModelArts上没有配置委托授权。 OBS文件加密上传导致。ModelArts不支持OBS加密文件。 OBS桶的权限和访问ACL设置不正确导致。创建训练作业时，代码目录和启动文件设置有误。处理办法查看OBS桶与ModelArts是否在同一个区域查看创建的OBS桶所在区域。登录OBS管理控制台。

帮助中心 > AI开发平台ModelArts > 故障排除 > 通用问题
Standard Notebook - AI开发平台ModelArts

VS Code如何查看远端日志？在ModelArts的Notebook中如何打开VS Code的配置文件settings.json？在ModelArts的Notebook中如何设置VS Code背景色为豆沙绿？在ModelArts的Notebook中如何设置VS Code远端默认安装的插件？

帮助中心 > AI开发平台ModelArts > 常见问题
在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

元模型来源：从容器镜像中选择。容器镜像所在的路径：单击选择镜像文件。具体路径查看5SWR地址。容器调用接口：选择HTTPS。 host：设置为8443。部署类型：选择在线服务。图11 设置模型参数填写启动命令，启动命令内容如下： sh /home/ma-user/infer/run

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
（可选）工作空间配置 - AI开发平台ModelArts

ModelArts支持设置子用户的细粒度权限、不同工作空间之间资源隔离。ModelArts工作空间帮您实现项目资源隔离、多项目分开结算等功能。如果您开通了企业项目管理服务的权限，可以在创建工作空间的时候绑定企业项目ID，并在企业项目下添加用户组，为不同的用户组设置细粒度权限供组里的用户使用。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.912） - AI开发平台ModelArts

CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.912）本文档主要介绍如何在ModelArts的Lite Server环境中，使用NPU卡对CogVideoX模型进行全量微调。本文档中提供的脚本，是基于原生CogVid

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
使用MaaS部署模型服务 - AI开发平台ModelArts

单击“选择模型”，选择“模型广场”或“我的模型”下面的模型。资源设置资源池类型资源池分为公共资源池与专属资源池。公共资源池供所有租户共享使用。专属资源池需单独创建，不与其他租户共享。实例规格选择实例规格，规格中描述了服务器类型、型号等信息。流量限制（QPS）设置待部署模型的流量限制QPS。单位：次/秒

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
管理AI Gallery数据集 - AI开发平台ModelArts

选择数据集支持用于什么类型的训练模型。运行平台选择数据集额外支持的运行平台。设置运行平台后，当资产上架后，该资产支持通过订阅的方式同步到所选运行平台使用。设置运行平台后，单击“设置”，在弹窗中可以自定义设置运行平台的资产标签，且标签可以被一起同步至运行平台。数据集描述 - 资产

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
请求超时返回Timeout - AI开发平台ModelArts

API网关）和模型。处理方法优先排查APIG（API网关）是否是通的，可以在本地使用curl命令排查，命令行：curl -kv {预测地址}。如返回Timeout则需排查本地防火墙，代理和网络配置。检查模型是否启动成功或者模型处理单个消息的时长。因APIG（API网关）的限

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
Lite Cluster资源开通 - AI开发平台ModelArts

“写入模式”，包括线性和条带化。以本地持久卷挂载：支持“持久卷写入模式”设置，包括线性和条带化，此处设置的是所有数据盘的写入模式。以临时存储卷挂载：支持“临时卷写入模式”设置，包括线性和条带化，此处设置的是所有数据盘的写入模式。新增规格 - 支持添加多个规格。限制如下：当

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
Eagle投机小模型训练 - AI开发平台ModelArts

old_folder为上一步生成data的地址，填写到卡号的文件夹之前。命令中的./sharegpt_0_199_mufp16/"为举例，需要替换为实际地址。 new_folder为需要存储新的data的地址。命令中的./sharegpt_0_199_mufp16/"为举例，需要替换为实际地址。 tp为需要切分成的文件夹数量，默认为8。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
Eagle投机小模型训练 - AI开发平台ModelArts

old_folder为上一步生成data的地址，填写到卡号的文件夹之前。命令中的./sharegpt_0_199_mufp16/"为举例，需要替换为实际地址。 new_folder为需要存储新的data的地址。命令中的./sharegpt_0_199_mufp16/"为举例，需要替换为实际地址。 tp为需要切分成的文件夹数量，默认为8。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
Eagle投机小模型训练 - AI开发平台ModelArts

old_folder为上一步生成data的地址，填写到卡号的文件夹之前。命令中的./sharegpt_0_199_mufp16/"为举例，需要替换为实际地址。 new_folder为需要存储新的data的地址。命令中的./sharegpt_0_199_mufp16/"为举例，需要替换为实际地址。 tp为需要切分成的文件夹数量，默认为8。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
查询训练作业列表 - AI开发平台ModelArts

训练作业选择的自定义镜像地址，地址从swr服务获取。 install_sys_packages Boolean 是否需要安装训练平台指定的 moxing 版本。true为需要。只有填写了engine_name，engine_version，image_url参数时支持该设置。表27 Summary

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理

总条数： 1492

上一页
1
...
24
25
26
...
75
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理精度测试 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

自定义镜像导入模型部署上线调用API报错 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

ModelArts中提示OBS相关错误 - AI开发平台ModelArts

Standard Notebook - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

（可选）工作空间配置 - AI开发平台ModelArts

CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.912） - AI开发平台ModelArts

使用MaaS部署模型服务 - AI开发平台ModelArts

管理AI Gallery数据集 - AI开发平台ModelArts

请求超时返回Timeout - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线