搜索_华为云

准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

llama2-13b https://huggingface.co/meta-llama/Llama-2-13b-chat-hf 3 llama2-70b https://huggingface.co/meta-llama/Llama-2-70b-hf https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 准备工作
语言模型推理性能测试 - AI开发平台ModelArts

--num-speculative-tokens：仅当开启--use-spec-decode时生效，需和服务启动时配置的--num-speculative-tokens一致。默认为-1。当该值大于等于0时，会基于该值计算投机推理的接受率指标。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务性能评测
语言模型推理性能测试 - AI开发平台ModelArts

--num-speculative-tokens：仅当开启--use-spec-decode时生效，需和服务启动时配置的--num-speculative-tokens一致。默认为-1。当该值大于等于0时，会基于该值计算投机推理的接受率指标。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试
在ModelArts中使用边缘节点部署边缘服务时能否使用http接口协议？ - AI开发平台ModelArts

在ModelArts中使用边缘节点部署边缘服务时能否使用http接口协议？系统默认使用https。如果您想使用http，可以采取以下两种方式：方式一：在部署边缘服务时添加如下环境变量： MODELARTS_SSL_ENABLED = false 图1 添加环境变量方式二：在

 帮助中心 > AI开发平台ModelArts > 常见问题 > Edge
语言模型推理性能测试 - AI开发平台ModelArts

--num-speculative-tokens：仅当开启--use-spec-decode时生效，需和服务启动时配置的--num-speculative-tokens一致。默认为-1。当该值大于等于0时，会基于该值计算投机推理的接受率指标。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
推理性能测试 - AI开发平台ModelArts

--num-speculative-tokens：仅当开启--use-spec-decode时生效，需和服务启动时配置的--num-speculative-tokens一致。默认为-1。当该值大于等于0时，会基于该值计算投机推理的接受率指标。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
PD分离部署使用说明 - AI开发平台ModelArts

仅在环境变量USE_OPENAI=1时生效。 --quantization：如果需要增加模型量化功能，启动推理服务前，先参考量化章节对模型做量化处理。步骤四：启动scheduler实例建议在PD服务（即全量推理和增量推理服务）启动后，再启动scheduler服务。启动sc

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
推理性能测试 - AI开发平台ModelArts

--num-speculative-tokens：仅当开启--use-spec-decode时生效，需和服务启动时配置的--num-speculative-tokens一致。默认为-1。当该值大于等于0时，会基于该值计算投机推理的接受率指标。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

llama2-70b https://huggingface.co/meta-llama/Llama-2-70b-hf https://huggingface.co/meta-llama/Llama-2-70b-chat-hf (推荐) 4 llama3 llama3-8b https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 准备工作
推理业务迁移评估表 - AI开发平台ModelArts

业务是否需要频繁更新模型，或者需要动态加载Lora。 - stable-diffusion套件使用differusers （https://github.com/huggingface/diffusers）。 stable-diffusion-webui （https://github

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
重置AppCode - AI开发平台ModelArts
重置AppCode - AI开发平台ModelArts

APP绑定API数量。 created_at Long APP创建时间。 project_id String 项目ID。 updated_at Long APP更新时间。 user_id String APP创建用户ID。状态码： 401 表6 响应Body参数参数参数类型描述 error_code

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
训练作业日志中提示 “AttributeError: module '***' has no attribute '***'” - AI开发平台ModelArts

第三方pip源中的python包版本更新，导致在训练作业中安装的python包的版本可能也会发生变化。如训练作业之前无此问题，后面一直有此问题，则考虑是此原因。处理方法通过Notebook调试。安装时指定版本。如：pip install xxx==1.x.x 第三方pip源可能随时更新，可通过制作

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
查询服务详情 - AI开发平台ModelArts

数，输入值不能小于0（最多支持2位小数，小数点后第3位做四舍五入处理）。 memory Integer 内存，单位为MB，仅支持整数。 cpu Float CPU核数，支持配置小数，输入值不能小于0.01（最多支持2位小数，小数点后第3位做四舍五入处理）。 ascend_a310

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
查询支持的镜像列表 - AI开发平台ModelArts

该镜像所对应的描述信息，长度限制512个字符。 dev_services Array of strings 镜像支持的服务。枚举值如下： NOTEBOOK：镜像支持通过https协议访问Notebook。 SSH：镜像支持本地IDE通过SSH协议远程连接Notebook。 id String 待创建Noteboo

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

启动训练任务训练任务加载需要一定时间，在等待若干分钟后，可以执行下述命令查看卡信息。如下图可见，8张卡均被占用，说明训练任务在进行中 npu-smi info 图7 查看卡信息若想停止训练任务，可执行下述命令关闭进程，查询进程后显示已无运行中python进程。 pkill -9 python

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
通过SSH工具远程使用Notebook - AI开发平台ModelArts

pem文件生成）。单击“Open”。如果首次登录，PuTTY会显示安全警告对话框，询问是否接受服务器的安全证书。单击“Accept”将证书保存到本地注册表中。图6 询问是否接受服务器的安全证书成功连接到云上Notebook实例。图7 连接到云上Notebook实例父主题：使用Notebook进行AI开发调试

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
查询数据集详情 - AI开发平台ModelArts

是否同步更新智能标注数据。可选值如下： true：同步更新智能标注数据 false：不同步更新智能标注数据 is_synchronize_data Boolean 是否同步更新数据：如上传文件、同步数据源、导入的未标注文件同步分配至团队成员。可选值如下： true：同步更新数据至团队成员

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建ModelArts数据增强任务 - AI开发平台ModelArts

Pepper为椒盐噪声。默认值为Gauss loc：噪声分布的均值，仅在Gauss和Laplace生效。默认值为0 scale：噪声分布的标准差，仅在Gauss和Laplance生效。默认值为1 lam：泊松分布的lambda系数，仅在Poisson有效。默认值为2 p：对于每个

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
数据集管理 - AI开发平台ModelArts

数据集管理查询数据集列表创建数据集查询数据集详情更新数据集删除数据集父主题：数据管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理
节点池管理 - AI开发平台ModelArts

节点池管理查询节点池列表创建节点池查询指定节点池详情更新节点池删除节点池查询节点池的节点列表

 帮助中心 > AI开发平台ModelArts > API参考

总条数： 832

上一页
1
...
15
16
17
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备代码 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

在ModelArts中使用边缘节点部署边缘服务时能否使用http接口协议？ - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

重置AppCode - AI开发平台ModelArts

训练作业日志中提示 “AttributeError: module '' has no attribute ''” - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

查询支持的镜像列表 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

通过SSH工具远程使用Notebook - AI开发平台ModelArts

查询数据集详情 - AI开发平台ModelArts

创建ModelArts数据增强任务 - AI开发平台ModelArts

数据集管理 - AI开发平台ModelArts

节点池管理 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线