搜索_华为云

在Workflow中指定仅运行部分节点 - AI开发平台ModelArts

该示例中Workflow包含了五个节点（节点相关定义已省略），在policy中定义了两个预置场景：模型训练和服务部署，工作流发布至运行态后，部分运行的开关默认关闭，节点全部运行。用户可在权限管理页面打开开关，选择指定的场景进行运行。部分运行能力支持同一个节点被定义在不同的运行场景中，但是需要用户自

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > Workflow高阶能力
非分离部署推理服务 - AI开发平台ModelArts

# eagle投机对基于 https://github.com/SafeAILab/EAGLE/ 版本实现，默认开启 export ENABLE_SPEC_METRIC=0 # 是否关闭投机推理的metric采集功能，关闭有助于提升投机推理性能，默认关闭如果需要使用eagle投机推理功能，需要进入

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
连接远端开发环境时，一直处于"Setting up SSH Host xxx: Downloading VS Code Server locally"超过10分钟以上，如何解决？ - AI开发平台ModelArts

750 -R /home/ma-user/.vscode-server/bin/$commitId 关闭VS Code，重新从Notebook实例列表页面打开VS Code（注意：需要关闭本地vscode，否则可能会报多个安装进程正在运行中）。父主题： VS Code连接开发环境失败故障处理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

export USE_VOCAB_PARALLEL=1 # 是否使用词表并行；默认值为1表示开启并行，取值为0表示关闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
远程连接出现弹窗报错：Could not establish connection to xxx - AI开发平台ModelArts

establish connection to xxx 问题现象原因分析执行VS Code Remote SSH连接失败。解决方法单击弹窗右上角关闭弹窗，查看OUTPUT中的具体报错信息，并参考后续章节列举的几种常见报错解决问题。父主题： VS Code连接开发环境失败故障处理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
使用ModelArts VSCode插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； # 本示例以ak和sk保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_AK和HUAWEICLOUD_SDK_SK。 __AK = os

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境
调用MaaS部署的模型服务 - AI开发平台ModelArts

影响。否，停用内容审核服务，将不会审核模型推理中的输入输出，模型服务可能会有违规风险，请谨慎关闭。关闭“内容审核”开关，需要在弹窗中确认是否停用内容审核服务，勾选后，单击“确定”关闭。复制调用示例，修改参数后用于业务环境调用模型服务API。 Python示例代码如下所示：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
推理服务精度评测 - AI开发平台ModelArts

${output_path} --device cuda 参数说明： enable_lora=True表示开启multi-lora的精度验证。如果不开启multi-lora的精度验证，不体现enable_lora参数即可。 lora_local_path=${lora_local_path}是挂载适

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

'{"prompt": "hello", "temperature":0, "max_tokens":20}' vLLM接口请求参数说明参考：https://docs.vllm.ai/en/stable/dev/sampling_params.html 方式二：使用OpenAI接口请求服务，命令参考如下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
配置kubectl工具 - AI开发平台ModelArts

完成公网地址绑定后，在“集群信息”找到“连接信息”，单击kubectl后的“配置”按钮。按照界面提示步骤操作即可。图5 配置kubectl 验证。在安装了kubectl工具的机器上执行如下命令，显示集群节点即为成功。 kubectl get node 父主题： Lite Cluster资源配置

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
查看批量服务详情 - AI开发平台ModelArts

本次批量服务中，输入数据的OBS路径。输出数据目录位置本次批量服务中，输出数据的OBS路径。模型名称＆版本本次批量服务所使用的模型名称及版本。运行日志输出默认关闭，批量服务的运行日志仅存放在ModelArts日志系统。启用运行日志输出后，批量服务的运行日志会输出存放到云日志服务LTS。LTS自动创

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

# eagle投机对基于 https://github.com/SafeAILab/EAGLE/ 版本实现 xport ENABLE_SPEC_METRIC=0 # 是否关闭投机推理的metric采集功能，关闭有助于提升投机推理性能，默认关闭如果需要使用eagle投机推理功能，需要进入

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

export USE_VOCAB_PARALLEL=1 # 是否使用词表并行；默认值为1表示开启并行，取值为0表示关闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

#查询nginx进程 ps -ef |grep nginx #关闭所有nginx相关进程 kill -9 {进程ID} #运行run.sh脚本 sh run.sh 也可以执行pkill nginx命令直接关闭所有nginx进程。 #关闭所有nginx进程 pkill nginx #运行run

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

成部分，而训练看板的标签包含：标量可视化、图像可视化和计算图可视化等。更多功能介绍请参见TensorBoard官网资料。关闭TensorBoard 关闭TensorBoard方式如下：单击下图所示的，进入TensorBoard实例管理界面，该界面记录了所有启动的Tensor

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
infiniband驱动的安装 - AI开发平台ModelArts

rm -rf MLNX_OFED_LINUX-4.3-1.0.1.0-ubuntu16.04-x86_64 USER ma-user 验证infiniband驱动是否安装成功。在训练代码中执行以下命令，如果无报错则infiniband驱动安装成功： os.system("ofed_info")

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
创建IAM用户并授权使用ModelArts - AI开发平台ModelArts

将子用户子账号加入用户组。在“加入用户组”步骤中，选择“用户组”，然后单击“创建用户”。系统将前面设置的多个用户加入用户组中。用户登录并验证权限。新创建的用户登录控制台，切换至授权区域，验证权限：在“服务列表”中选择ModelArts，进入ModelArts主界面，选择不同类型的专属资源池，在页面单

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
部署推理服务 - AI开发平台ModelArts

export USE_VOCAB_PARALLEL=1 # 是否使用词表并行；默认值为1表示开启并行，取值为0表示关闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
发布Workflow到ModelArts - AI开发平台ModelArts

001,20:0.0001代表0-10个epoch学习率0.001，10-20epoch学习率0.0001),如果不指定epoch, 会根据验证精度情况自动调整学习率，并当精度没有明显提升时，训练停止")), wf.AlgorithmParameters(name="batch_size"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

如果您使用的是自定义镜像导入的模型，请增大自定义镜像中所使用的web server的keep-alive的参数值，尽量避免由服务端发起关闭连接。如您使用的Gunicorn来作为web server，可以通过Gunicorn命令的--keep-alive参数来设置该值。其他方式导入的模型，服务内部已做处理。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测

总条数： 515

上一页
1
...
6
7
8
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Workflow中指定仅运行部分节点 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

连接远端开发环境时，一直处于"Setting up SSH Host xxx: Downloading VS Code Server locally"超过10分钟以上，如何解决？ - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

远程连接出现弹窗报错：Could not establish connection to xxx - AI开发平台ModelArts

使用ModelArts VSCode插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

推理服务精度评测 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

配置kubectl工具 - AI开发平台ModelArts

查看批量服务详情 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

infiniband驱动的安装 - AI开发平台ModelArts

创建IAM用户并授权使用ModelArts - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

发布Workflow到ModelArts - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线