搜索_华为云

分离部署推理服务 - AI开发平台ModelArts

描述 model 是无 Str 通过OpenAI服务API接口启动服务时，推理请求必须填写此参数。取值必须和启动推理服务时的model ${container_model_path}参数保持一致。通过vLLM服务API接口启动服务时，推理请求不涉及此参数。 prompt 是 -

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
分离部署推理服务 - AI开发平台ModelArts

描述 model 是无 Str 通过OpenAI服务API接口启动服务时，推理请求必须填写此参数。取值必须和启动推理服务时的model ${container_model_path}参数保持一致。通过vLLM服务API接口启动服务时，推理请求不涉及此参数。 prompt 是 -

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
部署推理服务 - AI开发平台ModelArts

e。通过vLLM服务API接口启动服务在ascend_vllm目录下通过vLLM服务API接口启动服务，具体操作命令如下，API Server的命令相关参数说明如下，可以根据参数说明修改配置。 python -m vllm.entrypoints.api_server --model

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

方式二：通过vLLM服务API接口启动服务 source /home/ma-user/.bashrc export ASCEND_RT_VISIBLE_DEVICES=${ASCEND_RT_VISIBLE_DEVICES} python -m vllm.entrypoints.api_server

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在Step3中的terminal部署并启动推理服务。有2种方式，使用vllm-api启动推理服务，或者使用openai-api启动推理服务。参考命令如下： # 使用vllm-api python vllm/entrypoints/api_server.py \ --model="${model_path}"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
使用PyCharm上传数据至Notebook - AI开发平台ModelArts

S桶。将OBS中的数据传至Notebook中，通过在本地IDE的Terminal中使用ModelArts提供的Moxing库的文件操作API（mox.file.copy_parallel）完成。在PyCharm环境中开启Terminal，VS Code中操作类似。图2 PyCharm环境开启Terminal

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
在推理生产环境中部署推理服务 - AI开发平台ModelArts

方式二：通过vLLM服务API接口启动服务 source /home/ma-user/.bashrc export ASCEND_RT_VISIBLE_DEVICES=${ASCEND_RT_VISIBLE_DEVICES} python -m vllm.entrypoints.api_server

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
管理训练容器环境变量 - AI开发平台ModelArts

po.myhuaweicloud.com/repository/pypi/simple/” MA_APIGW_ENDPOINT ModelArts API网关地址。 “MA_APIGW_ENDPOINT=https://modelarts.region..myhuaweicloud

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
准备镜像环境 - AI开发平台ModelArts

er资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.907）
准备镜像环境 - AI开发平台ModelArts

er资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.907）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

方式二：通过vLLM服务API接口启动服务在llm_inference/ascend_vllm/目录下通过vLLM服务API接口启动服务，具体操作命令如下，API Server的命令相关参数说明如下，可以根据参数说明修改配置。 python -m vllm.entrypoints.api_server

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
发布和管理AI Gallery项目 - AI开发平台ModelArts

/ : * ? " < > | ' &”。选择运行环境：CPU、GPU或ASCEND。勾选“我已阅读并同意《华为云AI Gallery数字内容发布协议》和《华为云AI Gallery服务协议》”。图2 发布AI Gallery Notebook 界面提示成功创建分享后，返回至AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
模型调试 - AI开发平台ModelArts
模型调试 - AI开发平台ModelArts

的dependencies字段中读取需要安装的依赖包。 apis 否 String 模型提供的推理接口列表，默认为空。如果已在模型配置文件中配置apis信息时，则可不填，后台自动从配置文件中的apis字段读取所配置的推理接口信息。表2 Environment参数说明参数是否必选

 帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

方式二：通过vLLM服务API接口启动服务在llm_inference/ascend_vllm/目录下通过vLLM服务API接口启动服务，具体操作命令如下，API Server的命令相关参数说明如下，可以根据参数说明修改配置。 python -m vllm.entrypoints.api_server

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

6455，后由RFC 7936补充规范。Web IDL中的WebSocket API由W3C标准化。 WebSocket使得客户端和服务器之间的数据交换变得更加简单，允许服务端主动向客户端推送数据。在WebSocket API中，浏览器和服务器只需要完成一次握手，两者之间就可以建立持久性的连接，并进行双向数据传输。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
如何对OBS的文件重命名？ - AI开发平台ModelArts

由于OBS管理控制台不支持对OBS的文件重命名，当您需要对OBS文件进行重命名时需要通过调用MoXing API实现，在已有的或者新创建的Notebook中，执行如下命令，通过接口对OBS中的文件进行重命名。具体操作如下：如下示例为将文件“obs_file.txt”重命名为“obs_file_2

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 数据存储
GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

A系列裸金属服务器上测试RoCE性能带宽。前提条件 GPU A系列裸金属服务器已经安装了IB驱动。（网卡设备名称可以使用ibstatus或者ibstat获取。华为云Ant8裸金属服务器使用Ubuntu20.04操作系统默认已经安装IB驱动。）操作步骤方法1：使用mlx硬件计数器，估算ROCE网卡收发流量

 帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
Open-Clip基于DevServer适配PyTorch NPU训练指导 - AI开发平台ModelArts

本方案介绍了在ModelArts的DevServer上使用昇腾NPU计算资源开展Open-clip训练的详细过程。完成本方案的部署，需要先联系您所在企业的华为方技术支持购买DevServer资源。本方案目前仅适用于企业客户。资源规格要求推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
精度问题处理 - AI开发平台ModelArts

[ascend_context] precision_mode=enforce_fp32 #使用 fp32 其他方式需要实际分析算子层面的差异，需要联系华为工程师进行具体分析。父主题：模型精度调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优
AIGC工具tailor使用指导 - AI开发平台ModelArts

pip install tailor-0.3.4-py3-none-any.whl 使用指导 tailor支持“命令行”和“Python API”两种方式使用。命令行方式命令行运行样例： tailor --model_path="./resnet50-v2-7.onnx"--config_path="

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理

总条数： 1234

上一页
1
...
46
47
48
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

使用PyCharm上传数据至Notebook - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

发布和管理AI Gallery项目 - AI开发平台ModelArts

模型调试 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

如何对OBS的文件重命名？ - AI开发平台ModelArts

GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

Open-Clip基于DevServer适配PyTorch NPU训练指导 - AI开发平台ModelArts

精度问题处理 - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线