搜索_华为云

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

步骤五：训练生成权重转换成可以支持vLLM推理的格式如果需要增加模型量化功能，启动推理服务前，先参考推理模型量化章节对模型做量化处理。启动服务与请求。此处提供vLLM服务API接口启动和OpenAI服务API接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/l

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
通过SSH工具远程使用Notebook - AI开发平台ModelArts

准备好密钥对文件。密钥对在用户第一次创建时，自动下载，之后使用相同的密钥时不会再有下载界面（用户一定要保存好），或者每次都使用新的密钥对。 Step1 安装SSH工具下载并安装SSH远程连接工具，以PuTTY为例，下载链接。 Step2 使用puttygen将密钥对.pem文件转成.ppk文件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

开启，因为性能会有损失。如果需要增加模型量化功能，启动推理服务前，先参考推理模型量化章节对模型做量化处理。启动服务与请求。此处提供vLLM服务API接口启动和OpenAI服务API接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/l

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
构建条件节点控制分支执行 - AI开发平台ModelArts

条件节点 condition_step = wf.steps.ConditionStep( name="condition_step_test", # 条件节点的名称，命名规范(只能包含英文字母、数字、下划线（_）、中划线（-），并且只能以英文字母开头，长度限制为64字符)，一

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
在推理生产环境中部署推理服务 - AI开发平台ModelArts

和BF16数据类型推理。float16表示FP16，bfloat16表示BF16。其他参数可以根据实际情况进行配置，也可使用openai接口启动服务。推理启动脚本必须名为run_vllm.sh，不可修改其他名称。 hostname和port也必须分别是0.0.0.0和8080不可更改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
获取样本搜索条件 - AI开发平台ModelArts

"#3399ff" } } ], "metadata" : { }, "labelers" : [ "human/test_123/test_123", "human/xxx@xxx.com", "human/xxx@xxx.com" ] } 状态码状态码描述 200

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？ - AI开发平台ModelArts

在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？ ModelArts提供多版本支持和灵活的流量策略，您可以通过使用灰度发布，实现模型版本的平滑过渡升级。修改服务部署新版本模型或者切换模型版本时，原服务预测API不会变化。调整模型版本的操作可以参考如下的步骤。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
使用PyCharm手动连接Notebook - AI开发平台ModelArts

huaweicloud.com）和端口号。图1 Notebook实例详情页面准备好密钥对。密钥对在用户第一次创建时，自动下载，之后使用相同的密钥时不会再有下载界面（用户一定要保存好），或者每次都使用新的密钥对。 Step1 配置SSH 在本地的PyCharm开发环境中，单击File ->

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
推理精度测试 - AI开发平台ModelArts

fig_pip_str设置对应的代理和pip源，来确保当前代理和pip源可用。精度评测新建一个conda环境，确保之前启动服务为vllm接口，进入到benchmark_eval目录下，执行如下命令。命令中的$work_dir 是benchmark_eval的绝对路径。 conda

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
更新训练作业参数 - AI开发平台ModelArts

参数类型说明 config_desc 否 String 对训练作业的描述，默认为空，字符串的长度限制为[0，256]。 worker_server_num 是 Integer 训练作业worker的个数，最大值请从查询作业资源规格接口获取。 app_url 是 String 训练作业的

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
自定义脚本代码示例 - AI开发平台ModelArts

明请见模型推理代码编写说明。 Tensorflow TensorFlow存在两种接口类型，keras接口和tf接口，其训练和保存模型的代码存在差异，但是推理代码编写方式一致。训练模型（keras接口） 1 2 3 4 5 6 7 8 9 10 11 12 13

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
导入模型 - AI开发平台ModelArts
导入模型 - AI开发平台ModelArts

String 模型提供的推理接口列表，默认为空。如果已在模型配置文件中配置apis信息时，则可不填，后台自动从配置文件中的apis字段读取所配置的推理接口信息。表3 params结构参数是否必选参数类型描述 url 是 String 模型推理接口的请求路径。 param_name

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
停止Notebook实例 - AI开发平台ModelArts

SSH：可以通过SSH协议远程连接Notebook。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。 service String 访问Notebook的途径，枚举值如下： NOTEBOOK：可以通过https协议访问Notebook。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

说明实际情况（请填写）项目名称项目名称，例如：XXX项目。 - 使用场景例如：使用YOLOv5算法对工地的视频流裁帧后进行安全帽检测。使用BertBase算法对用户在app上购买商品后的评论进行理解。 - CPU架构 X86/ARM，自有软件是否支持ARM。例如：4

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
创建训练作业参数 - AI开发平台ModelArts

名称。 config_desc 否 String 对训练作业的描述，默认为空，字符串的长度限制为[0，256]。 worker_server_num 是 Integer 训练作业worker的个数，最大值请从查询作业资源规格接口获取。 app_url 是 String 训练作业的

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
推理精度测试 - AI开发平台ModelArts

fig_pip_str设置对应的代理和pip源，来确保当前代理和pip源可用。精度评测新建一个conda环境，确保之前启动服务为vllm接口，进入到benchmark_eval目录下，执行如下命令。命令中的$work_dir 是benchmark_eval的绝对路径。 conda

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

方式一：使用vLLM接口请求服务，命令参考如下。 curl http://localhost:8080/generate -d '{"prompt": "hello", "temperature":0, "max_tokens":20}' vLLM接口请求参数说明参考：https://docs

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
策略及授权项说明 - AI开发平台ModelArts

要求。如果您要允许或是禁止某个接口的操作权限，请使用细粒度策略。帐号具备所有接口的调用权限，如果使用帐号下的IAM用户发起API请求时，该IAM用户必须具备调用该接口所需的权限，否则，API请求将调用失败。每个接口所需要的权限，与各个接口所对应的授权项相对应，只有发起请求的用

 帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
启动Notebook实例 - AI开发平台ModelArts

SSH：可以通过SSH协议远程连接Notebook。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。 service String 访问Notebook的途径，枚举值如下： NOTEBOOK：可以通过https协议访问Notebook。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

支持vLLM推理的格式。如果需要增加模型量化功能，启动推理服务前，先参考推理模型量化章节对模型做量化处理。启动服务与请求。此处提供vLLM服务API接口启动和OpenAI服务API接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/l

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）

总条数： 837

上一页
1
...
13
14
15
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

通过SSH工具远程使用Notebook - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

构建条件节点控制分支执行 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

获取样本搜索条件 - AI开发平台ModelArts

在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？ - AI开发平台ModelArts

使用PyCharm手动连接Notebook - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

更新训练作业参数 - AI开发平台ModelArts

自定义脚本代码示例 - AI开发平台ModelArts

导入模型 - AI开发平台ModelArts

停止Notebook实例 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

创建训练作业参数 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

策略及授权项说明 - AI开发平台ModelArts

启动Notebook实例 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线