搜索_华为云

部署推理服务 - AI开发平台ModelArts

增加单卡的显存占用。不建议开启词表并行，如确需使用词表切分，配置以下环境变量： export USE_VOCAB_PARALLEL=1 #打开词表切分开关 unset USE_VOCAB_PARALLEL #关闭词表切分开关配置后重启服务生效。 Matmul_all_reduce融合算子。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）
通过Token认证的方式访问在线服务 - AI开发平台ModelArts

方式四：使用Java语言发送预测请求。约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。前提条件已经获取用户Token、预测文件的本地路径、在线服务的调用地址和在线服务的输入参数信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
分离部署推理服务 - AI开发平台ModelArts

`时候生效。 --quantization：如果需要增加模型量化功能，启动推理服务前，先参考使用AWQ量化、使用SmoothQuant量化或使用GPTQ量化章节对模型做量化处理。参数定义和使用方式与vLLM0.5.0版本一致，此处介绍关键参数。详细参数解释请参见https://github

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
配置仪表盘查看指标数据 - AI开发平台ModelArts

集群视图 https://cnnorth4-modelarts-sdk.obs.cn-north-4.myhuaweicloud.com/metrics/grafana/dashboards/ModelArts-Cluster-View.json 节点视图 https://cnnorth4-modelarts-sdk

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标
查询训练作业列表 - AI开发平台ModelArts

必须为/home下的目录； v1兼容模式下，当前字段不生效；当code_dir以file://为前缀时，当前字段不生效。 working_dir String 运行算法时所在的工作目录。规则：v1兼容模式下，当前字段不生效。 environments Array of Map<String

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
通过SSH工具远程使用Notebook - AI开发平台ModelArts

pem文件生成）。单击“Open”。如果首次登录，PuTTY会显示安全警告对话框，询问是否接受服务器的安全证书。单击“Accept”将证书保存到本地注册表中。图6 询问是否接受服务器的安全证书成功连接到云上Notebook实例。图7 连接到云上Notebook实例父主题：使用Notebook进行AI开发调试

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
分离部署推理服务 - AI开发平台ModelArts

`时候生效。 --quantization：如果需要增加模型量化功能，启动推理服务前，先参考使用AWQ量化、使用SmoothQuant量化或使用GPTQ量化章节对模型做量化处理。参数定义和使用方式与vLLM0.6.3版本一致，此处介绍关键参数。详细参数解释请参见https://github

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
分离部署推理服务 - AI开发平台ModelArts

`时候生效。 --quantization：如果需要增加模型量化功能，启动推理服务前，先参考使用AWQ量化、使用SmoothQuant量化或使用GPTQ量化章节对模型做量化处理。参数定义和使用方式与vLLM0.5.0版本一致，此处介绍关键参数。详细参数解释请参见https://github

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
分离部署推理服务 - AI开发平台ModelArts

`时候生效。 --quantization：如果需要增加模型量化功能，启动推理服务前，先参考使用AWQ量化、使用SmoothQuant量化或使用GPTQ量化章节对模型做量化处理。参数定义和使用方式与vLLM0.5.0版本一致，此处介绍关键参数。详细参数解释请参见https://github

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
安全 - AI开发平台ModelArts
安全 - AI开发平台ModelArts

安全责任共担资产识别与管理身份认证与访问控制数据保护技术审计与日志服务韧性监控安全风险故障恢复更新管理认证证书安全边界

 帮助中心 > AI开发平台ModelArts > 产品介绍
创建训练作业 - AI开发平台ModelArts

必须为/home下的目录。 v1兼容模式下，当前字段不生效。当code_dir以file://为前缀时，当前字段不生效。 working_dir 否 String 运行算法时所在的工作目录。规则：v1兼容模式下，当前字段不生效。 job_description 否 String

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
部署推理服务 - AI开发平台ModelArts

增加单卡的显存占用。不建议开启词表并行，如确需使用词表切分，配置以下环境变量： export USE_VOCAB_PARALLEL=1 #打开词表切分开关 unset USE_VOCAB_PARALLEL #关闭词表切分开关配置后重启服务生效。 Matmul_all_reduce融合算子。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.904）
配置模型服务接口地址时需要注意什么格式问题？ - AI开发平台ModelArts

在大部分应用平台内配置模型服务接口地址时，需要去除URL尾部的/chat/completions路径。正确示例：假设原始地址为https://example.com/v1/chat/completions，应简化为https://example.com/v1。获取模型服务接口地址的操作步骤如下：方式一：使用预置服务。

帮助中心 > AI开发平台ModelArts > 常见问题 > Studio
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

会异常；其他模型不建议开启，因为性能会有损失。如果需要增加模型量化功能，启动推理服务前，先参考推理模型量化章节对模型做量化处理。启动服务与请求。此处提供vLLM服务API接口启动和OpenAI服务API接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
查询开发环境实例详情 - AI开发平台ModelArts

链接仓库协议。当前支持：ssh，https。 url String 链接仓库地址。 credential Object 证书信息，请参见表30。表21 credential字段数据结构说明参数参数类型说明 ssh_private_key String ssh私有证书。 access_token

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
创建工作空间 - AI开发平台ModelArts

grants objects 授权用户列表，默认为空。需要与“auth_type”参数配合使用，且仅当授权类型为“INTERNAL”时才会生效。 auth_type 否 String 授权类型。可选值有PUBLIC、PRIVATE、INTERNAL。默认值为PUBLIC。 PUBLIC：租户内部公开访问。

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
快速配置ModelArts委托授权 - AI开发平台ModelArts

单击“确认”，可删除此用户的授权。删除生效后，此用户将无法继续使用ModelArts的相关功能。批量清空所有授权在“权限管理”页面，单击授权列表上方的“清空授权”，输入“DELETE”后单击“确认”，可删除当前账号下的所有授权。删除生效后，此账号及其所有IAM子用户将无法继续使用ModelArts的相关功能。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
ModelArts的Notebook有代理吗？如何关闭？ - AI开发平台ModelArts

ModelArts的Notebook有代理吗？如何关闭？ Notebook有代理。执行env|grep proxy命令查询Notebook代理。执行unset https_proxy unset http_proxy命令关闭代理。父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
变更计费模式 - AI开发平台ModelArts

资源将立即生效。假设用户于2023/04/18 15:29:16购买了一台按需计费的专属资源池，由于业务需要，于2023/04/18 16:30:30执行按需转包年/包月操作，生成类型为“按需转包年/包月”的订单。用户支付订单后，按需转包年/包月的专属资源池立即生效。在“费用中心

 帮助中心 > AI开发平台ModelArts > 计费说明
查询开发环境实例列表 - AI开发平台ModelArts

链接仓库协议。当前支持：ssh，https。 url String 链接仓库地址。 credential Object 证书信息，请参见表23。表23 credential字段数据结构说明参数参数类型说明 ssh_private_key String ssh私有证书。 access_token

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）

总条数： 739

上一页
1
2
3
4
5
...
37
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

部署推理服务 - AI开发平台ModelArts

通过Token认证的方式访问在线服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

配置仪表盘查看指标数据 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

通过SSH工具远程使用Notebook - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

安全 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

配置模型服务接口地址时需要注意什么格式问题？ - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

查询开发环境实例详情 - AI开发平台ModelArts

创建工作空间 - AI开发平台ModelArts

快速配置ModelArts委托授权 - AI开发平台ModelArts

ModelArts的Notebook有代理吗？如何关闭？ - AI开发平台ModelArts

变更计费模式 - AI开发平台ModelArts

查询开发环境实例列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线