搜索_华为云

查看Notebook实例事件 - AI开发平台ModelArts

StartNotebookFailed 实例启动失败紧急 PullImageFailed 镜像拉取失败紧急 CreateKernelFailed conda命令不可用导致创建jupyter kernel失败（The jupyter launcher page does not contain the

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

包结构说明。获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。模型软件包结构说明本教程需要使用到的AscendCloud-6.3.907中的AscendCloud-LLM-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

包结构说明。获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。模型软件包结构说明本教程需要使用到的AscendCloud-6.3.909中的AscendCloud-LLM-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

包结构说明。获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。模型软件包结构说明本教程需要使用到的AscendCloud-6.3.908中的AscendCloud-LLM-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 准备工作
成本管理 - AI开发平台ModelArts
成本管理 - AI开发平台ModelArts

资源成本和运维成本构成。成本分配 ModelArts支持企业项目管理，可以由企业项目服务来管理同一账号下不同项目的成本。成本分析通过华为云费用账单来分析账号下的成本支出情况。成本优化长期使用的资源，建议客户使用更优惠的方式购买（包年包月）；针对临时使用的资源，您可选择按需的资源规格，避免浪费。

帮助中心 > AI开发平台ModelArts > 计费说明
部署上线失败 - AI开发平台ModelArts

部署上线失败出现此问题，一般是因为后台服务故障导致的，建议稍等片刻，然后重新部署在线服务。如果重试超过3次仍无法解决，请获取如下信息，并联系华为云技术支持协助解决故障。获取服务ID。进入“部署上线>在线服务”页面，在服务列表中找到自动学习任务中部署的在线服务，自动学习部署的服务

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 部署上线
模型发布失败 - AI开发平台ModelArts

模型发布失败出现此问题，一般是因为后台服务故障导致的，建议稍等片刻，然后重新创建训练作业。如果重试超过3次仍无法解决，请获取如下信息，并联系华为云技术支持协助解决故障。获取模型ID。进入“AI应用管理>AI应用”页面，在AI应用列表中找到自动学习任务中自动创建的模型，自动学习产

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 模型发布
使用AWQ量化工具转换权重 - AI开发平台ModelArts

5-72B-Chat-AWQ 参数说明： model：模型路径。 Step3 启动AWQ量化服务参考Step3 启动推理服务，在启动服务时添加如下命令。 --q awq 或者--quantization awq 父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
订阅免费算法 - AI开发平台ModelArts

单击“继续订阅”即可成功订阅。如果订阅是没有使用约束的算法，则直接成功订阅。如果订阅的是非华为云官方资产，则会弹出“温馨提示”页面，勾选并阅读《数据安全与隐私风险承担条款》和《华为云AI Gallery服务协议》后，单击“继续订阅”才能继续进行算法订阅。算法被订阅后，详情页

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
配置ModelArts委托权限 - AI开发平台ModelArts

配置ModelArts委托权限给用户配置ModelArts委托授权，允许ModelArts服务在运行时访问OBS等依赖服务。使用华为云账号登录ModelArts管理控制台，在左侧导航栏单击“权限管理”，进入“权限管理”页面，单击“添加授权”。在弹出的“添加授权”窗口中，选择：

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
发布和管理AI Gallery项目 - AI开发平台ModelArts

/ : * ? " < > | ' &”。选择运行环境：CPU、GPU或ASCEND。勾选“我已阅读并同意《华为云AI Gallery数字内容发布协议》和《华为云AI Gallery服务协议》”。图2 发布AI Gallery Notebook 界面提示成功创建分享后，返回至AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
使用kv-cache-int8量化 - AI开发平台ModelArts

8的scale系数的抽取和加载。 Step3 启动kv-cache-int8量化服务参考Step3 启动推理服务，启动推理服务时添加如下命令。 --kv-cache-dtype int8 #只支持int8，表示kvint8量化 --quantization-param-path

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

8的scale系数的抽取和加载。 Step3 启动kv-cache-int8量化服务参考Step3 启动推理服务，启动推理服务时添加如下命令。 --kv-cache-dtype int8 #只支持int8，表示kvint8量化 --quantization-param-path

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
动态shape - AI开发平台ModelArts
动态shape - AI开发平台ModelArts

input_shape=input.1:[-1,3,224,224] dynamic_dims=[1~4],[8],[16] 在执行convert_lite命令时，指定--configFile=config.ini即可自动编译指定的动态shape。 #shell converter_lite --modelFile=resnet50

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
使用kv-cache-int8量化 - AI开发平台ModelArts

8的scale系数的抽取和加载。 Step3 启动kv-cache-int8量化服务参考Step3 启动推理服务，启动推理服务时添加如下命令。 --kv-cache-dtype int8 #只支持int8，表示kvint8量化 --quantization-param-path

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

软件包名称中的xxx表示时间戳。包含了本教程中使用到的模型训练代码。代码包具体说明请参见模型软件包结构说明。获取路径：Support-E 请联系您所在企业的华为方技术支持下载获取。模型软件包结构说明 AscendCloud-3rdLLM代码包结构介绍如下，训练脚本以分类的方式集中在scripts文件夹中：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
精度问题处理 - AI开发平台ModelArts

[ascend_context] precision_mode=enforce_fp32 #使用 fp32 其他方式需要实际分析算子层面的差异，需要联系华为工程师进行具体分析。父主题：模型精度调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 模型精度调优
审计与日志 - AI开发平台ModelArts

审计与日志审计云审计服务（Cloud Trace Service，CTS），是华为云安全解决方案中专业的日志审计服务，提供对各种云资源操作记录的收集、存储和查询功能，可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。用户开通云审计服务并创建和配置追踪任务后，C

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
推理部署使用场景 - AI开发平台ModelArts

者批量生成推理结果。图1 推理简介训练模型：可以在ModelArts服务中进行，也可以在您的本地开发环境进行，本地开发的模型需要上传到华为云OBS服务。创建AI应用：把模型文件和推理文件导入到ModelArts的模型仓库中，进行版本化管理，并构建为可运行的AI应用。部署服

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
使用kv-cache-int8量化 - AI开发平台ModelArts

8的scale系数的抽取和加载。 Step3 启动kv-cache-int8量化服务参考Step3 启动推理服务，启动推理服务时添加如下命令。 --kv-cache-dtype int8 #只支持int8，表示kvint8量化 --quantization-param-path

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化

总条数： 1070

上一页
1
...
46
47
48
...
54
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看Notebook实例事件 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

成本管理 - AI开发平台ModelArts

部署上线失败 - AI开发平台ModelArts

模型发布失败 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

订阅免费算法 - AI开发平台ModelArts

配置ModelArts委托权限 - AI开发平台ModelArts

发布和管理AI Gallery项目 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

动态shape - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

精度问题处理 - AI开发平台ModelArts

审计与日志 - AI开发平台ModelArts

推理部署使用场景 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线