检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
签策略,则需按照标签策略规则为资源添加标签。标签如果不符合标签策略的规则,则可能会导致资源创建失败,请联系组织管理员了解标签策略详情。 父主题: 一般性问题
4-cp36-cp36m-manylinux1_x86_64.whl tensorflow-1.8.0-cp36-cp36m-manylinux1_x86_64.whl 父主题: 编写训练代码
以在ModelArts创建自己独立的工作空间,但是无法使用跟企业项目相关的功能。 工作空间为白名单功能,使用该功能需要提工单申请开通。 父主题: 基于ModelArts Standard运行GPU训练任务
--nproc_per_node 2 examples/sd_inference_example.py --dynamo --parallel 父主题: AIGC模型训练推理
error_code String 调用失败时的错误码。调用成功时无此字段。 error_msg String 调用失败时的错误信息。调用成功时无此字段。 父主题: OBS管理
释放Lite Cluster资源:针对不再使用的Lite Cluster资源,您可以释放资源。 图1 Lite Cluster资源管理介绍 父主题: Lite Cluster资源管理
盘空间不足,请联系系统管理员,更换合适的规格。 如果是大模型导入的AI应用部署服务,请确保专属资源池磁盘空间大于1T(1000GB)。 父主题: 服务部署
oud/”目录下的所有信息,请参考清理临时文件步骤对文件进行清理,然后再制作镜像。CCE重新纳管服务器A时, 使用最新制作的镜像即可。 父主题: Lite Server
"algorithm_names" : [ "AutoCompress" ] } ] } 状态码 状态码 描述 200 ok 错误码 请参见错误码。 父主题: 训练管理
"internal error" } 状态码 状态码 描述 200 OK。 500 Internal error 错误码 请参见错误码。 父主题: 资源管理
删除网络 当AI业务开发不再需要使用网络时,您可以删除网络。 在“网络”页签,单击某个网络操作列的“删除”。 确认删除,单击“确定”即可。 父主题: 管理Standard专属资源池
Tool接口参考中的指导。 NPU上的网卡在哪里可以看到, 会健康检查吗? 8*NPU的网卡为机头上配置的四个2*100GE网卡。华为云有网卡健康状态监控机制。 父主题: Lite Server
在线服务”页面,等待服务状态变为“运行中”时,表示服务部署成功。单击操作列的“预测”,进入服务详情页的“预测”页面。上传图片,预测结果。 父主题: 制作自定义镜像用于推理
查看无业务节点 滚动驱动升级时,驱动异常的节点对升级无影响,会和驱动正常的节点一起升级。 图2 驱动升级 选择完成后,单击“确定”开始驱动升级。 父主题: Lite Cluster资源管理
抽取kv-cache量化系数生成的json文件路径; 如果只测试推理功能和性能,不需要此json文件,此时scale系数默认为1,但是可能会造成精度下降。 父主题: 推理模型量化
抽取kv-cache量化系数生成的json文件路径; 如果只测试推理功能和性能,不需要此json文件,此时scale系数默认为1,但是可能会造成精度下降。 父主题: 推理模型量化
"Backend unavailable", "error_code": "APIG.0202" 该报错信息需要检查dispatcher实例是否正常。 父主题: Standard推理部署
Code,重新从Notebook实例列表页面打开VS Code(注意:需要关闭本地vscode,不然可能会报多个安装进程正在运行中)。 父主题: VS Code连接开发环境失败常见问题
环境变量NCCL_IB_TIMEOUT用于控制InfiniBand Verbs超时。NCCL使用的默认值为18,取值范围是1~22。 父主题: 训练作业运行失败
"Plugintemplate {name} not found." } 状态码 状态码 描述 200 OK。 404 Not Found。 错误码 请参见错误码。 父主题: 资源管理