检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
这种方式不灵活,不推荐使用。 如果用户是通过IEF提供的API接口方式获取的终端设备,那么可以在app内通过使用查询终端设备详情的接口获取最新的终端设备内容。请参见查询终端设备详情。 父主题: 边缘节点
作用等同于ROLLBACK,早期SQL使用的是ABORT,现在推荐使用ROLLBACK。 注意事项 在事务外部执行ABORT语句不会影响事务的执行,但会返回一个NOTICE信息。
推荐使用“西南-贵阳一”Region上的昇腾资源。 创建OBS桶 ModelArts使用对象存储服务(Object Storage Service,简称OBS)进行数据存储以及模型的备份和快照,实现安全、高可靠和低成本的存储需求。
图1 创建SFS Turbo 其中,文件系统类型推荐选用500MB/s/TiB或1000MB/s/TiB,应用于AI大模型场景中。存储容量推荐使用 6.0~10.8TB ,以存储更多模型文件。
推荐使用“西南-贵阳一”Region上的DevServer和昇腾Snt9b资源。 安装过程需要连接互联网git clone,确保容器可以访问公网。 Step1 检查环境 SSH登录机器后,检查NPU设备检查。运行如下命令,返回NPU设备信息。
资源规格要求 推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B。
推荐使用“西南-贵阳一”Region上的Cluster和昇腾Snt9b资源。 安装过程需要连接互联网git clone,确保集群可以访问公网。 Step1 上传权重文件 将权重文件上传到集群节点机器中。权重文件的格式要求为Huggingface格式。
以下值是在gpu-memory-utilization为0.9时测试得出,为服务部署所需的最小昇腾卡数及该卡数下推荐的最大max-model-len长度,不代表最佳性能。
以下值是在gpu-memory-utilization为0.9时测试得出,为服务部署所需的最小昇腾卡数及该卡数下推荐的最大max-model-len长度,不代表最佳性能。
以下值是在gpu-memory-utilization为0.9时测试得出,为服务部署所需的最小昇腾卡数及该卡数下推荐的最大max-model-len长度,不代表最佳性能。
以下值是在gpu-memory-utilization为0.9时测试得出,为服务部署所需的最小昇腾卡数及该卡数下推荐的最大max-model-len长度,不代表最佳性能。
以下值是在gpu-memory-utilization为0.9时测试得出,为服务部署所需的最小昇腾卡数及该卡数下推荐的最大max-model-len长度,不代表最佳性能。
推荐使用“西南-贵阳一”Region上的昇腾资源。 创建OBS桶 ModelArts使用对象存储服务(Object Storage Service,简称OBS)进行数据存储以及模型的备份和快照,实现安全、高可靠和低成本的存储需求。
推荐使用“${{ env.version }}”表达式形式,支持搭配多种操作符和函数,功能更丰富,表达式编写请参考流水线执行条件表达式。 父主题: YAML语法规范
短连接性能差,推荐使用带有连接池的客户端。 如果只是用于数据缓存,容忍数据丢失,建议关闭持久化。 大Key/热Key的优化方法,请参考下表。 类别 方法 大Key 进行大Key拆分。
建议与总结 在创建训练作业前,推荐您先使用ModelArts开发环境调试训练代码,避免代码迁移过程中的错误。 直接使用线上notebook环境调试请参考使用JupyterLab开发模型。
作用等同于ROLLBACK,早期SQL使用的是ABORT,现在推荐使用ROLLBACK。 注意事项 在事务外部执行ABORT语句不会影响事务的执行,但会返回一个NOTICE信息。
hint的推荐使用场景可以参考各GUC参数的说明,此处不作赘述。
包年/包月:客户可通过预付费,以包年/包月模式购买云服务,这种购买方式相对于按需付费提供更大的折扣,对于长期使用者,推荐该计费模式。购买的云服务和开通/使用的云服务实例一一对应和绑定。
进行调整,使目的端推荐系统盘不超过1TB后,再进行迁移。 父主题: 错误码排查与解决方法