检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
边缘节点部署模式下,使用的纳管节点为客户机器或者云上虚机,TICS服务无法主动感知到节点资源大小,需客户手动填入。 图1 资源分配策略 这样就会有不合理的资源分配场景出现,最终导致计算节点容器因资源不足启动失败。 约束条件 约束条件如下: TICS计算节点需独享ief纳管节点。
节点的可用资源如何查询? 查询节点的可用资源 云平台提供的云监控,可以对节点运行状态进行日常监控。您可以通过管理控制台,直观地查看节点的各项监控指标。 由于监控数据的获取与传输会花费一定时间,因此,云监控显示的是当前时间5~10分钟前的节点状态。
购买Model Lite资源池 前提条件 已购买ModelArts服务。 操作步骤 以主账号登录ModelArts管理控制台。 在控制台左下方,单击“专属资源池”下拉框,选择“弹性集群”,进入资源池创建页面。 在资源池创建页面,单击“创建”,进入购买专属资源池页面。
为防止资源滥用,平台限定了各服务资源的配额,对用户的资源数量和容量做了限制。如您最多可以创建多少台弹性云服务器、多少块云硬盘。 如果当前资源配额限制无法满足使用需要,您可以申请扩大配额。 怎样查看我的配额? 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。
实例管理页面上方展示了计算节点资源使用概况,分别为当前节点的多方安全计算和可信联邦学习的CPU资源当前使用量,并每分钟刷新一次。
该服务提供用户身份认证、权限分配、访问控制等功能,可以帮助您安全的控制华为云资源的访问。 通过IAM,您可以在华为账号中给员工创建IAM用户,并授权来控制他们对华为云资源的访问范围。
通过IAM,您可以: 根据企业的业务组织,在您的华为账号中,给企业中不同职能部门的员工创建IAM用户,让员工拥有唯一安全凭证,并使用TICS资源。 根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。
使用场景 连接器使用场景:参与方的数据信息分布在不同的资源服务上,即可通过连接器管理功能来快速连接到名下的各类资源服务。 数据创建使用场景:参与方加入空间后,需要提供自己的数据集信息,用户即可通过数据创建功能,获取到名下详细的资源列表。
计算节点所在虚机的IP:Port 调用计算节点API时,需要获取TICS服务计算节点所在虚机的IP:Port。 获取计算节点所在虚机的IP:Port 用户可在对应页面查看计算节点所在虚机的IP:Port。 用户登录TICS控制台。 进入TICS控制台后,单击页面左侧“计算节点管理”
用区域和可用区来描述数据中心的位置,您可以在特定的区域、可用区创建资源。 区域(Region)指物理的数据中心。每个区域完全独立,这样可以实现较大程度的容错能力和稳定性。资源创建成功后不能更换区域。
图1 注册ma资源池 创建可信联邦学习训练型作业 参考步骤创建横向训练型作业创建可信联邦学习训练型作业,运行环境选择ModelArts和PriorityModelArts时,新增的资源配额是使用MA Lite资源池进行训练时,工作负载需要配置的资源参数。
云的每个区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以区域默认单位为项目进行授权,IAM用户可以访问您账号中该区域的所有资源。
空间API应用示例 本节通过cURL方式调用TICS API,获取TICS相关资源信息为例,介绍使用TICS管理面API的基本流程。 获取用户token 获取用户的token,因为在后续的请求中需要将token放到请求消息头中作为认证。
项目 区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以默认项目为单位进行授权,用户可以访问您账号中该区域的所有资源。
CCE服务委托授权 由于CCE在运行中对计算、存储、网络以及监控等各类云服务资源都存在依赖关系,因此当您首次登录CCE控制台时,CCE将自动请求获取当前区域下的云资源权限,从而更好地为您提供服务。
CCE服务委托授权 由于CCE在运行中对计算、存储、网络以及监控等各类云服务资源都存在依赖关系,因此当您首次登录CCE控制台时,CCE将自动请求获取当前区域下的云资源权限,从而更好地为您提供服务。
创建连接器 连接器用来快速连接到用户名下的各类资源服务。 前提条件 计算节点处于运行中,且所在空间信息的“认证状态”为“已认证”。 建议使用者提前了解MapReduce服务(MRS Hive)集群。
创建连接器 连接器用来快速连接到用户名下的各类资源服务。 前提条件 计算节点处于运行中,且所在空间信息的“认证状态”为“已认证”。 建议使用者提前了解MapReduce服务(MRS Hive)集群。
TICS执行作业时,如果当前环境资源不足,会将任务缓存入队列中。任务队列长度默认为10。当空间缓存的任务超出长度时,界面会提示报错。 您可以通过TICS空间页查看是否有作业等待中或正在运行,等待任务运行完成或者停止其他任务后,再执行作业。
问题分析 该报错大概率是资源配额不足导致作业执行失败。 解决方案 如果是纵向联邦学习作业,您可以在该纵向联邦作业详情页面尝试新增内存配额和CPU配额,然后重新执行作业。