华为云用户手册

  • 请求示例 更新项目id为9d80d070b6d44942af73c9c3d38e0429下的防火墙id为7a004e79-0b8b-4679-ab20-267f3946e8ba的 域名 组id为94da194d-24b2-4f60-919e-cf0bc76c75b3,修改名称为test。 https://{Endpoint}/v1/9d80d070b6d44942af73c9c3d38e0429/domain-set/94da194d-24b2-4f60-919e-cf0bc76c75b3?fw_instance_id=7a004e79-0b8b-4679-ab20-267f3946e8ba&enterprise_project_id=default { "name" : "test", "description" : "" }
  • 修订记录 发布日期 修订记录 2024-02-29 新增查看算法详情的指导:查看算法详情 重构创建训练作业的操作指导:创建训练作业 2023-12-29 训练作业挂载SFS Turbo时支持文件夹权限控制:创建训练作业 模型转换提供ATC模型转换工具和MindSpore Lite离线转换模型工具链接:模型转换操作 2023-11-17 补充NPU训练示例:基于训练作业启动PyTorch DDP on Ascend加速卡训练示例 2023-10-01 支持配置容器运行时的用户ID:创建训练作业 Cloud Shell提供问题定位提示:使用Cloud Shell登录训练容器 2023-08-01 新增训练作业支持按资源池维度筛选训练作业功能:停止、重建或查找作业
  • 约束限制 模型转换当前只支持Ascend芯片类型。 模型转换当前仅支持原始框架类型为Caffe和Tensorflow的模型转换。当原始框架类型为Caffe时,输入数据类型为FLOAT;当原始框架类型为Tensorflow时,输入数据类型为INT32、BOOL、UINT8、FLOAT。 ModelArts提供了转换模板供用户选择,只能选择对应模板进行转换,支持的模板描述,请参见转换模板。 针对用于Ascend芯片的模型转换,其转换限制说明可参见“昇腾开发者社区”的约束及参数说明。 压缩/转换任务指定的OBS路径,需确保OBS目录与ModelArts在同一区域。 转换后的模型,再导入ModelArts时,需从模板中选择元模型。 支持模型文件类型为onnx的模型转换,转换时会先将其转换为Tensorflow框架的FrozenGraphDef格式,然后再转换为om格式。转换工具要求onnx版本为1.6.0,opset为9+。 当原始框架类型为Caffe时,模型文件(“.prototxt”)和权重文件(“.caffemodel”)的op name、op type必须保持名称一致(包括大小写)。 当原始框架类型为Caffe时,除了top与bottom相同的layer以外(例如BatchNorm,Scale,ReLU等),其他layer的top名称需要与其name名称保持一致。 当原始框架类型为TensorFlow时,支持FrozenGraphDef格式和SavedModel格式。如果是SavedModel格式,转换时会先将其转换为FrozenGraphDef格式,然后再转换为om格式。 不支持动态shape的输入,例如:NHWC输入为[?,?,?,3]多个维度可任意指定数值。模型转换时需指定固定数值。 输入数据最大支持四维,转维算子(reshape、expanddim等)不能输出五维。 模型中的所有层算子除const算子外,输入和输出需要满足“dim!=0”。 模型转换不支持含有训练算子的模型。 量化(uint8)后的模型不支持模型转换。 模型中的算子只支持2D卷积,暂不支持3D卷积。暂不支持多批量转换batch_normalization_1算子和FusedBatchNorm算子。 只支持Caffe算子清单和Tensorflow算子清单中的算子,并需满足算子限制条件。
  • 查询SIM卡详情 登录 全球SIM联接 控制台,在SIM卡管理页面,单击SIM卡的容器ID可查看指定SIM卡的详细信息。 详细信息类型 说明 基本信息 展示SIM卡基本信息和关联的设备信息,还可对该SIM卡设置标签、添加自定义属性。 套餐管理 展示SIM卡当前在用套餐的详细信息。 用量统计 月用量:展示SIM卡套餐六个月内的月用量统计结果。 用量趋势:展示SIM卡套餐两个月内每日的用量趋势统计结果和用量明细信息。 生命周期 展示SIM卡的生命周期(从下单到销户)变化信息和SIM卡状态变更历史记录(激活、停机、复机 )。 在用状态的SIM卡可在生命周期中单击“停机”进行停机申请,受理完成后(1-2个工作日),SIM卡将会变为停用状态。
  • 当前Python文件 使用此启动配置运行当前在代码编辑器中打开的Python文件。 要在没有手动创建启动配置的时候快速运行Python文件,可以在资源管理器右键单击该文件或其代码编辑器中右键单击,从上下文菜单中选择”在终端中运行 Python 文件”。CodeArts IDE会自动为此文件创建 Python文件启动配置。 之后您就可以从CodeArts IDE主工具栏选择并运行创建的启动配置。 启动配置属性 启动配置示例 父主题: 启动配置
  • 使用Gradle任务进行工作 当您在CodeArts IDE中打开一个Gradle项目时,您可以在Gradle视图中找到列出的Gradle任务。 要运行任务,请执行以下任一操作: 双击任务列表中的任务。 在Gradle视图工具栏上,单击执行Gradle任务按钮()然后在打开的执行Gradle任务弹出窗口中选择所需的任务。 以同样的方式,您可以运行在build.gradle的test任务中定义的测试。在这种情况下,CodeArts IDE将使用Gradle测试运行器。 您还可以通过专用的Gradle启动配置来运行Gradle任务。 有关在CodeArts IDE中测试应用程序的更多信息,请参阅测试。
  • 续费相关的功能 华为云U CS 支持从UCS控制台续费包年/包月资源,如表1所示。 表1 续费相关的功能 功能 计费项 说明 手动续费 UCS集群管理服务 包年/包月的UCS服务从购买到计费周期结束、转换为按需计费之前,您可以随时在UCS控制台为其续费,以继续按优惠价格使用UCS服务。 自动续费 UCS集群管理服务 开通自动续费后,UCS包年/包月套餐包会在每次到期前自动续费,避免因忘记手动续费而导致使用成本增加。
  • 包年/包月服务 对于包年/包月计费模式的云服务,用户在购买时会一次性付费,服务将在到期后自动停止使用。 如果在计费周期内不再使用包年/包月资源,您可以执行退订操作,系统将根据资源是否属于五天无理由退订、是否使用代金券和折扣券等条件返还一定金额到您的账户,详细的退订规则请参见云服务退订规则概览。UCS服务不属于五天无理由退订服务。 如果您已开启“自动续费”功能,为避免继续产生费用,请在自动续费扣款日(默认为到期前7日)之前关闭自动续费。
  • 修订记录 发布日期 修改说明 2023-04-17 第六次正式发布。 新增 计费说明,新增到期后影响描述。 2023-04-10 第五次正式发布。 新增 规格族 2020-12-14 第四次正式发布。 修改 专属计算集群与专属云的关系,完善描述。 2020-03-31 第三次正式发布。 新增 计费说明 2019-05-30 第二次正式发布。 新增 区域和可用区 2018-03-30 第一次正式发布。
  • 计费模式 计费模式:虚拟计算资源池仅支持包年的计费模式,包年计费是先购买再使用的方式,用户在购买时,系统会根据用户所选的机型对用户云账户中的金额进行扣除。 计费周期:以年为计费周期,计费周期以UTC+8时区的时间为准。计费周期的起点是资源开通的时间点(精确到秒),终点是指定使用时长后的第一个 00:00:00。 举例:假设用户在2017年2月1日13:23:56开通资源,计费周期终点是2018年2月2日00:00:00。 计费量纲:以物理服务器台数作为计费量纲。 购买:以年为购买周期,新购物理服务器数量不得少于4台。 续费:以年为续费周期,续费物理服务器数量不少于4台。一个计费周期到期后,您可以选择手动续费或者自动续费,继续使用资源,也可以选择中止服务。 举例:假设用户有8台物理服务器在2018年2月2日00:00:00资源到期,续费服务器数量不得小于4台。续费周期起点是2018年2月2日00:00:00资源到期,终点是2019年2月3日00:00:00。 退款:不支持无理由退款,如果用户要求退款请走工单方式申请。
  • 到期后影响 图1描述了包年专属计算集群资源各个阶段的状态。购买后,在计费周期内资源正常运行,此阶段为有效期;资源到期而未续费时,将陆续进入宽限期和保留期。 图1 包年专属计算集群资源生命周期 到期预警 包年专属计算集群资源在到期前第7天内,系统将向用户推送到期预警消息。预警消息将通过邮件、短信和站内信的方式通知到华为云账号的创建者。 到期后影响 当您的包年专属计算集群资源到期未续费,首先会进入宽限期,资源状态变为“已过期”。宽限期内您可以正常访问包年专属计算集群资源。 如果您在宽限期内仍未续费包年专属计算集群资源,那么就会进入保留期,资源状态变为“已冻结”,您将无法对处于保留期冻结的资源(主机及主机上云服务器实例)执行任何操作。 保留期到期后,若包年专属计算集群资源仍未续费,那么专属计算集群及其内已发放的ECS实例、弹性公网IP、云硬盘和云备份都将被释放,数据无法恢复。
  • 计费项 计费项分为包含服务和关联服务两类。 包含服务: 专属弹性云服务器,您可以在专属虚拟化计算服务中灵活创建多种规格的专属弹性云服务器,专属弹性云服务器免费,但关联的IP、带宽、云硬盘等需要单独收费。 关联服务(用户根据需求单独购买,另行计费): 镜像服务 :对于公共镜像,部分商用操作系统会收取一定的License费用。对于市场镜像,镜像价格以镜像市场中镜像供应商提供的信息为准。 弹性公网IP:按照IP个数来收费。 公网带宽:采用按流量和按带宽两种计费模式。 云硬盘:用户可灵活选择普通云硬盘,专属计算集群硬盘等多种存储方案。云硬盘采用按需计费和包周期计费两种模式,其中,专属计算集群中的云服务器系统盘,仅支持按需计费。 各产品的价格详情,请参见价格计算器。
  • 基本概念 账号 用户注册时的账号,账号对其所拥有的资源及云服务具有完全的访问权限,可以重置用户密码、分配用户权限等。由于账号是付费主体,为了确保账号安全,建议您不要直接使用账号进行日常管理工作,而是创建用户并使用用户进行日常管理工作。 用户 由账号在 IAM 中创建的用户,是云服务的使用人员,具有身份凭证(密码和访问密钥)。 在我的凭证下,您可以查看账号ID和IAM用户ID。通常在调用API的鉴权过程中,您需要用到账号、用户和密码等信息。 区域(Region) 从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Region指面向公共租户提供通用云服务的Region;专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region。 详情请参见区域和可用区。 可用区(AZ,Availability Zone) 一个可用区是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以默认项目为单位进行授权,用户可以访问您账号中该区域的所有资源。如果您希望进行更加精细的权限控制,可以在区域默认的项目中创建子项目,并在子项目中创建资源,然后以子项目为单位进行授权,使得用户仅能访问特定子项目中的资源,使得资源的权限控制更加精确。 图1 项目隔离模型 同样在我的凭证下,您可以查看项目ID。 企业项目 企业项目是项目的升级版,针对企业不同项目间的资源进行分组和管理,是逻辑隔离。企业项目中可以包含多个区域的资源,且项目中的资源可以迁入迁出。 关于企业项目ID的获取及企业项目特性的详细信息,请参见《企业管理用户指南》。 父主题: 使用前必读
  • 官方repo源配置 通过弹性云服务器购买的HCE OS默认镜像,在/etc/yum.repos.d/hce.repo文件中会默认配置官方repo源。以HCE 2.0版本为例,其内容如下: [base] name=HCE $releasever base baseurl=https://repo.huaweicloud.com/hce/$releasever/os/$basearch/ enabled=1 gpgcheck=1 gpgkey=https://repo.huaweicloud.com/hce/$releasever/os/RPM-GPG-KEY-HCE-2 [updates] name=HCE $releasever updates baseurl=https://repo.huaweicloud.com/hce/$releasever/updates/$basearch/ enabled=1 gpgcheck=1 gpgkey=https://repo.huaweicloud.com/hce/$releasever/updates/RPM-GPG-KEY-HCE-2 [debuginfo] name=HCE $releasever debuginfo baseurl=https://repo.huaweicloud.com/hce/$releasever/ debuginfo/$basearch/ enabled=0 gpgcheck=1 gpgkey=https://repo.huaweicloud.com/hce/$releasever/ debuginfo/RPM-GPG-KEY-HCE-2 其中各字段含义如下: name:对repo源的描述。 baseurl:仓库所在的服务器地址,支持http://、ftp://、file://三种格式。 enabled:是否启用该软件仓库,1表示启用,0表示禁用。 gpgcheck:是否进行gpg校验,1表示启用校验,0表示禁用校验。 gpgkey:公钥保存的地址,用于gpg校验。 修改该文件可能会对系统的软件安装、升级产生影响,不建议修改该文件。
  • 第三方repo源配置 如果要新增第三方repo源,可按下述过程进行配置(以openEuler社区的镜像源为例): 在/etc/yum.repos.d/目录新增openEuler.repo文件(名称可以自定义,文件后缀需以.repo结尾)。使用vim /etc/yum.repo.d/openEuler.repo命令进行编辑。 配置仓库名字,如[openEuler],仓库名必须唯一,可根据实际情况进行调整。 配置name选项,如openEuler repository,表示仓库的具体描述,可根据实际情况进行调整。 配置baseurl选项,此处为:https://repo.openeuler.org/openEuler-22.03-LTS/OS/x86_64/,表示软件包从该链接获取,具体可参考openEuler或者对应repo提供者的官方说明。 配置gpgcheck选项,为1表示对安装的软件包进行gpg校验。 配置enabled选项,为1表示启用该repo源。 配置gpgkey选项,此处为:https://repo.openeuler.org/openEuler-22.03-LTS/OS/x86_64/RPM-GPG-KEY-openEuler,表示gpg校验使用的公钥来源于该链接。 最终openEuler.repo文件效果如下: [openEuler] name=openEuler repository baseurl=https://repo.openeuler.org/openEuler-22.03-LTS/OS/x86_64/ gpgcheck=1 enabled=1 gpgkey=https://repo.openeuler.org/openEuler-22.03-LTS/OS/x86_64/RPM-GPG-KEY-openEuler 可以通过配置中的priority字段控制repo源的优先级。如果优先使用HCE OS默认源,可在hce.repo配置中都加上priority=1(数值越小优先级越高),然后在第三方源配置中加上priority=2,数值根据实际情况进行调整。本文仅为示例,完整的openEuler仓库配置请参考HCE OS获取openEuler扩展软件包。 如果要升级软件包,可参考用户指南更新HCE OS系统和RPM包。
  • GSL权限 默认情况下,管理员创建的IAM用户没有任何权限,需要将其加入用户组,并给用户组授予策略或角色,才能使得用户组中的用户获得对应的权限,这一过程称为授权。授权后,用户就可以基于被授予的权限对云服务进行操作。 由于缓存的影响,对用户、用户组授予全球SIM联接系统策略后,需要等待10-15分钟策略才能生效。 若通过控制台使用全球SIM联接服务,请在授予系统策略后退出登录,之后重新登录继续使用。 若使用全球SIM联接的应用侧API,请在授予系统策略后,重新获取IAM用户token。
  • 约束与限制 暂不支持跨VPC。 CloudTable的ELB功能仅支持独享型ELB规格,不支持共享型ELB绑定操作。 绑定ELB时,需创建和集群相同的区域、VPC以及企业项目的ELB进行绑定。 解绑ELB时,CloudTable侧会清除ELB中集群相关信息,但并不会删除用户ELB,请注意ELB本身的计费影响,防止不必要的成本支出。 如需要公网IP或者域名访问ELB集群时,请通过ELB服务管理页面进行EIP绑定或者域名操作。 elb绑定后只对接FE节点的9030端口。 集群绑定elb后,需要把elb权限委托给CloudTable云服务,CloudTable云服务才有权限操作elb资源。
  • 绑定弹性负载均衡(ELB) 登录CloudTable管理控制台。 单击“集群管理”。默认显示用户所有的集群列表。 在集群列表中,单击指定集群名称进入集群“详情页面”。 在网络配置模块单击“绑定弹性负载均衡”,选择需要绑定到此集群的ELB,如果不存在ELB,可在ELB服务页面创建完成后,在CloudTable侧刷新进行重新绑定即可。 图1 绑定ELB 单击“确定”按钮,绑定需要一定时间,请耐心等待。 绑定成功后。进去“详情页面”中的网络配置区域,可以查看ELB对外服务提供的IP地址。 进入负载均衡服务控制台,单击绑定的ELB名称,切换到“后端服务器组”页签,检查集群节点是否被正确绑定到ELB中。 图2 查看后端服务器组 水平扩容时,自动将新增节点绑定。 如果没有弹性负载均衡器,请弹性负载均衡页面创建,详情参见创建ELB。
  • 解绑弹性负载均衡(ELB) 登录CloudTable管理控制台。 单击“集群管理”。默认显示用户所有的集群列表。 在集群列表中,单击指定集群名称进入集群“详情页面”。 单击“解绑弹性负载均衡”,进行ELB解绑操作。 图3 解绑ELB 单击“确定”按钮,解绑需要一定时间,请耐心等待。 进入负载均衡服务控制台,单击解绑的ELB名称,切换到“后端服务器”页签,检查集群节点是否已被删除。 删除集群时,可以解绑弹性负载均衡器(ELB)。
  • 使用CopyTable工具导入数据 准备Linux弹性云服务器作为客户端主机,并在客户端主机上部署CloudTable客户端工具。 具体操作请参见使用HBase Shell访问集群。 在部署客户端工具时,ZK链接地址请配置为源表所在的CloudTable集群的“ZK链接地址(内网)”。 (可选)如果要将表复制到另一个集群,请获取CloudTable目标集群的“ZK链接地址(内网)”。 登录 表格存储服务 管理控制台,在左侧导航树单击集群管理,然后在集群列表中找到所需要的集群,并获取相应的“ZK链接地址(内网)”。 在使用CopyTable复制表数据前,需要先确保在CloudTable目标集群中目标表已经存在。如果目标表不存在,请先创建目标表。 创建表的具体步骤,请参考创建HBase集群。 在客户端主机,打开命令行终端窗口,进入客户端工具安装目录的hbase目录下,然后执行CopyTable命令导入数据到CloudTable集群。 命令示例如下,该示例是将“TestTable”表指定1小时范围内的数据复制到目标集群: cd ${客户端工具的安装目录}/hbase ./bin/hbase org.apache.hadoop.hbase.mapreduce.CopyTable --starttime=1265875194289 --endtime=1265878794289 --peer.adr=${CloudTable目标集群的“ZK链接地址”}:/hbase --families=myOldCf:myNewCf,cf2,cf3 TestTable
  • 环境准备 要将表复制到另一个集群,请先获取CloudTable目标集群的“ZK链接地址(内网)”。 登录 表格存储 服务管理控制台,在左侧导航树单击集群管理,然后在集群列表中找到所需要的集群,并获取相应的“ZK链接地址(内网)”。 在复制表数据前,需要先确保在CloudTable目标集群中目标表已经存在。如果目标表不存在,请先创建目标表。 创建表的具体步骤,请参考创建HBase集群。 下载样例代码,然后参考准备开发环境章节准备开发环境。 如果您不准备使用样例代码的工程,需要将下载的样例代码中“cloudtable-example\lib”目录下的jar包拷贝到您的项目中,并在项目工程中将这些Jar包添加到依赖路径中。
  • 前提条件 系统管理员已明确业务需求,并规划好不同系统的域名。 域名只能包含大写字母、数字、圆点(.)及下划线(_),且只能以字母或数字开头。例如“DOMAINA.HW”和“DOMAINB.HW”。 Manager内所有集群全部组件的运行状态均为“良好”。 Manager内所有集群的ZooKeeper服务的“acl.compare.shortName”参数需确保为默认值“true”。否则请修改该参数为“true”后重启ZooKeeper服务。
  • 对系统的影响 修改Manager系统域名时,需要重启所有集群,集群在重启期间无法使用。 修改域名后,Kerberos管理员与 OMS Kerberos管理员的密码将重新初始化,请使用默认密码并重新修改。组件运行用户的密码是系统随机生成的,如果用于身份认证,请参见导出认证凭据文件,重新下载keytab文件。 修改域名后,“admin”用户、组件运行用户和系统管理员在修改域名以前添加的“人机”用户,密码会重置为相同密码,请重新修改。重置后的密码由两部分组成:系统生成部分和用户设置部分,系统生成部分为Admin@123,用户设置部分规则参照表2中“密码后缀”参数的说明,默认值为Admin@123。例如:系统生成部分为Admin@123,用户设置部分为Test#$%@123,则此时重置后的密码为Admin@123Test#$%@123。 重置后的密码必需满足当前用户密码策略,使用omm用户登录主OMS节点后,执行如下工具脚本可以获取到修改域名后的“人机”用户密码。 sh ${BIGDATA_HOME}/om-server/om/sbin/get_reset_pwd.sh 密码后缀 user_name 密码后缀为用户设置的参数,如果不指定,则填充为默认值,默认值为“Admin@123”。 user_name为可选参数,默认取值为“admin”。 命令中如果携带认证密码信息可能存在安全风险,在执行命令前建议关闭系统的history命令记录功能,避免信息泄露。 例如: sh ${BIGDATA_HOME}/om-server/om/sbin/get_reset_pwd.sh Test#$%@123 To get the reset password after changing cluster domain name. pwd_min_len : 8 pwd_char_types : 4 The password reset after changing cluster domain name is: "Admin@123Test#$%@123" “pwd_min_len”和“pwd_char_types”分别表示当前用户密码策略“最小密码长度”和“密码字符类型数目”,“Admin@123Test#$%@123”为修改系统域名后的“人机”用户密码。 修改系统域名后,重置后的密码由系统生成部分和用户设置部分组成,且必需满足当前用户密码策略,长度不足时在Admin@123和用户设置部分中间,使用一个或多个@补全;字符种类为5时,在Admin@123后补充一个空格。 当用户设置部分为Test@123,使用默认用户密码策略时,新密码为“Admin@123Test@123”,长度为17字符种类为4。需满足当前用户密码策略时,新密码处理如表1所示。 表1 满足不同密码策略时的新密码 最小密码长度 字符种类 对比用户密码策略结果 重置后的密码 8到17位 4 已满足用户密码策略 Admin@123Test@123 18位 4 需补充一个@ Admin@123@Test@123 19位 4 需补充两个@ Admin@123@@Test@123 8到18位 5 需补充一个空格 Admin@123 Test@123 19位 5 需补充一个空格和一个@ Admin@123 @Test@123 20位 5 需补充一个空格和两个@ Admin@123 @@Test@123 修改系统域名后,系统管理员在修改域名以前添加的“机机”用户,请重新下载keytab文件。 修改系统域名后,请重新下载并安装集群客户端。 修改系统域名后,如果有运行中的HetuEngine计算实例,需要重启HetuEngine的计算实例。
  • 操作场景 用户可以在 MRS 上查看、清除告警。 一般情况下,告警处理后,系统自动清除该条告警记录。当告警不具备自动清除功能且用户已确认该告警对系统无影响时,可手动清除告警。 在MRS界面可查看最近十万条告警(包括未清除的、手动清除的和自动清除的告警)。如果已清除告警超过十万条达到十一万条,系统自动将最早的一万条已清除告警转存,转存路径为: 3.x以前版本,主管理节点的“${BIGDATA_HOME}/OMSV100R001C00x8664/workspace/data”。 3.x及后续版本,主管理节点的“${BIGDATA_HOME}/om-server/OMS/workspace/data”。 第一次转存告警时自动生成目录。 用户可以选择页面自动刷新间隔的设置,也可以单击马上刷新。 支持三种参数值: “每30秒刷新一次”:刷新间隔30秒。 “每60秒刷新一次”:刷新间隔60秒。 “停止”:停止刷新。
  • 操作步骤 选择“现有集群”,单击集群名称进入集群详情页面。 单击“告警管理”,在告警列表查看告警信息。 告警列表每页默认显示最近的十条告警。 默认以“生成时间”列按降序排列。针对MRS 3.x之前版本集群,单击“告警ID”、“级别”、“生成时间”可修改排列方式;针对MRS 3.x及以后版本集群,单击“级别”、“生成时间”可修改排列方式。 支持在告警“级别”筛选相同级别的全部告警。结果包含已清除和未清除的告警。 针对MRS 3.x之前版本集群分别单击页面右上角、、或可以快速筛选级别为“致命”、“严重”、“一般”或“提示”的未清除告警。 针对MRS 3.x及之后版本集群分别单击页面右上角、、或可以快速筛选级别为“紧急”、“重要”、“次要”或“提示”的未清除告警。 单击“高级搜索”显示告警搜索区域,设置查询条件后,单击“搜索”,查看指定的告警信息。单击“重置”清除输入的搜索条件。 “起止时间”表示时间范围的开始时间和结束时间,可以搜索此时间段内产生的告警。 查看“告警参考”章节告警帮助,按照帮助指导处理告警。如果某些场景中告警由于MRS依赖的其他云服务产生,可能需要联系对应云服务运维人员处理。 处理完告警后,若需手动清除,单击“清除告警”,在弹出的对话框单击“确定”,手动清除告警。 如果有多个告警已完成处理,可选中一个或多个待清除的告警,单击“清除告警”,批量清除告警。每次最多批量清除300条告警。
  • 典型场景操作步骤 在MRS Manager,单击“服务管理”,选择HBase,进入HBase服务页面。 单击“服务配置”页签,修改HBase某个参数并保存配置,在出现如下弹窗后,单击“确定”进行保存。 图6 保存配置 不要勾选“重新启动受影响的服务或实例”,该处重启是普通重启方式,会并发重启所有服务或实例,引起业务断服。 保存配置完成后,单击“完成”。 选择“服务状态”页签。 在“服务状态”页签单击“更多”,选择“滚动重启服务”。 图7 服务状态-滚动重启 输入管理员密码后,弹出“滚动重启服务”页面,勾选“仅重启配置过期的实例”,单击确认,开始滚动重启。 图8 配置滚动重启服务 滚动重启任务完成后,单击“完成”。 图9 滚动重启任务完成
  • 使用限制 请在低业务负载时间段进行滚动重启操作。 例如:在滚动重启kafka服务时候, 如果kafka服务业务吞吐量很高(100M/s以上的情况下),会出现kafka服务滚动重启失败的情况。 例如:在滚动重启HBase服务时候,如果原生界面上每个RegionServer上每秒的请求数超过1W,需要增大handle数来预防重启过程中负载过大导致的RegionServer重启失败。 重启前需要观察当前hbase的负载请求数(原生界面上每个rs的请求数如果超过1W,需要增大handle数来预防到时候负载不过来) 在集群Core节点个数小于6个的情况下,可能会出现业务短时间受影响的情况。 请优先使用滚动重启操作来重启实例或服务,并勾选“仅重启配置过期的实例”。
  • 概述 MRS为用户提供海量数据的管理及分析功能,快速从结构化和非结构化的海量数据中挖掘您所需要的价值数据。开源组件结构复杂,安装、配置、管理过程费时费力,MRS Manager提供了企业级的大数据集群的统一管理平台: 提供集群状态的监控功能,您能快速掌握服务及主机的健康状态。 提供图形化的指标监控及定制,您能及时的获取系统的关键信息。 提供服务属性的配置功能,满足您实际业务的性能需求。 提供集群、服务、角色实例的操作功能,满足您一键启停等操作需求。
  • 参考信息 MapReduce服务 是公有云的一项数据分析服务,用于海量数据的管理和分析,简称MRS。 MRS通过MRS Manager管理大数据组件,例如Hadoop生态体系中的组件。因此,公有云MRS和MRS Manager管理界面上的部分概念需要区别,具体解释如表3: 表3 差异对比参考 名词概念 公有云MRS MRS Manager MapReduce服务 表示公有云上的数据分析云服务,简称为MRS,包括Hive、Spark、Yarn、HDFS和ZooKeeper等组件。 为租户集群中的大数据组件提供的统一管理平台。
  • 概述 MRS 3.x之前的版本的MRS集群使用MRS Manager对集群进行管理、监控,同时用户可通过MRS管理控制台的集群管理页面,进行集群概览查看、节点管理、组件管理、告警管理、补丁管理、文件管理、作业管理、租户管理、备份恢复、引导操作设置及标签管理。 MRS 3.x版本的MRS集群使用 FusionInsight Manager对集群进行管理、监控,同时用户可通过MRS管理控制台的集群管理页面,进行集群概览查看、节点管理、组件管理、告警管理、文件管理、作业管理、引导操作设置及标签管理。 MRS 3.x版本集群的部分维护操作与历史版本有部分差异,更多详细操作可参考本Manager操作指导(适用于2.x及之前版本)与Manager操作指导(适用于3.x版本)。
共100000条