检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
MAX(NAME) MIN 获取最小值。 MIN(NAME) SUM 数字求合。 SUM(X) STDDEV_POP 标准差。 STDDEV_POP( X ) STDDEV_SAMP 样板标准差。 STDDEV_SAMP( X ) NTH_VALUE 分组后的第几个值。 NTH_VALUE( name
对系统的影响 磁盘容量不足会导致Kafka写入数据失败。 可能原因 用于存储Kafka数据的磁盘配置(如磁盘数目、磁盘大小等),无法满足当前业务数据流量,导致磁盘使用率达到上限。 数据保存时间配置过长,数据累积达到磁盘使用率上限。 业务规划不合理,导致数据分配不均,使部分磁盘达到使用率上限。
如果主集群的客户端安装在集群外的节点上,也需在该节点的hosts文件中配置主备集群所有机器的机器名与业务IP地址的对应关系。 主备集群间的网络带宽需要根据业务流量而定,不应少于最大的可能业务流量。 主备集群安装的MRS版本需要保持一致。 备集群规模不小于主集群规模。 使用约束 尽管容灾提供了实时的数据复制功能,但实
执行Balance操作时会占用DataNode的网络带宽资源,请根据业务需求在维护期间执行任务。 默认使用带宽控制为20MB/s,如果重新设置带宽流量或加大数据量,Balance操作可能会对正在运行的业务产生影响。 前提条件 已安装HDFS客户端。 配置Balance任务 使用客户端安装
执行Balance操作时会占用DataNode的网络带宽资源,请根据业务需求在维护期间执行任务。 默认使用带宽控制为20MB/s,如果重新设置带宽流量或加大数据量,Balance操作可能会对正在运行的业务产生影响。 前提条件 已安装HDFS客户端。 配置Balance任务 使用客户端安装
MAX(NAME) MIN 获取最小值。 MIN(NAME) SUM 数字求合。 SUM(X) STDDEV_POP 标准差。 STDDEV_POP( X ) STDDEV_SAMP 样板标准差。 STDDEV_SAMP( X ) NTH_VALUE 分组后的第几个值。 NTH_VALUE( name
network.memory.buffers-per-channel 每个传出/传入通道(子分区/输入通道)使用的最大网络缓冲区数。在基于信用的流量控制模式下,这表示每个输入通道中有多少信用。它应配置至少2以获得良好的性能。1个缓冲区用于接收子分区中的飞行中数据,1个缓冲区用于并行序列化。
中”。 订单支付成功后,集群开始进行转包周期流程,待集群转包周期成功后,集群状态更新为“运行中”。 转包周期后集群原有Task节点计费类型保持按需计费,集群在转包周期过程中已配置的弹性伸缩规则不触发新任务,请选择恰当的时间进行该操作。 父主题: 管理MRS集群
到所有地址端口:permission java.net.SocketPermission "*", "connect,resolve"; 标准权限 表1 文件权限 权限类型 权限名 允许的操作 示例 java.io.FilePermission 文件名:指定文件 -:当前目录和子目录中的所有文件
/taskmanagers/<taskmanagerid>/stdout 一个任务管理员的标准。 /jobmanager/log JobManager的日志信息。 /jobmanager/stdout JobManager的标准。 /jobmanager/metrics JobManager的指标。
zip”。最多保留最近的20个压缩文件,压缩文件保留个数和压缩文件阈值可以配置。 表1 Hive日志列表 日志类型 日志文件名 描述 运行日志 /fe/fe.out 标准/错误输出的日志(stdout和stderr) /fe/fe.log 主日志,包括除fe.out外的所有内容 /fe/fe.warn.log
/taskmanagers/<taskmanagerid>/stdout 一个任务管理员的标准。 /jobmanager/log JobManager的日志信息。 /jobmanager/stdout JobManager的标准。 /jobmanager/metrics JobManager的指标。
/taskmanagers/<taskmanagerid>/stdout 一个任务管理员的标准。 /jobmanager/log JobManager的日志信息。 /jobmanager/stdout JobManager的标准。 /jobmanager/metrics JobManager的指标。
流式处理(Streaming Processing):支持秒级延迟的流式处理,可支持多种外部数据源。 查询分析(Query Analysis):支持标准SQL查询分析,同时提供DSL(DataFrame), 并支持多种外部输入。 Apache Spark部件架构如图1所示。本文档重点介绍Spark、Spark
/taskmanagers/<taskmanagerid>/stdout 一个任务管理员的标准。 /jobmanager/log JobManager的日志信息。 /jobmanager/stdout JobManager的标准。 /jobmanager/metrics JobManager的指标。
在第二个输入框输入正则表达式,支持标准正则表达式。例如要筛选父目录中所有的文件或子目录,输入“([\s\S]*?)”。例如要筛选命名规则为字母数字组合的文件,如file1可输入“file\d*”。 在第二个输入框输入正则表达式,支持标准正则表达式。例如要筛选包含“test”的对象,请输入“
network.memory.buffers-per-channel 每个传出/传入通道(子分区/输入通道)使用的最大网络缓冲区数.在基于信用的流量控制模式下,这表示每个输入通道中有多少信用。它应配置至少2以获得良好的性能。1个缓冲区用于接收子分区中的飞行中数据,1个缓冲区用于并行序列化。
concat(binary1, ..., binaryN) → varbinary 将binary1,binary2,binaryN串联起来。这个函数返回与SQL标准连接符||相同的功能。 select concat(X'32335F',x'00141f'); -- 32 33 5f 00 14 1f to_base64(binary)
面临数据源种类繁多、数据集结构化混合、相关数据存放分散等困境,导致跨源查询开发成本高,跨源复杂查询耗时长。 HetuEngine提供了统一标准SQL实现跨源协同分析,简化跨源分析操作。 图1 Tableau访问MRS HetuEngine 约束与限制 已安装Tableau Desktop
若节点较多,可以按节点名称或者IP模糊搜索,也可以使用数据盘容量进行条件过滤。 预估费用为按显示的磁盘容量预估的费用,可能不准确,实际费用以节点实际的磁盘容量计算为准。所以建议数据盘扩容前先同步磁盘信息,预估费用会更准确。 若某节点组下节点进行过数据盘扩容,后续若该节点组扩容节点或进行集