检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在“Project Structure”页面,选择“Artifacts”页签。 在右侧窗口中单击“+”,选择“Library Files”添加依赖包。 图2 添加Library Files 选择需要添加的依赖包,然后单击“OK”。 图3 Choose Library 单击“Apply”加载依赖包,然后单击“OK”完成配置。
在“Project Structure”页面,选择“Artifacts”页签。 在右侧窗口中单击“+”,选择“Library Files”添加依赖包。 图2 添加Library Files 选择需要添加的依赖包,然后单击“OK”。 图3 Choose Libraries 单击“Apply”加载依赖包,然后单击“OK”完成配置。
创建OBS文件。 执行以下命令登录spark-sql命令行: cd 客户端安装目录/Spark2x/spark/bin ./spark-sql 执行以下命令在OBS中创建表并插入数据: create database test location "obs://并行文件系统路径/test";
开发Oozie配置文件 Oozie样例程序开发思路 Oozie应用开发步骤 父主题: 开发Oozie应用
开发Oozie配置文件 Oozie样例程序开发思路 Oozie应用开发步骤 父主题: 开发Oozie应用
开发Oozie配置文件 Oozie样例程序开发思路 Oozie应用开发步骤 父主题: 开发Oozie应用
在“Project Structure”页面,选择“Artifacts”页签。 在右侧窗口中单击“+”,选择“Library Files”添加依赖包。 图2 添加Library Files 选择需要添加的依赖包,然后单击“OK”。 图3 Choose Libraries 单击“Apply”加载依赖包,然后单击“OK”完成配置。
site.xml配置文件放在classpath路径下。 方法2: 在代码中,显式加载配置文件core-site.xml,例如: ...... conf = new Configuration(); String userdir = System.getProperty("user
压缩,压缩后的日志文件名规则为:“<原有日志名>.log.[编号].gz”。默认最多保留最近的20个压缩文件,压缩文件保留个数和压缩文件阈值可以配置。 审计日志压缩后的日志文件名规则为:“audit.log.[yyyy-MM-dd].[编号].zip”。该文件永远都不会删除。 表1
选择按文件或大小分割源文件,作为数据导入的MapReduce任务中各个map的输入文件。 选择“FILE”,表示按文件分割源文件,即每个map处理一个或多个完整的源文件,同一个源文件不可分配至不同map,完成数据导入后保持源文件的目录结构。 选择“SIZE”,表示按大小分割源文件,即每个map处理一定
配置HetuEngine物化视图改写能力 开启物化视图改写能力 HetuEngine支持在System级别或者Session级别开启物化视图改写能力,开启方法如下所示: Session级别: 参考快速使用HetuEngine访问Hive数据源在HetuEngine客户端执行set
各个map的输入文件。 选择“FILE”,表示按文件分割源文件,即每个map处理一个或多个完整的源文件,同一个源文件不可分配至不同map,完成数据导入后保持源文件的目录结构。 选择“SIZE”,表示按大小分割源文件,即每个map处理一定大小的输入文件,同一个源文件可分割至多个ma
version文件损坏导致启动失败 问题背景 HBase启动失败。 原因分析 HBase启动时会读取hbase.version文件,但是日志显示读取存在异常。 通过hadoop fs -cat /hbase/hbase.version命令发现文件不能正常查看,该文件损坏。 解决办法
插入表数据 本章节主要介绍Iceberg插入表数据的SQL基本语法和使用说明。 基本语法 INSERT INTO tableIndentifier [VALUES(value)][SELECT query]; INSERT OVERWRITE tableIndentifier SELECT;
384 MB 可能原因 目录配置的剩余的空间小于写文件实际需要的空间。 原因分析 HDFS支持设置某目录的配额,即限制某目录下的文件最多占用空间大小,例如如下命令是设置“/tmp/tquota”目录最多写入150MB的文件(文件大小*副本数)。 hadoop dfsadmin -setSpaceQuota
HFile中。 运行前置操作 安全模式下Spark Core样例代码需要读取两个文件(user.keytab、krb5.conf)。user.keytab和krb5.conf文件为安全模式下的认证文件,需要在FusionInsight Manager中下载principal用户的
(此日志文件大小可进行配置),会自动压缩,压缩后的日志文件名规则为:“<原有日志名>-<yyyy-mm-dd_hh-mm-ss>.[编号].log.zip”。最多保留最近的20个压缩文件,压缩文件保留个数和压缩文件阈值可以配置。 表1 Hive日志列表 日志类型 日志文件名 描述
T-Digest函数 概述 T-digest是存储近似百分位信息的数据草图。HetuEngine中用tdigest表示这种数据结构。T-digest可以合并,在存储时可以强转为VARBINARY,检索时再由VARBINARY转换为T-digest 函数 merge(tdigest)→tdigest
System.out.println("<tableName> hbase tableName"); System.out.println("<confDir> hbase conf dir"); System.out.println(
的Kerberos用户,认证后执行分析任务示例在“hive-examples/python3-examples/pyCLI_sec.py”文件中。 导入hive类 from pyhive import hive 创建JDBC连接。 connection = hive.Connec