搜索_华为云

Spark SQL常用配置项说明 - 数据湖探索 DLI

批作业SQL语法的常用配置项。表1 常用配置项名称默认值描述 spark.sql.files.maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

open、run、close和cancel函数。实现完成后将该类编译打在jar中，通过sql编辑页的UDF Jar上传。依赖的pom配置文件内容参考如下： <dependency> <groupId>org.apache.flink</groupId> <ar

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
字符串函数概览 - 数据湖探索 DLI

的有效值包括HOST，PATH， QUERY， REF， PROTOCOL， AUTHORITY，FILE和USERINFO。例如：parse_url('http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1', 'HOST') 返回 'facebook

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

单击所建桶“dli-test-obs01”，进入“对象”页面。选择左侧列表中的“对象”，选择“上传对象”，将需要上传的文件，例如“flink-examples.jar”上传到指定目录，单击“确定”。本例文件上传成功后，路径为“obs://dli-test-obs01/flink-examples.jar”。

帮助中心 > 数据湖探索 DLI > 快速入门
BlackHole - 数据湖探索 DLI
BlackHole - 数据湖探索 DLI

后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据语法格式 create table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

单击所建桶“dli-test-obs01”，进入“对象”页面。选择左侧列表中的“对象”，选择“上传对象”，将需要上传的文件，例如“spark-examples.jar”上传到指定目录，单击“确定”。本例文件上传成功后，文件路径为“obs://dli-test-obs01/spark-examples.jar”。

帮助中心 > 数据湖探索 DLI > 快速入门
Spark2.4.x与Spark3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

导出CSV文件时保留特殊字符的引号说明： Spark2.4.x：在Spark 2.4.x版本中，导出CSV文件时，如果字段值中包含特殊字符如换行符（\n）和回车符（\r），并且这些特殊字符被引号（例如双引号"）包围，Spark会自动处理这些引号，在导出的CSV文件中舍弃这些引号。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark2.4.x与Spark3.3.x版本差异对比
Confluent Avro Format - 数据湖探索 DLI

0_232.tar.gz 使用下述命令在当前ecs集群中安装jdk1.8.0_232(其中<yourJdkPath>可以在jdk1.8.0_232文件夹下使用"pwd"查看)： export JAVA_HOME=<yourJdkPath> export PATH=$JAVA_HOME/bin:$PATH

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
ALTER TABLE - 数据湖探索 DLI
ALTER TABLE - 数据湖探索 DLI

PARTITION时指定了分区保存路径，那么在DROP PARTITION执行后，分区所在文件夹和数据不会被删除。如果ADD PARTITION时未指定分区保存路径，分区目录将从OBS上删除，数据会移到.Trash/Current文件夹。 ALTER TABLE table_name DROP [IF

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
错误码 - 数据湖探索 DLI
错误码 - 数据湖探索 DLI

DLI.0007 不支持该操作。 400 DLI.0008 元数据错误。 400 DLI.0009 系统限制。 400 DLI.0011 文件权限校验错误。 400 DLI.0012 资源对象不可用。 401 DLI.0013 用户认证错误。 401 DLI.0014 服务认证错误。

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

with "Provided" scope，否则本地调试运行时会加载不到pom文件中的依赖包。具体操作以IntelliJ IDEA版本2020.2为例，参考如下：在IntelliJ IDEA界面，选择调试的配置文件，单击“Edit Configurations”。在“Run/Debug

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
修改组或资源包拥有者（废弃） - 数据湖探索 DLI

字符。 resource_name 否 String 包名。名称只能包含数字字母，下划线，感叹号，中划线，点，但是不能以点开头，长度（包含文件后缀）不能超过128个字符。修改组下的资源包拥有者，则该参数为必选参数。 “group_name”和“resource_name”可以单独使用，也可以组合使用。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

"Task Managers" -> "Stdout"。方法二：若在提交运行作业前选择了保存日志，则可以从日志的taskmanager.out文件中查看。 +I(47.29.201.179 - - [28/Feb/2019:13:17:10 +0000] "GET /?p=1 HTTP/2

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
创建表时指定表的生命周期 - 数据湖探索 DLI

的生命周期，适用于该表所有的分区。生命周期设置后，DLI表和OBS表支持数据备份，OBS表的备份目录需要手工设置。且备份目录应选择在并行文件系统上，备份目录必须和原表目录在同一个桶上，备份目录不能与原表相同目录或者子目录同名。语法格式 DataSource语法创建DLI表 CREATE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
配置SQL防御规则 - 数据湖探索 DLI

类别适用引擎支持的动作取值说明系统默认创建规则 SQL语句示例 dynamic_0001 Scan files number 扫描文件数的限制。 dynamic spark HetuEngine 提示拦截取值范围：1-2000000 默认值：200000 是 NA dynamic_0002

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
pyspark样例代码 - 数据湖探索 DLI

sql("select * from css_table") jdbcDF.show() 操作结果提交Spark作业将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
userDefined结果表 - 数据湖探索 DLI

@Override public void close() throws Exception {} } 依赖的pom配置文件内容参考如下： <dependency> <groupId>org.apache.flink</groupId> <ar

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
二进制函数和运算符 - 数据湖探索 DLI

lpad(binary, size, padbinary) → varbinary 左填充二进制以使用padbinary调整字节大小。如果size小于二进制文件的长度，则结果将被截断为size个字符。size不能为负，并且padbinary不能为空。 select lpad(x'15245F', 11

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
了解数据目录、数据库和表 - 数据湖探索 DLI

导入数据的编码格式仅支持UTF-8。数据导出只支持将DLI表（表类型为“Managed”）中的数据导出到OBS桶中，且导出的路径必须指定到文件夹级别。导出文件格式为json格式，且文本格式仅支持UTF-8。支持跨账号导出数据，即B账户对A账户授权后，A账户拥有B账户OBS桶的元数据信息

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

返回值在一组值中的排名。结果是 1 加上分区顺序中当前行之前或等于当前行的行数。排名在序列中不一定连续。 DENSE_RANK() 返回值在一组值中的排名。结果是一加先前分配的等级值。与函数 rank 不同，dense_rank 不会在排名序列中产生间隙。 ROW_NUMBER() 在窗口分区内根据 rows

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数

总条数： 383

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL常用配置项说明 - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

字符串函数概览 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

BlackHole - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

Spark2.4.x与Spark3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

ALTER TABLE - 数据湖探索 DLI

错误码 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

修改组或资源包拥有者（废弃） - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

userDefined结果表 - 数据湖探索 DLI

二进制函数和运算符 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线