搜索_华为云

ClickHouse - 数据湖探索 DLI
ClickHouse - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上。该场景需要与ClickHouse建立增强型跨源连接，并根据实际情况设置ClickHouse集群所在安全组规则中的端口。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项创建Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

storage_path 指定目录的完整FS绝对路径 space_consumed 返回文件/目录在集群中占用的实际空间，即它考虑了为集群设置的复制因子 quota 名称配额（名称配额是对当前目录树中的文件和目录名称数量的硬性限制） space_quota 空间配额（空间配额是对

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

大CU。同一队列不同扩缩容策略的时间段区间不能有交集。弹性资源池队列中的扩缩容策略时间段仅支持整点的时间段设置，并且包含设置的开启时间，不包含设置的结束时间，例如设置时间段00-09，则时间段范围为：[00:00，09:00)。默认的扩缩容策略不支持时间段配置修改。弹性资源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
pyspark样例代码 - 数据湖探索 DLI

mysql.jdbc.Driver" 参数说明请参考表1。设置数据 1 dataList = sparkSession.sparkContext.parallelize([(123, "Katie", 19)]) 设置schema 1 2 3 schema = StructTy

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
pyspark样例代码 - 数据湖探索 DLI

driver = "org.postgresql.Driver" 设置数据 1 dataList = sparkSession.sparkContext.parallelize([(1, "Katie", 19)]) 设置schema 1 2 3 schema = StructType([StructField("id"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
管理Spark作业模板 - 数据湖探索 DLI

可直接将配置完成的作业信息设置为模板。在DLI管理控制台的左侧导航栏中，单击“作业模板”>“Spark模板”，页面跳转至Spark作业页面。参考创建Spark作业配置作业参数。作业编辑完成后，单击“设为模板”。输入模板名称和描述信息。设置模板的分组信息。便于模板的统一管理。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
FileSytem结果表 - 数据湖探索 DLI

timestamp(3), time。为了避免数据丢失或者数据被覆盖，开启作业异常自动重启，需要配置为“从checkpoint恢复”。 checkpoint间隔设置需在输出文件实时性、文件大小和恢复时长之间进行权衡，比如10分钟。使用HDFS时需要绑定相应的跨源，并填写相应的主机信息。使用hdfs

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Spark SQL常用配置项说明 - 数据湖探索 DLI

false 当前配置设置为“false”时，DLI在覆盖写之前，会删除所有符合条件的分区。例如，分区表中有一个“2021-01”的分区，当使用INSERT OVERWRITE语句向表中写入“2021-02”这个分区的数据时，会把“2021-01”的分区数据也覆盖掉。当前配置设置为“tru

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

连接容器镜像服务。登录SWR管理控制台。选择左侧导航栏的“总览”，单击页面右上角的“登录指令”，在弹出的页面中单击复制登录指令。在安装容器引擎的虚拟机中执行上一步复制的登录指令。创建容器镜像组织。如果已创建组织则本步骤可以忽略。登录SWR管理控制台。选择左侧导航栏的“组织管理”，单击页面右上角的“创建组织”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
禁止或恢复表的生命周期 - 数据湖探索 DLI

表生命周期功能支持Hive、DataSource语法创建表、多版本表，暂不支持跨源表、Carbon表。生命周期单位为天，取值为正整数。生命周期只能在表级别设置，不能在分区级设置。为分区表指定的生命周期，适用于该表所有的分区。语法格式该语法在表级别禁止或恢复表的生命周期 1 ALTER TABLE table_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

// 设置两次checkpoint的最小间隔时间 streamEnv.getCheckpointConfig().setMinPauseBetweenCheckpoints(60000); // 设置checkpoint超时时间

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
导出SQL作业结果 - 数据湖探索 DLI

业结果文件的场景，即不需要旧的作业结果的场景。结果条数否指定导出的结果条数。不填写数值或数值为“0”时，导出全部结果。表头否设置导出查询结果数据是否含表头。导出作业结果到本地异步DDL和QUERY语句支持将结果下载到本地。下载到本地默认仅支持下载1000条数据。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
CONVERT TO DELTA - 数据湖探索 DLI
CONVERT TO DELTA - 数据湖探索 DLI

转换过程会收集统计信息，以提升转换后的 Delta 表的查询性能。如果提供表名，则元存储也将更新，以反映该表现在是 Delta 表。注意事项分区表转换需要设置参数spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled为false。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

际所需设置相应安全组规则。若使用MRS HBase，请在增强型跨源的主机信息中添加MRS集群所有节点的主机ip信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
修改表生命周期的时间 - 数据湖探索 DLI

表生命周期功能支持Hive、DataSource语法创建表、多版本表，暂不支持跨源表、Carbon表。生命周期单位为天，取值为正整数。生命周期只能在表级别设置，不能在分区级设置。为分区表指定的生命周期，适用于该表所有的分区。语法格式 ALTER TABLE table_name SET TBLPROPERTIES("dli

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
使用Hive语法创建OBS表 - 数据湖探索 DLI

3及以上版本支持使用Hive语法的CTAS语句创建分区表。关于创建表时设置多字符的分隔符：只有指定ROW FORMAT SERDE为org.apache.hadoop.hive.contrib.serde2.MultiDelimitSerDe时，字段分隔符才支持设置为多字符。只有Hive OBS表支持在建表时指定多字符的分隔符，Hive

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
创建DLI表关联CSS - 数据湖探索 DLI

多IO。 batch.size.entries 单次batch插入entry的条数上限，默认为1000。如果单条数据非常大，在bulk存储设置的数据条数前提前到达了单次batch的总数据量上限，则停止存储数据，以batch.size.bytes为准，提交该批次的数据。 batch

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
DLI对接LakeFormation - 数据湖探索 DLI

实例。设置实例为默认实例查看实例“基本信息”中“是否为默认实例”的参数值。 “true”表示当前实例为默认实例。 “false”表示当前实例不为默认实例。如果需要设置当前实例为默认实例，请单击页面右上角“设为默认实例”。勾选操作影响后单击“确定”，将当前实例设置为默认实例。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
Flink作业性能调优 - 数据湖探索 DLI

key不均衡场景下，group聚合计算存在单点或者数据倾斜问题，此时，可以通过将聚合计算拆分成Local-Global进行优化。配置方式为设置调优参数: table.optimizer.aggphase-strategy=TWO_PHASE count distinct优化在count

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 DWS结果表中不允许指定所有属性为PRIMARY

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表

总条数： 539

上一页
1
...
18
19
20
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ClickHouse - 数据湖探索 DLI

SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

管理Spark作业模板 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

导出SQL作业结果 - 数据湖探索 DLI

CONVERT TO DELTA - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

修改表生命周期的时间 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线