搜索_华为云

Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

query的运行得到错误的结果或者非预期的异常。解决方案：将作业参数 table.exec.source.cdc-events-duplicate 设置成true，并在该source上定义PRIMARY KEY。框架会生成一个额外的有状态算子，使用该primary key来对变更事件去重

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
BlackHole结果表 - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式 create table blackhole_table ( attr_name

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Hudi Compaction操作说明 - 数据湖探索 DLI

入延迟，因而进行不阻塞摄入的异步Compaction很有意义。如何执行Compaction 仅执行Schedule Spark SQL（设置如下参数，写数据时触发） hoodie.compact.inline=true hoodie.schedule.compact.only.inline=true

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
导出查询结果 - 数据湖探索 DLI

file_format为csv时，options参数可以参考表3。注意事项通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI表在OBS桶中插入的文件个数，同时，为了避免数据倾斜，在INSERT语句后可加上“distribute by rand()”，可以增加处理作业的并发量。例如：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 DWS结果表中不允许指定所有属性为PRIMARY

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
导出DLI表数据至OBS中 - 数据湖探索 DLI

随导出创建指定路径：指定的导出目录必须不存在，如果指定目录已经存在，系统将返回错误信息，无法执行导出操作。覆盖指定路径：在指定目录下新建文件，会删除已有文件。表头:无/有设置导出数据是否含表头。单击“确定”即可导出数据。（可选）您可以在“作业管理”>“SQL作业”页面查看导出作业的“状态”、“执行语句”等信息。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
创建DLI表关联CSS - 数据湖探索 DLI

多IO。 batch.size.entries 单次batch插入entry的条数上限，默认为1000。如果单条数据非常大，在bulk存储设置的数据条数前提前到达了单次batch的总数据量上限，则停止存储数据，以batch.size.bytes为准，提交该批次的数据。 batch

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
在DLI控制台创建数据库和表 - 数据湖探索 DLI

如果所建队列属于企业项目，可选择对应的企业项目。企业项目是一种云资源管理方式，企业项目管理服务提供统一的云资源按项目管理，以及项目内的资源管理、成员管理。关于如何设置企业项目请参考《企业管理用户指南》。说明：只有开通了企业管理服务的用户才显示该参数。描述该数据库的描述。标签使用标签标识云资源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

Administrator权限。客户未给VPC服务授权导致DLI跨源连接报错找不到子网。处理步骤登录DLI管理控制台，选择“全局配置 > 服务授权”。在委托设置页面，按需选择所需的委托权限。其中“DLI Datasource Connections Agency Access”是跨源场景访问和使用VPC、子网、路由、对等连接的权限。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
Flink作业性能调优 - 数据湖探索 DLI

key不均衡场景下，group聚合计算存在单点或者数据倾斜问题，此时，可以通过将聚合计算拆分成Local-Global进行优化。配置方式为设置调优参数: table.optimizer.aggphase-strategy=TWO_PHASE count distinct优化在count

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 1 2 3

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
管理队列 - 数据湖探索 DLI
管理队列 - 数据湖探索 DLI

管理队列查看队列的基本信息队列权限管理分配队列至项目创建消息通知主题队列标签管理队列属性设置测试地址连通性删除队列变更普通队列规格普通队列弹性扩缩容设置普通队列的弹性扩缩容定时任务修改普通队列的网段父主题：创建弹性资源池和队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

Flink作业如何进行性能调优？更多 Spark作业相关问题如何查看DLI Spark作业的实际资源使用情况 Spark队列操作OBS表如何设置AK/SK？更多 Flink作业相关问题怎样将OBS表映射为DLI的分区表？更多技术专题技术、观点、课程专题呈现 Cloud Native

帮助中心 > 数据湖探索 DLI > 成长地图
pyspark样例代码 - 数据湖探索 DLI

driver = "org.postgresql.Driver" 设置数据 1 dataList = sparkSession.sparkContext.parallelize([(1, "Katie", 19)]) 设置schema 1 2 3 schema = StructType([StructField("id"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
Hudi Archive操作说明 - 数据湖探索 DLI

多会导致性能问题，所以元数据文件数量最好控制在1000以内。如何执行Archive 写完数据后archive Spark SQL（set设置如下参数，写数据时触发） hoodie.archive.automatic=true hoodie.keep.max.commits=30

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
增强型跨源连接绑定队列失败怎么办？ - 数据湖探索 DLI

Administrator权限。客户未给VPC服务授权导致绑定队列失败。处理步骤登录DLI管理控制台，选择“全局配置 > 服务授权”。在委托设置页面，按需选择所需的委托权限。其中“DLI Datasource Connections Agency Access”是跨源场景访问和使用VPC、子网、路由、对等连接的权限。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在“程序包管理”页面，单击右上角的“创建”创建程序包。在“创建程序包”对话框，配置以下参数。包类型：选择“JAR”。 OBS路径：程序包所在的OBS路径。分组设置和组名称根据情况选择设置，方便后续识别和管理程序包。单击“确定”，完成创建程序包。创建UDAF函数。登录登录DLI管理控制台，创建SQL队列和数据库。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

优先级当前弹性资源池中的优先级数字越大表示优先级越高。本例设置一条扩缩容策略，默认优先级为1。 1 时间段首条扩缩容策略是默认策略，不能删除和修改时间段配置。即设置00-24点的扩缩容策略。 00-24 最小CU 设置扩缩容策略支持的最小CU数。 16 最大CU 当前扩缩容策略支持的最大CU数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
pyspark样例代码 - 数据湖探索 DLI

mysql.jdbc.Driver" 参数说明请参考表1。设置数据 1 dataList = sparkSession.sparkContext.parallelize([(123, "Katie", 19)]) 设置schema 1 2 3 schema = StructTy

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
在Spark SQL作业中使用UDF - 数据湖探索 DLI

在“程序包管理”页面，单击右上角的“创建”创建程序包。在“创建程序包”对话框，配置以下参数。包类型：选择“JAR”。 OBS路径：程序包所在的OBS路径。分组设置和组名称根据情况选择设置，方便后续识别和管理程序包。单击“确定”，完成创建程序包。创建UDF函数。登录DLI管理控制台，单击“SQL编辑器”，执

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南

总条数： 520

上一页
1
...
12
13
14
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Debezium Format - 数据湖探索 DLI

BlackHole结果表 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

管理队列 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

增强型跨源连接绑定队列失败怎么办？ - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线