搜索_华为云

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

数据处理后写入到OBS，具体参数配置请根据实际环境修改。环境准备已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 Maven工程的pom.xml文件配置请参考JAVA样例代码（Flink 1.12）中“pom文件配置”说明。确保本地编译环境可以正常访问公网。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
跨源认证权限管理 - 数据湖探索 DLI

通过跨源认证的用户授权，可设置分配不同的跨源认证，且不同用户的作业不影响跨源认证的使用。使用须知管理员用户和跨源认证的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其跨源认证权限。给新用户设置跨源认证权限时，该用户所在用户组具有Tenant Guest权限。关于Tenant

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

作业中，可以使用CREATE语句来定义Source表和Sink表，并指定它们的连接器类型以及相关的属性。如果需要将数据写入到不同的Elasticsearch集群，您需要为每个集群配置不同的连接参数，并确保Flink作业能够正确地将数据路由到各个集群。例如本例中分别对es1和es2定义连接器类型以及相关的属性。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
创建CSS类型跨源认证 - 数据湖探索 DLI

跨源认证即可安全访问数据源。例如在使用Spark SQL来创建访问CSS的表时使用es.certificate.name字段配置跨源认证信息名称，配置连接安全CSS集群。创建完跨源认证，可以参考创建DLI表关联CSS使用Spark SQL来创建访问CSS的表。父主题：使用DLI的跨源认证管理数据源访问凭证

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
使用DLI的跨源认证管理数据源访问凭证 - 数据湖探索 DLI

创建CSS类型跨源认证创建Kerberos跨源认证创建Kafka_SSL类型跨源认证创建Password类型跨源认证跨源认证权限管理父主题：配置DLI读写外部数据源数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
将OBS数据导入至DLI - 数据湖探索 DLI

导入数据时只能指定一个路径，路径中不能包含逗号。如果将CSV格式数据导入分区表，需在数据源中将分区列放在最后一列。不建议对同一张表并发导入数据，因为有一定概率发生并发冲突，导致导入失败。导入文件支持CSV，Parquet，ORC，JSON和Avro格式，且编码格式仅支持UTF-8。前提条件

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
增强型跨源连接标签管理 - 数据湖探索 DLI

单击“添加/编辑标签”，弹出“添加/编辑标签”对话框，配置参数。标签键和标签值设置完成后，单击“添加”，将标签加入到输入框中。图1 添加标签表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。如果添加预定义标签，用户需要预先在标签管理服务中创建好预定义

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

'passwdauth'='######'//DLI侧创建的Password类型的跨源认证名称。使用跨源认证则无需在作业中配置账号和密码。 )" ) 表1 创建表参数参数说明 url DWS的连接地址，需要先创建跨源连接，管理控制台操作请参考《数据湖探索用户指南》。创建经典型跨源连接后，使用经典型跨源连接中返回的连接地址。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

API ，您需要确认已在DLI管理控制台开通当前服务并完成服务授权。 Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual C++编译环境Visual C++ build tools 或者 Visual Studio。关于Python开发环境的配置请参考Python

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
ARCHIVELOG - 数据湖探索 DLI
ARCHIVELOG - 数据湖探索 DLI

ARCHIVELOG 命令功能用于根据配置对Timeline上的Instant进行归档，并从Timeline上将已归档的Instant删除，以减少Timeline的操作压力。命令格式 RUN ARCHIVELOG ON tableIdentifier; RUN ARCHIVELOG

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
Flink作业性能调优 - 数据湖探索 DLI

数并增加source并发解决。作业一个算子反压高（红色），而其后续的多个并行算子都不存在反压（绿色）该场景说明性能瓶颈在Vertex2或者Vertex3，为了进一步确定具体瓶颈点算子，可以在FlinkUI页面开启inPoolUsage监控。如果某个算子并发对应的inPoolU

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
管理增强型跨源连接 - 数据湖探索 DLI

添加增强型跨源连接的路由信息删除增强型跨源连接的路由信息修改弹性资源池的主机信息增强型跨源连接标签管理删除增强型跨源连接父主题：配置DLI读写外部数据源数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
查看增强型跨源连接的基本信息 - 数据湖探索 DLI

选择“跨源管理 > 增强型跨源”。进入增强型跨源连接列表页面，选择您需要查看的增强型跨源连接。在列表页面的右上方单击可以自定义显示列，并设置表格内容显示规则、操作列显示规则。在列表页面上方的搜索区域，您可以名称和标签筛选需要的增强型跨源连接。单击查看增强型跨源连接详细信息。支持查看以下信息：

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

overwrite语句覆盖分区表的数据时，如果发现它覆盖了全量数据而不是预期的分区数据，这可能是因为动态分区覆盖功能没有被启用。如果需要动态覆盖DataSource表指定的分区数据，您需要先配置参数 dli.sql.dynamicPartitionOverwrite.enabled=true，然后通过insert

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

partitionColumn 读取数据时，用于设置并发使用的数值型字段。说明： “partitionColumn”，“lowerBound”，“upperBound”，“numPartitions”4个参数必须同时设置，不支持仅设置其中一部分为了提升并发读取的性能，建议使用自增列。 lowerBound

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

CLEANARCHIVE 命令功能用于对Hudi表的归档文件进行清理，以减少Hudi表的数据存储及读写压力。命令格式按文件容量进行清理，需要配置参数： hoodie.archive.file.cleaner.policy = KEEP_ARCHIVED_FILES_BY_SIZE;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
对跨源DWS表执行insert overwrite操作，报错：org.postgresql.util.PSQLException: ERROR: tuple concurrently updated - 数据湖探索 DLI

updated 问题现象客户对DWS执行并发insert overwrite操作，报错：org.postgresql.util.PSQLException: ERROR: tuple concurrently updated。原因分析客户作业存在并发操作，同时对一张表执行两个insert

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
增强型跨源连接权限管理 - 数据湖探索 DLI

目所属的用户账号进行登录。如果被授权的项目属于相同区域（region）的同一用户，则需使用当前账号切换到对应的项目下。应用示例项目B需要访问项目A上的数据源，对应操作如下。对于项目A：使用项目A对应的账号登录DLI服务。通过对应数据源的VPC信息在DLI服务中创建增强型跨源连接“ds”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
OBS表压缩率较高怎么办？ - 数据湖探索 DLI

高，超过了5倍的压缩率，您可以通过调整配置来优化作业的性能。具体方法：在submit-job请求体conf字段中配置“dli.sql.files.maxPartitionBytes=33554432”。该配置项默认值为128MB，将其配置成32MB，可以减少单个任务读取的数据

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Flink Jar作业运行报错，报错信息为Authentication failed - 数据湖探索 DLI

Authentication failed 问题原因因为账号没有在全局配置中配置服务授权，导致该账号在创建跨源连接访问外部数据时因为权限不足而导致跨源访问失败。解决方案登录DLI管理控制台，选择“全局配置 > 服务授权”。在委托设置页面，按需选择所需的委托权限。其中“DLI

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类

总条数： 826

上一页
1
...
5
6
7
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

跨源认证权限管理 - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

创建CSS类型跨源认证 - 数据湖探索 DLI

使用DLI的跨源认证管理数据源访问凭证 - 数据湖探索 DLI

将OBS数据导入至DLI - 数据湖探索 DLI

增强型跨源连接标签管理 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

ARCHIVELOG - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

管理增强型跨源连接 - 数据湖探索 DLI

查看增强型跨源连接的基本信息 - 数据湖探索 DLI

为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

CLEANARCHIVE - 数据湖探索 DLI

对跨源DWS表执行insert overwrite操作，报错：org.postgresql.util.PSQLException: ERROR: tuple concurrently updated - 数据湖探索 DLI

增强型跨源连接权限管理 - 数据湖探索 DLI

OBS表压缩率较高怎么办？ - 数据湖探索 DLI

Flink Jar作业运行报错，报错信息为Authentication failed - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线