搜索_华为云

Upsert Kafka结果表 - 数据湖探索 DLI

息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。注意事项对接的Kafka集群不支持开启SASL_SSL。语法格式 1 2 3 4 5 6 7 8 9

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

器。Streaming sink 前提条件该场景作业需要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项创建Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

配置CDM数据源连接。创建源端DWS数据库的连接。登录CDM控制台，选择“集群管理”，选择已创建的CDM集群，在操作列选择“作业管理”。在作业管理界面，选择“连接管理”，单击“新建连接”，连接器类型选择“数据仓库服务（DWS）”，单击“下一步”。配置连接DWS的数据源连接参数，具体参数配置如下。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
ClickHouse - 数据湖探索 DLI
ClickHouse - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上。该场景需要与ClickHouse建立增强型跨源连接，并根据实际情况设置ClickHouse集群所在安全组规则中的端口。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项创建Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Flink Jar作业类 - 数据湖探索 DLI

包冲突，导致作业提交失败 Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 Flink Jar作业运行报错，报错信息为Authentication failed Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 Hadoop jar包冲突，导致Flink提交失败

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

据倾斜、网络问题或任务过多导致的。解决方案：设置并发数：通过设置合适的并发数，可以启动多任务并行运行，从而提高作业的处理能力。例如访问DWS大批量数据库数据时设置并发数，启动多任务的方式运行，避免作业运行超时。具体并发设置可以参考对接DWS样例代码中的partitionC

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ - 数据湖探索 DLI

跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ Spark中没有datetime数据类型，其使用的是TIMESTAMP类型。您可以通过函数进行转换。例如： select cast(create_date as string)

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
创建跨源认证（废弃） - 数据湖探索 DLI

创建跨源认证（废弃）功能介绍该API用于创建跨源认证。当前接口已废弃，不推荐使用。推荐使用创建跨源认证。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v2.0/{project_id}/datasource/auth-infos 参数说明

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 跨源认证相关API（废弃）
创建跨源认证 - 数据湖探索 DLI

创建跨源认证功能介绍该API用于创建跨源认证。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v3/{project_id}/datasource/auth-infos 参数说明表1 URI参数说明参数是否必选参数类型描述 project_id

帮助中心 > 数据湖探索 DLI > API参考 > 跨源认证相关API
查看弹性资源池的基本信息 - 数据湖探索 DLI

、IPv6网段、创建时间等信息。查看弹性资源池的基本信息登录DLI管理控制台。选择“资源管理 > 弹性资源池”。进入弹性资源池列表页面，选择您需要查看的弹性资源池。在列表页面的右上方单击可以自定义显示列，并设置表格内容显示规则、操作列显示规则。在列表页面上方的搜索区域

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

会监控文件夹中新文件的生成情况，并增量读取新文件。前提条件该场景作业需要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项创建Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
创建DLI表关联CSS - 数据湖探索 DLI

多IO。 batch.size.entries 单次batch插入entry的条数上限，默认为1000。如果单条数据非常大，在bulk存储设置的数据条数前提前到达了单次batch的总数据量上限，则停止存储数据，以batch.size.bytes为准，提交该批次的数据。 batch

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
COMMENT - 数据湖探索 DLI
COMMENT - 数据湖探索 DLI

COMMENT 语法 COMMENT ON TABLE name IS 'comments' 描述设置表的注释信息，可以通过设置注释信息为NULL来删除注释。示例修改表users的注释为“master table”，表的注释语句可以通过show create table tablename语句查看：

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

Redis、DDS等，需要先创建跨源连接，打通作业运行队列到外部数据源之间的网络。当前Spark作业支持访问的外部数据源详情请参考DLI常用跨源分析开发方式。创建跨源连接操作请参见配置DLI与数据源网络连通（增强型跨源连接）。创建完跨源连接后，可以通过“资源管理 > 队列管理

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
对跨源DWS表执行insert overwrite操作，报错：org.postgresql.util.PSQLException: ERROR: tuple concurrently updated - 数据湖探索 DLI

SAA_OUTBOUND_ORDER_CUST_SUM的操作。处理步骤修改作业逻辑，避免对同一张表并发执行insert overwrite操作。父主题：增强型跨源连接类

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
pyspark样例代码 - 数据湖探索 DLI

driver = "org.postgresql.Driver" 设置数据 1 dataList = sparkSession.sparkContext.parallelize([(1, "Katie", 19)]) 设置schema 1 2 3 schema = StructType([StructField("id"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
创建并提交SQL作业 - 数据湖探索 DLI

如果SQL语句中指定了表所在的数据库，则此处选择的数据库无效。设置包括设置“参数设置”和“标签”。参数设置：以“key/value”的形式设置提交SQL作业的配置项。详细内容请参见《数据湖探索SQL语法参考》。标签：以“key/value”的形式设置SQL作业的标签。创建数据库和表。您可以

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

print(status) 在提交导入作业前，可选择通过data_type参数设置导入数据的类型，例如将data_type设置为csv。csv数据的具体格式通可过options参数设置，例如：csv的分隔符，转义符等。当OBS桶目录下有文件夹和文件同名时，加载数据会优先

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

[403] 该报错信息可能是由于OBS桶被设置为了DLI日志桶，而日志桶不能用于DLI的其他业务功能。您可以按以下操作步骤进行查询：检查该OBS桶是否被设置为了DLI日志桶。在DLI管理控制台的“全局配置 > 作业配置” 页查看对应OBS桶是否被设置为了DLI日志桶，日志桶不能用于DLI的其他业务功能中。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
在DLI控制台配置表权限 - 数据湖探索 DLI

在“用户权限信息”列表中找到需要设置权限的用户：如果用户为子用户且不是表的所有者，可进行“权限设置”。若用户为管理员用户或表的所有者，只能查看“权限信息”。在“项目权限信息”列表中找到需要设置权限的项目，进行“权限设置”。在子用户或项目的“操作”栏中单击“权限设置”，可弹出表“权限设置”对话框。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源

总条数： 516

上一页
1
...
9
10
11
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Upsert Kafka结果表 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

ClickHouse - 数据湖探索 DLI

Flink Jar作业类 - 数据湖探索 DLI

Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ - 数据湖探索 DLI

创建跨源认证（废弃） - 数据湖探索 DLI

创建跨源认证 - 数据湖探索 DLI

查看弹性资源池的基本信息 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

COMMENT - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

对跨源DWS表执行insert overwrite操作，报错：org.postgresql.util.PSQLException: ERROR: tuple concurrently updated - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

在DLI控制台配置表权限 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线