搜索_华为云

数据迁移与传输方式概述 - 数据湖探索 DLI

CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。具体操作请参考迁移外部数据源数据至DLI。图1 迁移数据至DLI 配置DLI读写外部数据源如果您不想将数据导入OBS或DLI的数据表中，DLI提供的跨源访问能力，支持您在不迁移数据的情况下，连接数据源获取数据并进行数据分析。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

active/non-active/reserved: 5/508/3 原因分析当前访问的DWS数据库连接已经超过了最大连接数。错误信息中，non-active的个数表示空闲连接数，例如，non-active为508，说明当前有大量的空闲连接。解决方案出现该问题时建议通过以下操作步骤解决。登录D

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

基准测试的度量单位是每小时执行的查询数( QphH@size)，其中“H”表示每小时系统执行复杂查询的平均次数，“size”表示数据库规模的大小，能够反映出系统在处理查询时的能力。TPC-H 是根据真实的生产运行环境来建模的,这使得它可以评估一些其他测试所不能评估的关键性能参数。总而言之，TPC组织颁布的TPC-H

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
创建DLI表关联DDS - 数据湖探索 DLI

authSource=admin" database DDS的数据库名，如果在"url"中同时指定了数据库名，则"url"中的数据库名不生效。 collection DDS中的collection名，如果在"url"中同时指定了collection，则"url"中的collection不生效。 user

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DDS表
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列-->找到作业的所属队列-->更多-->测试地址连通性-->输入kafka的地址-->测试）。若能连通，则表示跨源已经绑定成功；否则表示未成功。创建flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
DLI自定义策略 - 数据湖探索 DLI

策略。IAM最新提供的一种细粒度授权的能力，可以精确到具体服务的操作、资源以及请求条件等。 Effect 作用。包含两类：允许（Allow）和拒绝（Deny），既有Allow又有Deny的授权语句时，遵循Deny优先的原则。 Action 授权项，指对资源的具体操作权限，不超过100个，如图1所示。

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
新建跨源连接，显示已激活，但使用时提示communication link failure错误怎么办？ - 数据湖探索 DLI

检查DLI队列对应网段是否开放，若没有，则在vpc中添加出方向网段。在DLI服务找到跨源连接绑定队列对应的网段图6 查找跨源连接绑定队列对应的网段在虚拟私有云安全组中查看DLI队列对应的网段是否已配置。图7 查看vpc中对应安全组中DLI队列对应网段如果没有配置，则进行添加。图8

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
创建DLI程序包 - 数据湖探索 DLI

选择“已有分组”：可选择已有的分组。选择“创建新分组”：可输入自定义的组名称。选择“不分组”：不需要选择或输入组名称。说明：如果选择分组，则对应的权限管理为对应程序包组的权限管理。如果选择不分组，则对应的权限管理为对应程序包的权限管理。程序包组和程序包权限管理请参考程序包权限管理。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

口功能，因此需要获得VPC（虚拟私有云）的VPC Administrator权限。客户未给VPC服务授权导致DLI跨源连接报错找不到子网。处理步骤登录DLI管理控制台，选择“全局配置 > 服务授权”。在委托设置页面，按需选择所需的委托权限。其中“DLI Datasource

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？什么是数据倾斜？数据倾斜是在SQL作业执行中常见的问题，当数据分布不均匀的情况下，一部分计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所示，查看到一个stage运行时间超过

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
pyspark样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建增强跨源连接，并绑定包年/包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。通过DataFrame API 访问 import相关依赖

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
FileSytem结果表 - 数据湖探索 DLI

type' = '' ); 注意事项该建表语法的数据输出目录为OBS时，OBS必须为并行文件系统，不能为OBS桶。使用fileSystem时必须开启checkpoint，保证作业的一致性。 format.type为parquet时，支持的数据类型为string, boolean, tinyint

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

年/包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现详解导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？问题现象 DLI分区内表导入了CSV文件数据，导入的文件数据没有包含对应分区列的字段数据。分区表查询时需要指定分区字段，导致查询不到表数据。问题根因 DLI分区内表在导入数据时，如果文件数据没

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

uri uri的格式为：mongodb://username:pwd@host:8635/db 其中以下参数需要修改为实际值： “username”为创建的mongo（DDS）数据库用户名。 “pwd”为创建的mongo（DDS）数据库用户名对应的密码。 “host”为创建的mongo（DDS）数据库实例IP。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

SQL作业存在join小表操作时，会触发自动广播所有executor，使得join快速完成。但同时该操作会增加executor的内存消耗，如果executor内存不够时，导致作业运行失败。解决措施排查执行的SQL中是否有使用“/*+ BROADCAST(u) */”强制做broadcastjoin。如果有，则需要去掉该标识。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

窗口去重功能描述窗口去重是一种特殊的去重，它根据指定的多个列来删除重复的行，保留每个窗口和分区键的第一个或最后一个数据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
Hudi Clustering操作说明 - 数据湖探索 DLI

调度Clustering：使用可插拔的Clustering策略创建Clustering计划。识别符合Clustering条件的文件：根据所选的Clustering策略，调度逻辑将识别符合Clustering条件的文件。根据特定条件对符合Clustering条件的文件进行分组。每个组的数据大小应为t

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

TypeSerializer 序列化的字节序列。示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。 Hive 方言支持的 DDL 语句，Flink 1.15 当前仅支持使用Hive语法创建OBS表和使用hive语法的DLI Lakehouse表。使用Hive语法创建OBS表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive

总条数： 495

上一页
1
...
16
17
18
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据迁移与传输方式概述 - 数据湖探索 DLI

Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

创建DLI表关联DDS - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

DLI自定义策略 - 数据湖探索 DLI

新建跨源连接，显示已激活，但使用时提示communication link failure错误怎么办？ - 数据湖探索 DLI

创建DLI程序包 - 数据湖探索 DLI

DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线