搜索_华为云

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

在执行Group By聚合操作时，如果某些分组键对应的数据量特别大，而其他分组键对应的数据量很小，在聚合过程中，数据量大的分组会占用更多的计算资源和时间，导致处理速度变慢，出现数据倾斜。 JOIN 操作倾斜在执行表JOIN操作时，参与JOIN的键在某个表中分布极不均匀，导致大量数据集中

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

的Jar，同样的Python程序也有依赖一些第三方库，尤其是基于PySpark的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
CREATE TABLE LIKE - 数据湖探索 DLI
CREATE TABLE LIKE - 数据湖探索 DLI

对于从表中复制过来的属性，可以使用WITH子句指定属性名进行修改。默认使用EXCLUDING PROPERTIES属性。对于带分区的表，如果用括号包裹like子句，复制的列定义不会包含分区键的信息。示例创建基础表order01和order02 CREATE TABLE order01(id

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
OVER - 数据湖探索 DLI
OVER - 数据湖探索 DLI

ROW | ( UNBOUNDED | [num]) FOLLOWING)]); 关键字 PARTITION BY：可以用一个或多个键分区。和GROUP BY子句类似，PARTITION BY将表按分区键分区，每个分区是一个窗口，窗口函数作用于各个分区。单表分区数最多允许7000个。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

参考增强型跨源连接，在DLI上根据MySQL和Kafka所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置MySQL和Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性分别根据MySQL和Kafka的地址测试队列连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
获取项目ID - 数据湖探索 DLI
获取项目ID - 数据湖探索 DLI

获取项目ID的接口为“GET https://{Endpoint}/v3/projects”，其中{Endpoint}为IAM的终端节点，可以从地区和终端节点获取。响应示例如下，例如DLI服务部署的区域为“cn-north-4”，相应消息体中查找“name”为“cn-north-4”，其

 帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

krb5.conf的地址。 'keytab'='./user.keytab' Keytab的地址。 'principal' ='krbtest' 认证用户名。 krb5.conf和keytab文件获取请具体参考开启Kerberos认证时的相关配置文件操作说明。插入数据 1 sparkSession

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
instr1 - 数据湖探索 DLI
instr1 - 数据湖探索 DLI

str1中的位置。相似函数：instr，instr函数用于返回substr在str中最早出现的下标。但是instr不支持指定起始搜索位置和匹配次数。命令格式 instr1(string <str1>, string <str2>[, bigint <start_position>[

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

password 否 redis认证密码。 connector.deploy-mode 否 redis部署模式，支持standalone/cluster，默认standalone connector.table-name 否 table存储模式下必配，redis中存储表名。在table存储模式下

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

<descriptorRefs> <descriptorRef>jar-with-dependencies</descriptorRef> </descriptorRefs>

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

例如：CU数量为9CU，管理单元为1CU，最大并行数为16，则计算单元为8CU。如果不手动配置TaskManager资源，则单TM所占CU数默认为1，单TM slot数显示值为0，但实际上，单TM slot数值依据上述公式计算结果为2。如果手动配置TaskManager资源，请依

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
查询Spark作业日志 - 数据湖探索 DLI

对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。 Spark日志分割规则：按大小分割：默认情况下，每个日志文件最大为128MB。按时间分割：每过一小时自动创建新的日志文件。前提条件配置前，请先购买OBS桶或并行文件系统。大

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
Flink Jar 包冲突，导致作业提交失败 - 数据湖探索 DLI

Flink平台的内置依赖包冲突，导致提交失败。解决方案首先您需要排除是否有冲突的Jar包。含DLI Flink提供了一系列预装在DLI服务中的依赖包，用于支持各种数据处理和分析任务。如果您上传的Jar包中包含DLI Flink运行平台中已经存在的包，则会提示Flink Jar 包冲突，导致作用提交失败。请参

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
Flink作业常用操作 - 数据湖探索 DLI

确认“配置文件”和“同名作业策略”配置无误。单击“确认导入”，完成导入作业。修改Flink作业名称和描述信息用户可以根据需要修改作业名称和描述。在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Flink作业”，进入Flink作业管理页面。在需要修改名称和描述的作业对应的“操作”列中，单击“更多

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
类型转换函数 - 数据湖探索 DLI

TYPEOF(input) | TYPEOF(input, force_serializable) 返回输入表达式的数据类型的字符串表示形式。默认情况下返回的字符串是一个摘要字符串，可能会为了可读性而省略某些细节。如果 force_serializable 设置为 TRUE，则字符

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
存储计费 - 数据湖探索 DLI
存储计费 - 数据湖探索 DLI

保留期到期后，若您仍未支付账户欠款，那么资源将被释放，数据无法恢复。华为云根据客户等级定义了不同客户的宽限期和保留期时长。关于充值的详细操作请参见账户充值。按需计费模式和套餐包组合使用 DLI支持套餐包和按需计费模式结合使用。购买了存储量套餐包，按需使用过程中优先抵扣存储套餐包的规格额度，超

 帮助中心 > 数据湖探索 DLI > 计费说明
Flink作业推荐配置指导 - 数据湖探索 DLI

例如：CU数量为9CU，管理单元为1CU，最大并行数为16，则计算单元为8CU。如果不手动配置TaskManager资源，则单TM所占CU数默认为1，单TM slot数显示值为0，但实际上，单TM slot数值依据上述公式计算结果为2。如果手动配置TaskManager资源，请依

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
修改弹性资源池关联队列的扩缩容策略 - 数据湖探索 DLI

Array of objects 该队列在该弹性资源池下的扩缩容策略信息。单条策略信息包含时间段、优先级和CU范围。每个队列至少要配置一条时间段为[00:00, 24:00]的默认扩缩容策略。详细参数说明请参考表3。表3 queue_scaling_policies 参数是否必选

 帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
自动续费 - 数据湖探索 DLI
自动续费 - 数据湖探索 DLI

自动续费可以减少手动续费的管理成本，避免因忘记手动续费而导致资源被自动删除。自动续费的规则如下所述：以资源的到期日计算第一次自动续费日期和计费周期。您可以在购买资源时开通自动续费，在购买资源时，自动续费周期以实际选择的续费时长为准。在到期前均可开通自动续费，到期前7日凌晨3

帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
Hudi Archive操作说明 - 数据湖探索 DLI

archive.automatic=true hoodie.keep.max.commits=30 // 默认值为30，根据业务场景指定 hoodie.keep.min.commits=20 // 默认值为20，根据业务场景指定 SparkDataSource（option里设置如下参数，写数据时触发）

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护

总条数： 660

上一页
1
...
24
25
26
...
33
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

CREATE TABLE LIKE - 数据湖探索 DLI

OVER - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

获取项目ID - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

instr1 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

Flink Jar 包冲突，导致作业提交失败 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

存储计费 - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

修改弹性资源池关联队列的扩缩容策略 - 数据湖探索 DLI

自动续费 - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线