搜索_华为云

导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

table_name 需要导入数据的DLI表的名称。以下是可以在导入数据时使用的配置选项： DATA_TYPE: 指定导入的数据类型，当前支持CSV、Parquet、ORC、JSON、Avro类型，默认值为“CSV”。配置项为OPTIONS('DATA_TYPE'='CSV') 导入CSV和JSON文件时，有三种模式可以选择：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
DROP TABLE - 数据湖探索 DLI
DROP TABLE - 数据湖探索 DLI

Database名称。如果未指定，将选择当前database。 table_name 需要删除的Table名称。注意事项在该命令中，IF EXISTS和db_name是可选配置。在使用本语句删除外表时，OBS目录的数据不会自动删除。删除MOR表时，后缀_rt表和后缀_ro表不会自动删除，如需删除需要额外执行DROP语句。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。操作前准备导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
percentile - 数据湖探索 DLI
percentile - 数据湖探索 DLI

percentile_approx percentile_approx函数用于返回组内数字列近似的第p位百分数（包括浮点数）。命令格式 percentile_approx(DOUBLE col, p [, B]) 参数说明表1 参数说明参数是否必选说明 col 是数据类型为数值的列。其他类型返回NULL。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
percentlie - 数据湖探索 DLI
percentlie - 数据湖探索 DLI

colname 是 STRING类型代表需要排序的列名。列中元素为DOUBLE类型。当列中元素非DOUBLE类型时，会隐式转换为DOUBLE类型后参与运算。 p 是 DOUBLE类型参数a的格式包括浮点数格式、整数格式、字符串格式。参数p的范围为0-1。参数p的格式包括浮点数格式。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

盖了全量数据而不是预期的分区数据，这可能是因为动态分区覆盖功能没有被启用。如果需要动态覆盖DataSource表指定的分区数据，您需要先配置参数 dli.sql.dynamicPartitionOverwrite.enabled=true，然后通过insert overwrite语句实现。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

DATE_FORMAT (order_time, 'yyyyMMdd') from orderSource; 配置作业运行参数：选择队列，并配置Flink版本至少为1.15。配置权限足够的委托。配置OBS桶。开启Checkpoint，使用Hudi时必须开启Checkpoint。提交作业并检查Flink

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
pyspark样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现详解 import相关依赖包 1 2 3 from __future__ import

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

OpenSource SQL作业。单击操作列的“编辑”，进入作业编辑页面。在右侧的“运行参数”配置区域，选择新的Flink版本。使用Flink 1.15以上版本的引擎执行作业时，需要在自定义配置中配置委托信息，其中key为"flink.dli.job.agency.name"，valu

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

认的扩缩容策略不支持时间段配置修改。弹性资源池扩缩容策略生效规则为：在任意一个时间段周期内，优先满足所有队列的最小CU数，剩余的CU（弹性资源池最大CU-所有队列的最小CU数之和）则根据配置的优先级顺序分配，直到剩余的CU数分配完成。队列扩容成功后，系统开始对扩容的CU进行计

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
故障处理 - 数据湖探索 DLI
故障处理 - 数据湖探索 DLI

on: Message stream modified (41) 解决方案编辑“krb5.conf” 配置文件，将文件中所有“renew_lifetime = xxx”配置删除。重新创建和提交Spark作业。父主题：对接HBase

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

from dli_to_rd").show(); 插入数据后：提交Spark作业将写好的代码生成jar包，上传至OBS桶中。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。创建Spark作业完成后，在控制台单击右上角“执行”提交作业，页面显示“批处理作

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
JDBC维表 - 数据湖探索 DLI
JDBC维表 - 数据湖探索 DLI

读取数据库中的数据所在的表名。 driver 否连接数据库所需要的驱动。若未配置，则会自动通过URL提取。 username 否数据库认证用户名，需要和'password'一起配置。 password 否数据库认证密码，需要和'username'一起配置。 scan.partition.column 否

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
pyspark样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。操作前准备 import相关依赖包 1 2 3 from __future__ import

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual C++编译环境Visual C++ build tools 或者 Visual Studio。关于Python开发环境的配置请参考Python SDK环境配置。 DLI Python SDK依赖第三方库包括：urllib3

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
Java SDK概述 - 数据湖探索 DLI
Java SDK概述 - 数据湖探索 DLI

权。 Java SDK 支持 Java JDK 1.8 及其以上版本。关于Java开发环境的配置请参考Java SDK环境配置。关于Java SDK的获取与安装请参考SDK的获取与安装。使用SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
Hudi Clustering操作说明 - 数据湖探索 DLI

了能够在文件大小和入湖速度之间进行权衡，Hudi提供了一个hoodie.parquet.small.file.limit配置来设置最小文件大小。用户可以将该配置设置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

Spark作业相关前提条件已参考Java SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化，参考队列相关完成队列创建等操作。提交批处理作业 DLI提供执行批处理作业的接口。您可以使用该接口执行批处理作业。示例代码如下： 1

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

建议使用临时AK/SK，获取方式可参见统一身份认证服务_获取临时AK/SK。认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。表1 DLI获取访问凭据相关开发指南类型操作指导说明 Flink作业场景 Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类

总条数： 832

上一页
1
...
8
9
10
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

导入数据 - 数据湖探索 DLI

DROP TABLE - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

percentile - 数据湖探索 DLI

percentlie - 数据湖探索 DLI

为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

故障处理 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

JDBC维表 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

Java SDK概述 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线