搜索_华为云

SDK的获取与安装 - 数据湖探索 DLI

Java SDK：安装服务级SDK依赖首先您需要在您的操作系统中下载并安装Maven 。安装配置完成后，输入命令“mvn -v”,显示如下图 Maven版本信息表示成功。 Maven安装完成后，可根据开发需要，直接引入依赖到已有的Maven工程或先用开发工具创建Maven工程。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
查询所有队列 - 数据湖探索 DLI

是否返回权限信息。 with-charge-info 否 Boolean 是否返回收费信息。 page-size 否 Integer 每页显示的最大结果行数，默认值Integer.MAX_VALUE（也即不分页）。 current-page 否 Integer 当前页码，默认为第一页。

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
Map函数和运算符 - 数据湖探索 DLI

function(K, V1, V2, V3)) 描述：通过将函数应用于具有相同键的一对值，将两个给定的map合并为一个map。对于仅在一个map中显示的键，将传递NULL作为缺少键的值。 SELECT map_zip_with(MAP(ARRAY[1, 2, 3], ARRAY['a',

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
pyspark样例代码 - 数据湖探索 DLI

控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。创建Spark作业完成后，在控制台单击右上角“执行”提交作业，页面显示“批处理作业提交成功”说明Spark作业提交成功，可以在Spark作业管理页面查看提交的作业的状态和日志。创建Spark作业时选择的“所属队列”为创建跨源连接时所绑定的队列。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
查询所有作业 - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。表2 query参数参数名称是否必选参数类型说明 page-size 否 Integer 每页显示的最大作业个数，范围: [1, 100]。默认值：50。 current-page 否 Integer 当前页码，默认为第一页。 start

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
查询作业模板列表 - 数据湖探索 DLI

keyword 否 String 模板名过滤关键字，模糊匹配，获取模板名含有该关键字的所有模板。 page-size 否 Integer 每页显示的最大结果行数，范围: [1, 100]。默认值为：50。 current-page 否 Integer 当前页码，默认为第一页。请求参数

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
Confluent Avro Format - 数据湖探索 DLI

avro-confluent.properties 否无 Map 转发到底层Schema Registry的属性Map。这对于没有通过Flink显示配置的配置项非常有用。但是，请注意，Flink配置项具有更高的优先级。 avro-confluent.ssl.keystore.location

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用DLI分析账单消费数据 - 数据湖探索 DLI

算资源使用量消费最多。图2 费用汇总单击“账单详情 > 自定义账单”，单击“维度设置”，选择“按使用量”。“统计周期”选择“明细”。在显示数据的标题行，“产品类型”选择“数据湖探索 DLI”，“产品”选择“DLI计算资源使用量”，单击“导出账单”。图3 导出消费数据左侧导

 帮助中心 > 数据湖探索 DLI > 最佳实践
DLI自定义策略 - 数据湖探索 DLI

服务级条件键，仅适用于对应服务的操作。运算符与条件键一起使用，构成完整的条件判断语句。具体内容请参考表1。 DLI通过IAM预置了一组条件键。下表显示了适用于DLI服务特定的条件键。表1 DLI请求条件 DLI条件键类型运算符描述 g:CurrentTime 全局级 Date and

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

host 需要连接的redis集群的IP。获取方式为：登录华为云官网，之后搜索redis，进入“分布式缓存服务”,接着选择“缓存管理”，根据主机名称需要的IP，可选择其中任意一个IP进行复制即可（其中也包含了port信息），请参考图1。 port 访问端口。 password 连接密码。无密码时可以不填写该参数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

execute("select * from tb1"); 获取结果。 ResultSet rs = statement.getResultSet(); 显示结果。 while (rs.next()) { int a = rs.getInt(1); int b = rs.getInt(2); }

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
ALTER TABLE - 数据湖探索 DLI
ALTER TABLE - 数据湖探索 DLI

可以使用ALTER TABLE [PARTITION] SET位置设置表的表或分区位置。在Set location命令之后，表/分区数据可能不会显示。 Set location在创建表/分区目录时会使用给定目录路径，而不是hive在创建表/分区时创建的默认路径。该语句不会对表或分区原

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

执行sql： DESCRIBE FORMATTED test_like_properties; Spark 2.4.5 正常显示location Spark 3.3.1 正常显示location 示例代码2：准备数据： CREATE TABLE test_like_properties0(id

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
创建批处理作业 - 数据湖探索 DLI

批处理作业的状态，详细说明请参见表7。 kind 否 String 批处理作业类型，只支持spark类型参数。 log 否 Array of strings 显示当前批处理作业的最后10条记录。 sc_type 否 String 计算资源类型。用户自定义时返回CUSTOMIZED。 cluster_name

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

格式为："ZK_IP1:ZK_PORT1,ZK_IP2:ZK_PORT2"。说明：访问MRS集群，只支持创建增强型跨源连接并且需要配置主机信息，管理控制台操作请参考《数据湖探索用户指南》中的“增强型跨源连接”，相关API信息请参考创建增强型跨源连接。 RowKey 指定作为r

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

创建表时只需指定数据文件所在的OBS存储路径，目录后不需要指定文件名。表table1创建成功后，单击左侧“数据库”页签，再单击db1，新创建的表table1会在“表”区域下方显示。步骤5：查询数据完成以上步骤后，就可以开始进行数据查询了。单击“SQL编辑器”页面左侧的“数据库”页签，选择新创建的表table1

帮助中心 > 数据湖探索 DLI > 快速入门
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

其他参数请参考创建Spark作业中关于Spark作业编辑页面的说明。单击Spark作业编辑页面右上方“执行”，阅读并同意隐私协议，单击“确定”。提交作业，页面显示“作业提交成功”。（可选）可到“作业管理”>“Spark作业”页面查看提交作业的状态及日志。在DLI管理控制台第一次单击“执行”操作时

 帮助中心 > 数据湖探索 DLI > 快速入门
DLI数据库和表类 - 数据湖探索 DLI

DLI数据库和表类为什么在DLI控制台中查询不到表？ OBS表压缩率较高怎么办？字符码不一致导致数据乱码怎么办？删除表后再重新创建同名的表，需要对操作该表的用户和项目重新赋权吗？ DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？创建OB

帮助中心 > 数据湖探索 DLI > 常见问题
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

启动作业后，系统将自动跳转到Flink作业管理页面，在“状态”列中可以查看作业状态。作业提交成功后，状态将由“提交中”变为“运行中”。运行完成后显示“已完成”。如果作业状态为“提交失败”或“运行异常”，表示作业提交或运行失败。用户可以在作业列表中的“状态”列中，将鼠标移动到状态图标上

 帮助中心 > 数据湖探索 DLI > 快速入门
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？数据湖探索（DLI）服务对于PySpark是原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Py

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类

总条数： 285

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SDK的获取与安装 - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

Map函数和运算符 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

查询所有作业 - 数据湖探索 DLI

查询作业模板列表 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

DLI自定义策略 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

ALTER TABLE - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

DLI数据库和表类 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线