搜索_华为云

CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka的地址 > 测试）。如果能连

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的HBase和MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

交记录使其可见。用户控制何时/如何触发具有多个属性的提交。流式写入不支持插入覆盖。有关可用配置的完整列表，请参阅流式处理接收器。Streaming sink 前提条件该场景作业需要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
左半连接 - 数据湖探索 DLI
左半连接 - 数据湖探索 DLI

注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。此处的attr_expr_list中所涉及的字段只能是左表中的字段，否则会出错。示例返回选课学生的姓名及其所选的课程编号。 1 2 SELECT student_info.name, student_info

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
创建IAM用户并授权使用DLI - 数据湖探索 DLI

如果您需要对您所拥有的DLI资源进行精细的权限管理，您可以使用统一身份认证服务（Identity and Access Management，简称IAM），具体IAM使用场景可以参考权限管理概述。如果华为云账号已经能满足您的要求，不需要创建独立的IAM用户，您可以跳过本章节，不影响您使用DLI服务的其它功能。

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
怎样排查DLI计费异常？ - 数据湖探索 DLI

了大量数据而产生的计费。具体操作请参考数据存储。数据存储进入“数据管理”>“库表管理”页面。查看所建的数据库中是否有存储在DLI中的数据：单击所要查看的数据库名，进入对应的“表管理”页面；查看对应表的“数据存储位置”是否为DLI。如果有存储在DLI中的数据，则按照存储计费的标准计费。

帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
DLI Hudi元数据 - 数据湖探索 DLI
DLI Hudi元数据 - 数据湖探索 DLI

Lakeformation元数据可在湖仓构建Lakeformation服务的管理控制台中查看。相关操作 DLI SQL队列对接DLI元数据方法：在DLI管理控制台的SQL编辑器页面的“数据目录”中选择“dli”。在“数据库”选项中选择要对接的DLI元数据中的数据库，即可对接到DLI元数据。 DLI通用队列对接DLI元数据方法：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

目前DLI配置SparkUI只展示最新的100条作业信息。终止作业：终止启动中和运行中的作业。重新执行：重新运行该作业。归档日志：将作业日志保存到系统创建的DLI临时数据桶中。提交日志：查看提交作业的日志。 Driver日志：查看运行作业的日志。重新执行作业在“Spark

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
VACUUM - 数据湖探索 DLI
VACUUM - 数据湖探索 DLI

Delta 管理的所有文件，并删除不再处于表事务日志最新状态且超过保留期阈值的数据文件。默认阈值为 7 天。注意事项 RETAIN num HOURS表示保留期阈值，建议设置为至少 7 天。如果对 Delta 表运行VACUUM，则将无法再回头查看在指定数据保留期之前创建的版本。 Delta

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
修改队列定时扩缩容计划（废弃） - 数据湖探索 DLI

String 待修改定时扩缩计划的队列名称。名称长度为1~128个字符，多个队列名称使用逗号“,”分隔。 plan_id 否 Integer 待修改的队列扩缩容计划的ID。多个ID使用逗号“,”分隔。请求示例修改名称为plan_A的扩缩容计划，修改后队列在周四和周五的19：30扩扩缩容至64CUs，且暂不激活该扩缩容计划。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）
预览表内容（废弃） - 数据湖探索 DLI

database_name 是 String 待预览的表所在的数据库名称。 table_name 是 String 待预览的表名称。表2 query参数参数名称是否必选参数类型说明 mode 否 String 预览表的模式，取值为““SYNC””或者““ASYNC””默认值为：“SYNC”。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表4 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
DLI的计费模式有哪些？ - 数据湖探索 DLI

CU时套餐包的额度会按订购周期重置。 DLI表的数据存储按需计费按照存储在DLI服务中的数据存储量（单位为“GB”）收取存储费用。存储费用=单价*存储数据量（GB）*小时数存储套餐包购买了存储量套餐包，按需使用过程中优先抵扣存储套餐包的规格额度，超过套餐包额度的按照按需计费。存储套餐的额度每个小时会重置。

帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
内连接 - 数据湖探索 DLI
内连接 - 数据湖探索 DLI

JOIN：只显示参与连接的表中满足JOIN条件的记录。注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。在一次查询中可以连接两个以上的表。示例通过将student_info与course_info两张表中的课程编号匹配建立JOIN连接，来查看学生姓名及所选课程名称。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
取消批处理作业 - 数据湖探索 DLI

project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。 batch_id 是 String 批处理作业的ID。具体为创建批处理作业中获取的作业ID。请求消息无请求参数。响应消息表2 响应参数参数名称是否必选参数类型说明 msg 否 String

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

（笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders INNER JOIN Product ON Orders.productId = Product

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

（笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders INNER JOIN Product ON Orders.productId = Product

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

使用JDBC连接DLI提交的作业运行在Spark引擎上。 JDBC版本2.X版本功能重构后，仅支持从DLI作业桶读取查询结果，如需使用该特性需具备以下条件：在DLI管理控制台“全局配置 > 工程配置”中完成作业桶的配置。 2024年5月起，新用户可以直接使用DLI服务的“查询结果写入桶”功能，无需开通白名单。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

配置”应用程序”，路径指向上一步上传至OBS的Spark jar包。配置委托。选择提交DLI作业所需的委托。自定义委托请参考创建DLI自定义委托。配置”主类（--class）”，为上一步中所写的，包含需要执行的main函数的类的全名。在”Spark参数（--conf）“处

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

（笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders INNER JOIN Product ON Orders.productId = Product

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML

总条数： 926

上一页
1
...
19
20
21
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CSV Format - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

左半连接 - 数据湖探索 DLI

创建IAM用户并授权使用DLI - 数据湖探索 DLI

怎样排查DLI计费异常？ - 数据湖探索 DLI

DLI Hudi元数据 - 数据湖探索 DLI

管理Spark作业 - 数据湖探索 DLI

VACUUM - 数据湖探索 DLI

修改队列定时扩缩容计划（废弃） - 数据湖探索 DLI

预览表内容（废弃） - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

DLI的计费模式有哪些？ - 数据湖探索 DLI

内连接 - 数据湖探索 DLI

取消批处理作业 - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线