搜索_华为云

Hudi表模型设计规范 - 数据湖探索 DLI

因此在实时入湖场景中需要选择MOR表模型。 Hudi表名以及列名采用小写字母。多引擎读写同一张Hudi表时，为了规避引擎之间大小写的支持不同，统一采用小写字母。建议 Spark批处理场景，对写入时延要求不高的场景，采用COW表。 COW表模型中，写入数据存在写放大问题，因此写

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

说明 Native性能加速 Spark查询语句性能提升。元数据访问性能提升提升Spark在处理大数据时的元数据访问性能，提高数据处理流程效率。提升OBS committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

<scope>provided</scope> </dependency> 使用方式将写好的自定义函数打成JAR包，并上传到OBS上。在DLI管理控制台的左侧导航栏中，单击数据管理>“程序包管理”，然后单击创建，并使用OBS中的jar包创建相应的程序包。在DLI管理控制台的左侧导航栏中，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

使用该功能，所有涉及OBS的桶，都需要进行配置AKSK。语法格式在Spark Jar作业编辑界面，选择配置优化参数，配置信息如下: 不同的OBS桶，使用不同的AKSK认证信息。可以使用如下配置方式，根据桶指定不同的AKSK信息，参数说明详见表1。 spark.hadoop.fs.obs.bucket.USER_BUCKET_NAME

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
普通队列弹性扩缩容 - 数据湖探索 DLI

情况，判断是否存在缩容空间，如果现有资源无法按照最小缩容步长执行缩容任务，则队列可能缩容不成功，或缩容一部分规格的情况。因资源规格不同可能有不同的缩容步长，通常是16CUs、32CUs、48CUs、64CUs等。示例：队列大小为48CUs，执行作业占用了18CUs，剩余30C

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

的条数上限，则停止存储数据，以batch.size.entries为准，提交该批次的数据。 es.nodes.wan.only 是否仅通过域名访问es节点，默认为false。使用经典型跨源的连接地址作为es.nodes时，该参数需要配置为true；使用css服务提供的原始内网IP地址作为es

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
Flink SQL作业类 - 数据湖探索 DLI

dler参数填写retry_rejected导致提交失败 Kafka Sink配置发送失败重试机制如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？作业语义检验时提示DIS通道不存在怎么处理？ Flink jobmanager日志一直报Timeout

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

Database中的表名，由字母、数字和下划线（_）组成。 boolExpression 过滤条件表达式。 columnList z排序指定的字段列表，Z顺序列应与分区列不同。所需权限 SQL权限表2 OPTIMIZE所需权限列表权限描述表的UPDATE权限细粒度权限：dli:table:update。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

查询凭据。约束限制仅支持Spark3.3.1版本（Spark通用队列场景）使用委托授权访问临时凭证：在创建作业时，请配置作业使用Spark3.3.1版本已在作业中配置允许DLI访问DEW的委托信息。spark.dli.job.agency.name=自定义委托名称。自定义委托请参考自定义DLI委托权限。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
使用DataSource语法创建OBS表 - 数据湖探索 DLI

示例说明：创建一个名为student的分区表，该分区表使用院系编号（facultyNo）和班级编号（classNo）进行分区。该student表会同时按照不同的院系编号（facultyNo）和不同的班级编号（classNo）分区。在实际的使用过程中，您可以选择合适的分区字段并将其添加到PARTITIONED BY关键字后的括号内。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

模式示例。 table模式采用hash类型存储数据，与基本hash类型将表的三个字段分别作为key、hash_key、hash_value不同，table模式下的key值可以通过“connector.table-name”和“connector.key-column”两个参数设置

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

Flink作业创建权限策略：策略名称：可以使用默认名称，也可以自定义。作用范围：选择“项目级服务”。策略配置方式：选择“可视化视图”。策略内容：依次选择“允许”，“数据湖探索”，“dli:jobs:list_all”。单击“确认”，创建策略。图3 创建策略在“用户组”页面，找到需要授权

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

并且促使各个厂商以及研究机构将该项技术推向极限。本示例将演示DLI直接对存储在OBS中的TPC-H数据集进行查询的操作，DLI已经预先生成了100M的TPC-H-2.18的标准数据集，已将数据集上传到了OBS的tpch文件夹中，并且赋予了只读访问权限，方便用户进行查询操作。 TPC-H的测试和度量指标

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
字符类型 - 数据湖探索 DLI
字符类型 - 数据湖探索 DLI

--查询数据 select * from binary_tb ; -- 63 68 3f 在做CHAR 数值比较的时候，在对两个仅尾部空格数不同的CHAR进行比较时，会认为它们是相等的。 SELECT CAST('FO' AS CHAR(4)) = CAST('FO ' AS

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

您可以将 CUMULATE 函数视为首先应用具有最大窗口大小的 TUMBLE 窗口，然后将每个滚动窗口拆分为具有相同窗口开始但窗口结束步长不同的几个窗口。所以累积窗口会产生重叠并且没有固定大小。例如：1小时步长，24小时大小的累计窗口，每天可以获得如下这些窗口：[00:00,

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

更多介绍和使用请参考开源社区文档：分组聚合。 DISTINCT 聚合 DISTINCT 聚合在聚合函数前去掉重复的数据。下面的示例计算 Orders 表中不同 order_ids 的数量，而不是总行数。 SELECT COUNT(DISTINCT order_id) FROM Orders GROUPING

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
故障处理 - 数据湖探索 DLI
故障处理 - 数据湖探索 DLI

故障处理运行Spark作业，作业运行失败，作业日志中提示No respond错误问题现象运行Spark作业，作业运行失败，作业日志中提示No respond错误解决方案重新创建Spark作业，创建作业时需要在“Spark参数（--conf）”中添加配置：“spark.sql

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

SDK让您无需关心请求细节即可快速使用数据湖探索服务。本节操作介绍如何在Python环境获取并使用SDK。使用须知要使用DLI Python SDK访问指定服务的 API ，您需要确认已在DLI管理控制台开通当前服务并完成服务授权。 Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
DIS源表 - 数据湖探索 DLI
DIS源表 - 数据湖探索 DLI

pp-name需要同时配置。 connector. checkpoint-app-name 否 DIS服务的消费者标识，当不同作业消费相同通道时，需要区分不同的消费者标识，以免checkpoint混淆。勿与offset或start-time同时设置；若enable-checkpoint为true，则需要同时配置。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
DLI作业开发流程 - 数据湖探索 DLI

上传数据至OBS请参考《对象存储用户指南》。当需要将来自不同源的数据进行集中存储和处理时，迁移数据至DLI可以提供一个统一的数据平台。您可以参考使用CDM迁移数据至DLI迁移数据至DLI后再提交作业。如果业务需求需要实时访问和处理来自不同数据源的数据，跨源访问可以减少数据的复制和延迟。

帮助中心 > 数据湖探索 DLI > 用户指南

总条数： 472

上一页
1
...
14
15
16
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表模型设计规范 - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

普通队列弹性扩缩容 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Flink SQL作业类 - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

字符类型 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

故障处理 - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

DIS源表 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线