搜索_华为云

DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

Development Kit）是对DLI服务提供的REST API进行的作业提交的封装，以简化用户的开发工作。用户直接调用DLI SDK提供的接口函数即可实现使用提交DLI SQL和DLI Spark作业。 DLI支持的SDK分为SDK V3和DLI服务自行开发的SDK。（推荐）DLI SDK

帮助中心 > 数据湖探索 DLI > SDK参考
ARCHIVELOG - 数据湖探索 DLI
ARCHIVELOG - 数据湖探索 DLI

ARCHIVELOG 命令功能用于根据配置对Timeline上的Instant进行归档，并从Timeline上将已归档的Instant删除，以减少Timeline的操作压力。命令格式 RUN ARCHIVELOG ON tableIdentifier; RUN ARCHIVELOG

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
Hudi数据表Archive规范 - 数据湖探索 DLI

Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。对于Hudi的MOR类型和COW类型的表，都需要开启Archive。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
创建DLI表关联OpenTSDB - 数据湖探索 DLI

在多个节点时，用分号间隔。 metric 所创建的DLI表对应的OpenTSDB中的指标名称。 tags metric对应的标签，用于归类、过滤、快速检索等操作。可以是1个到8个，以“,”分隔，包括对应metric下所有tagk的值。注意事项创建DLI表时，不需要指定time

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接OpenTSDB表
DIS源表 - 数据湖探索 DLI
DIS源表 - 数据湖探索 DLI

Service，简称DIS）为处理或分析流数据的自定义应用程序构建数据流管道，主要解决云服务外的数据实时传输到云服务内的问题。数据接入服务每小时可从数十万种数据源（如IoT数据采集、日志和定位追踪事件、网站点击流、社交媒体源等）中连续捕获、传送和存储数TB数据。DIS的更多信息，请参见《数据接入服务用户指南》。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

SQL作业存在join小表操作时，会触发自动广播所有executor，使得join快速完成。但同时该操作会增加executor的内存消耗，如果executor内存不够时，导致作业运行失败。解决措施排查执行的SQL中是否有使用“/*+ BROADCAST(u) */”强制做broadcastjoin。如果有，则需要去掉该标识。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
concat - 数据湖探索 DLI
concat - 数据湖探索 DLI

array<string> <a>) 返回将参数中的所有字符串或ARRAY数组中的元素按照指定的分隔符连接在一起的结果。参数说明表1 参数说明参数是否必选参数类型说明 separator 是 STRING STRING类型的分隔符。 str1、str2 是 STRING 至少要指定2个字符串。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
终端节点 - 数据湖探索 DLI
终端节点 - 数据湖探索 DLI

终端节点终端节点（Endpoint）即调用API的请求地址，不同服务不同区域的终端节点不同，您可以从地区和终端节点中查询所有服务的终端节点。数据湖探索的终端节点如下表所示，请您根据业务需要选择对应区域的终端节点。表1 数据湖探索的终端节点区域名称区域终端节点（Endpoint）

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

TypeSerializer 序列化的字节序列。示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

Queries）可以读到最新的commit/compaction产生的快照。对于MOR表，还会在查询中合并最新的delta log文件的内容，使读取的数据近实时。增量查询增量查询（Incremental Queries）只会查询到给定的commit/compaction之后新增的数据。读优化查询

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
Data masking函数 - 数据湖探索 DLI

数据脱敏(Data masking) 指对某些敏感信息通过脱敏规则进行数据的变形，实现敏感隐私数据的可靠保护。 mask_first_n(string str[, int n]) →varchar 描述：返回str的屏蔽版本，前n个值被屏蔽。大写字母被转为＂X＂，小写字母被转为＂x＂，数字被转为＂n＂。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
计费样例 - 数据湖探索 DLI
计费样例 - 数据湖探索 DLI

示例价格仅供参考，实际计算请以DLI产品价格详情中的信息为准。更多示例参考DLI产品价格详情。计费构成分析基于此案例，可详细计算出按需计费和包年/包月两种不同的计费模式的消费情况。此案例中的单价仅为示例，且计算出的费用为估算值。单价的变动和实际场景中计算出来的费用可能会有偏差。请以华为云官网发布的数据为准。计费模式

 帮助中心 > 数据湖探索 DLI > 计费说明
窗口Top-N - 数据湖探索 DLI
窗口Top-N - 数据湖探索 DLI

窗口Top-N 功能描述窗口 Top-N 是特殊的 Top-N，它返回每个分区键的每个窗口的N个最小或最大值。与普通Top-N不同，窗口Top-N只在窗口最后返回汇总的Top-N数据，不会产生中间结果。窗口 Top-N 会在窗口结束后清除不需要的中间状态。窗口 Top-N 适用于用户

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
增强型跨源连接权限管理 - 数据湖探索 DLI

增强型跨源支持项目级授权，授权后，项目内的用户具备该增强型跨源连接的操作权。可查看该增强型跨源连接、可将创建的弹性资源池与该增强型跨源连接绑定、可自定义路由等操作。以此实现增强型跨源连接的跨项目应用。本节操作介绍对增强型跨源连接授权或回收权限的操作步骤。如果被授权的项目属于相同区域（region）的不同用户，

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
SHOW TABLE - 数据湖探索 DLI
SHOW TABLE - 数据湖探索 DLI

abase中的table，或所有指定database的table。命令格式 SHOW TABLES [IN db_name]; 参数描述表1 SHOW TABLES参数描述参数描述 IN db_name Database名称，仅当需要显示指定Database的所有Table时配置。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
提交作业时提示作业桶权限不足怎么办？ - 数据湖探索 DLI

使用DLI作业桶需要确保已完成DLI作业桶的权限配置。您需要在OBS管理控制台中检查DLI作业桶的桶策略，确保策略中包含了允许DLI服务进行必要操作的授权信息。确保没有任何策略明确拒绝了DLI服务对桶的访问。IAM策略是优先考虑拒绝（deny）权限的，即使有允许（allow）权限，如果有拒绝权限存在，也会导致授权失败。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码开发说明本样例只适用于MRS的OpenTSDB。前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

OPTIMIZE 命令功能 OPTIMIZE命令用于优化数据在存储中的布局，提高查询速度。注意事项由于Optimize是一项耗时的活动，因此需要根据更好的最终用户查询性能与优化计算时间之间的权衡来确定运行Optimized的频率。分区表优化需要设置参数spark.sql.force

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
encode - 数据湖探索 DLI
encode - 数据湖探索 DLI

encode encode函数用于使用charset的编码方式对str进行编码。命令格式 encode(string <str>, string <charset>) 参数说明表1 参数说明参数是否必选参数类型说明 str 是 STRING 至少要指定2个字符串。 S

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
标示符 - 数据湖探索 DLI
标示符 - 数据湖探索 DLI

output_format_classname partition_col_name partition_col_value partition_specs property_name property_value regex_expression result_expression row_format

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考

总条数： 708

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI SDK简介 - 数据湖探索 DLI

ARCHIVELOG - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

创建DLI表关联OpenTSDB - 数据湖探索 DLI

DIS源表 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

concat - 数据湖探索 DLI

终端节点 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

Data masking函数 - 数据湖探索 DLI

计费样例 - 数据湖探索 DLI

窗口Top-N - 数据湖探索 DLI

增强型跨源连接权限管理 - 数据湖探索 DLI

SHOW TABLE - 数据湖探索 DLI

提交作业时提示作业桶权限不足怎么办？ - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

encode - 数据湖探索 DLI

标示符 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线