搜索_华为云

Spark SQL常用配置项说明 - 数据湖探索 DLI

当子查询中数据不重复的情况下，执行关联子查询，不需要对子查询的结果去重。当子查询中数据重复的情况下，执行关联子查询，会提示异常，必须对子查询的结果做去重处理，比如max(),min()。该参数设置为false：不管子查询中数据重复与否，执行关联子查询时，都需要对子查询的结果去重，比如max()

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
next - 数据湖探索 DLI
next - 数据湖探索 DLI

day_of_week) 参数说明表1 参数说明参数是否必选参数类型说明 start_date 是 DATE 或 STRING 代表需要处理的日期。 start_date取值为STRING类型格式时，至少要包含yyyy-mm-dd且不含多余的字符串。格式为： yyyy-mm-dd

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
查看Flink作业详情 - 数据湖探索 DLI

at_least_once：事件至少被处理一次 exactly_once：事件仅被处理一次空闲状态保留时长用于清除GroupBy、RegularJoin、Rank、Depulicate等算子经过最大保留时间后仍未更新的中间状态，默认设置为1小时。脏数据策略作业出现脏数据时的处理策略。作业配置脏数据策略时显示该参数。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
获取指定集群信息（废弃） - 数据湖探索 DLI

CREATING 集群正在创建中，当前不可用。 AVAILABLE 集群可用。 SUSPENDED 由于长时间未使用，集群当前处于挂起状态，可通过创建批处理作业接口，重新激活集群。 RECOVERING 集群处于挂起恢复状态，当状态变为AVAILABLE时可再次使用。示例请求样例： None

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 集群相关API（废弃）
Hive方言 - 数据湖探索 DLI
Hive方言 - 数据湖探索 DLI

功能描述 Flink目前支持两种SQL 方言: default 和 hive。您需要先切换到Hive 方言，然后才能使用Hive语法编写。下面介绍如何使用SQL设置方言。您可以为执行的每个语句动态切换方言。无需重新启动会话即可使用其他方言。语法格式 SQL 方言可以通过 table.sql-dialect

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
DLI增强型跨源连接DWS失败怎么办？ - 数据湖探索 DLI

PSQLException: The connection attempt failed。原因分析出现该问题可能原因如下：安全组配置不正确子网配置不正确处理步骤检查客户安全组是否放通，安全组放通规则如下所示。入方向规则：检查本安全组内的入方向网段及端口是否已开放，若没有则添加。出方向规则

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
配置DLI作业桶 - 数据湖探索 DLI

Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。使用须知请勿将该OBS桶用作其它用途，避免出现作业结果混乱等问题。

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
Spark 2.4.5版本说明 - 数据湖探索 DLI

说明支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。支持统计SQL作业的CPU消耗支持在控制台查看“CPU累计使用量”。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
最佳实践内容概览 - 数据湖探索 DLI

以DLI实际消费数据为样例，介绍使用DLI进行账单分析和成本优化的措施。使用DLI分析电商实时业务数据使用DLI Flink完成电商业务实时数据的分析处理。配置DBeaver连接DLI进行数据查询和分析介绍DBeaver连接DLI并提交SQL查询的操作步骤。配置DBT连接DLI进行数据调度和分析

 帮助中心 > 数据湖探索 DLI > 最佳实践
浮点型 - 数据湖探索 DLI
浮点型 - 数据湖探索 DLI

Infinity (1 row) --删除表 DROP TABLE float_t1; 当小数部分为0时，可以通过cast()转为对应范围的整数处理，小数部分会四舍五入。示例： select CAST(1000.0001 as INT); _col0 ------- 1000 (1 row)

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
Hudi Archive操作说明 - 数据湖探索 DLI

request）。对Hudi表进行的每次操作都会产生元数据文件，而元数据文件过多会导致性能问题，所以元数据文件数量最好控制在1000以内。如何执行Archive 写完数据后archive Spark SQL（set设置如下参数，写数据时触发） hoodie.archive.automatic=true

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
pyspark样例代码 - 数据湖探索 DLI

在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

BasicCredentials。仅支持获取AK、SK、SecurityToken。获取到AK、SK、SecurityToken后，请参考如何使用凭据管理服务替换硬编码的数据库账号密码查询凭据。约束限制仅支持Flink1.15版本使用委托授权访问临时凭证：在创建作业时，请配置作业使用Flink1

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
错误码 - 数据湖探索 DLI
错误码 - 数据湖探索 DLI

error_msg String 错误详细信息。错误码说明当您调用API时，如果遇到“APIGW”开头的错误码，请参见API网关错误码进行处理。表2 错误码状态码错误码错误信息 400 DLI.0001 参数校验错误。 400 DLI.0002 对象不存在。 400 DLI

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
Connector概述 - 数据湖探索 DLI
Connector概述 - 数据湖探索 DLI

而维表就是代表存储数据维度信息的数据源。常见的用户维表有 MySQL，Redis等。结果表：Flink作业输出的结果数据表，将每条实时处理完的数据写入的目标存储，如 MySQL，HBase 等数据库。示例： Flink 实时消费用户订单数据的 Kafka 源表，通过Redi

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
查询SQL作业日志 - 数据湖探索 DLI

Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。配置DLI作业桶在DLI控制台左侧导航栏中单击“全局配置

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Hudi表索引设计规范 - 数据湖探索 DLI

可能会有什么影响？读写任务可能会出现OOM的问题，解决方法就是提升单个task的内存占比。读写性能下降，因为单个task的处理的数据量变大，导致处理耗时变大。父主题： Hudi数据表设计规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
正则表达式函数 - 数据湖探索 DLI

uDC00不被视为U + 10000，必须将其指定为\ x {10000}。边界字符（\b）无法被正确处理，因为它一个不带基字符的非间距标记。 \Q和\E在字符类（如[A-Z123]）中不受支持，而是作为文本处理。支持Unicode字符类（\ p {prop}），但有以下差异：名称中的所有下划

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符

总条数： 430

上一页
1
...
16
17
18
...
22
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL常用配置项说明 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

next - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

获取指定集群信息（废弃） - 数据湖探索 DLI

Hive方言 - 数据湖探索 DLI

DLI增强型跨源连接DWS失败怎么办？ - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

最佳实践内容概览 - 数据湖探索 DLI

浮点型 - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

错误码 - 数据湖探索 DLI

Connector概述 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

正则表达式函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线