搜索_华为云

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

该配置项用于启用或禁用动态分区修剪。在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

如果为false，则表示输出数据到taskmanager的out中。 sink.parallelism 否无 Integer 为Print结果表定义并行度。默认情况下，并行度由框架决定，与上游并行度一致。示例参考创建Flink OpenSource作业，创建flink opensource sql作业，运行如下

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
提交SQL作业（推荐） - 数据湖探索 DLI

该配置项用于启用或禁用动态分区修剪。在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
聚合函数概览 - 数据湖探索 DLI

col, p [, B]) DOUBLE 返回组内数字列近似的第p位百分数（包括浮点数），p值在[0,1]之间。参数B控制近似的精确度，B值越大，近似度越高，默认值为10000。当列中非重复值的数量小于B时，返回精确的百分数。 stddev_pop stddev_pop(col) DOUBLE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
Color 函数 - 数据湖探索 DLI
Color 函数 - 数据湖探索 DLI

Color 函数 bar(x, width) 描述：使用默认的低频红色和高频绿色渲染ANSI条形图中的单个条形。例如，如果将25％的x和40的宽度传递给此函数。将绘制一个10个字符的红色条形，后跟30个空格，以创建一个40个字符的条形。 bar(x, width, low_color

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

如果为 true，则根据拆分数推断源并行度。如果为 false，则源的并行度由 config 设置。 table.exec.hive.infer-source-parallelism.max 1000 Integer 设置源运算符的最大推断并行度。 Load Partition Splits

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
view - 数据湖探索 DLI
view - 数据湖探索 DLI

view_properties 格式无。说明视图的属性列表，以key=value的形式表示，key为property_name，value为property_value，列表中每组key=value之间用逗号分隔。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
Spark作业开发类 - 数据湖探索 DLI

库？如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 Spark jar 如何读取上传文件添加Python包后，找不到指定的Python环境为什么Spark jar 作业一直处于“提交中”？

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

测试队列与RDS实例连通性。单击“资源管理 > 队列管理”，选择步骤3：创建弹性资源池并添加队列添加的队列，单击“操作”列中的“更多 > 测试地址连通性”。图6 检测地址连通性输入步骤2：创建RDS数据库表中记录的RDS MySQL实例内网地址，进行网络连通性测试。在RDS控制台“实例管理”页面，单

 帮助中心 > 数据湖探索 DLI > 快速入门
怎样查看DLI的数据扫描量？ - 数据湖探索 DLI

怎样查看DLI的数据扫描量？登录DLI管理控制台。选择“作业管理 > SQL作业”。筛选执行队列为default队列，查看相应的作业。单击展开作业，查看已扫描的数据。如图1所示。图1 查看作业扫描量父主题：计费相关问题

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
ALTER VIEW - 数据湖探索 DLI
ALTER VIEW - 数据湖探索 DLI

ALTER VIEW 语法 ALTER VIEW view_name AS select_statement; ALTER VIEW view_name SET TBLPROPERTIES table_properties; 描述 “ALTER VIEW view_name AS

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

MRS服务Spark组件的是建立在客户的购买MRS服务所分配的虚机上，用户可以根据实际需求调整及优化Spark服务，支持各种接口调用。 MRS的这种模式提供了更高的自由度和定制性，适合有大数据处理经验的用户使用。具体请参考《MapReduce服务开发指南》。父主题： DLI产品咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

详情测试队列与RDS、DMS实例连通性。单击“队列管理”，选择您所使用的队列，单击“操作”列中的“更多”>“测试地址连通性”。图14 检测地址连通性输入DMS Kafka实例连接地址和步RDS MySQL实例内网地址，进行网络连通性测试。测试结果显示可达，则DLI队列与K

帮助中心 > 数据湖探索 DLI > 最佳实践
Flink作业怎样设置“异常自动重启”？ - 数据湖探索 DLI

Flink作业怎样设置“异常自动重启”？场景概述 DLI Flink作业具有高可用保障能力，通过设置“异常自动重启”功能，可在周边服务短时故障恢复后自动重启。操作步骤登录DLI控制台，选择“作业管理”>“Flink作业”。在Flink作业编辑页面，勾选“异常自动重启”。例如，图1所示。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

= 管理单元 * 4。 Spark资源并行度由Executor数量和Executor CPU核数共同决定。管理单元管理单元CU数量。并行数作业的并行数是指作业中各个算子的并行执行的子任务的数量，即算子的子任务数就是其对应算子的并行度。说明：最大并行数不能大于计算单元（CU数量-管理单元）的4倍。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
查询作业列表 - 数据湖探索 DLI

用，指定作业运行使用的DLI基础Flink镜像的版本。 operator_config 否 String 各算子并行度参数，以json的形式展示各算子id和并行度。 static_estimator_config 否 String 静态流图资源预估参数，以json的形式展示。 real_cu_number

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Quantile digest函数 - 数据湖探索 DLI

Quantile digest函数概述 Quantile digest（分位数摘要）是存储近似百分位信息的数据草图。HetuEngine中用qdigest表示这种数据结构。函数 merge(qdigest) → qdigest 描述：将所有输入的qdigest数据合并成一个qdigest。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Hudi结果表 - 数据湖探索 DLI
Hudi结果表 - 数据湖探索 DLI

write.index_bootstrap.tasks 否环境默认并行度 Integer “index.bootstrap.enabled”开启后有效，增加任务数提升启动速度，默认值为环境默认并行度。 hoodie.bucket.index.num.buckets 否 5 Integer

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
查询作业详情 - 数据湖探索 DLI

用，指定作业运行使用的DLI基础Flink镜像的版本。 operator_config 否 String 各算子并行度参数，以json的形式展示各算子id和并行度。 static_estimator_config 否 String 静态流图资源预估参数，以json的形式展示。 runtime_config

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
DLI计算引擎版本生命周期 - 数据湖探索 DLI

DLI计算引擎版本生命周期版本号说明 DLI计算引擎版本号：格式为计算引擎名称 x.y.z，其中计算引擎分为Flink和Spark，版本号具体含义如图1所示。图1 DLI计算引擎版本号版本支持情况 Flink计算引擎推荐版本：Flink 1.15。 Spark计算引擎推荐版本：

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告

总条数： 318

上一页
1
2
3
4
5
...
16
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

Print - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

聚合函数概览 - 数据湖探索 DLI

Color 函数 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

view - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

怎样查看DLI的数据扫描量？ - 数据湖探索 DLI

ALTER VIEW - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

Flink作业怎样设置“异常自动重启”？ - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

Quantile digest函数 - 数据湖探索 DLI

Hudi结果表 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

DLI计算引擎版本生命周期 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线