搜索_华为云

查询HBase表 - 数据湖探索 DLI
查询HBase表 - 数据湖探索 DLI

table_name LIMIT number; 关键字 LIMIT：对查询结果进行限制，number参数仅支持INT类型。注意事项所查询的表必须是已经存在的表，否则会出错。示例查询表中的数据。 1 SELECT * FROM test_hbase limit 100; 查询下压通过hbase进行数据过滤，即HBase

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

什么区别？ DLI和MRS都支持Spark组件，但在服务模式、接口方式、应用场景和性能特性上存在一些差异。 DLI服务的Spark组件是全托管式服务，用户对Spark组件不感知，仅仅可以使用该服务，且接口为封装式接口。 DLI的这种模式减轻了运维负担，可以更专注于数据处理和分析任务本身。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

OPTIONS (path "obs://dli-test-021/data/test.csv"); 问题根因：创建OBS表指定的OBS路径为具体文件，导致不能插入数据。例如上述示例中的OBS路径为："obs://dli-test-021/data/test.csv"。解决方案：使用Data

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

使用示例 1 2 CREATE FUNCTION udf_test AS 'com.huaweicompany.udf.UdfScalarFunction'; INSERT INTO sink_stream select udf_test(attr) FROM source_stream;

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
字符串函数和运算符 - 数据湖探索 DLI

此外，这些函数对Unicode代码点进行运算，而不是对用户可见的字符（或字形群集）进行运算。某些语言将多个代码点组合成单个用户感观字符（这是语言书写系统的基本单位），但是函数会将每个代码点视为单独的单位。 lower和upper函数不执行某些语言所需的区域设置相关、上下文相关或一对多映射。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
简单CASE函数 - 数据湖探索 DLI
简单CASE函数 - 数据湖探索 DLI

简单CASE函数功能描述依据input_expression与when_expression的匹配结果跳转到相应的result_expression。语法格式 1 CASE input_expression WHEN when_expression THEN result_expression

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > CASE...WHEN
CASE搜索函数 - 数据湖探索 DLI
CASE搜索函数 - 数据湖探索 DLI

CASE搜索函数功能描述按指定顺序为每个WHEN子句的boolean_expression求值。返回第一个取值为TRUE的boolean_expression的result_expression。语法格式 1 CASE WHEN boolean_expression THEN

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > CASE...WHEN
Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

下权限： DEW中的查询凭据的版本与凭据值ShowSecretVersion接口权限，csms:secretVersion:get。 DEW中的查询凭据的版本列表ListSecretVersions接口权限，csms:secretVersion:list。 DEW解密凭据的权限，kms:dek:decrypt。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
CLUSTERING - 数据湖探索 DLI
CLUSTERING - 数据湖探索 DLI

CLUSTERING 命令功能对Hudi表进行clustering操作，具体作用可以参考Hudi Clustering操作说明章节。命令格式执行clustering： call run_clustering(table=>'[table]', path=>'[path]',

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
复杂数据类型 - 数据湖探索 DLI

array_test VALUES ('test',array(1,2,3,4)); INSERT INTO array_test VALUES ('test2',array(4,5,6,7)) INSERT INTO array_test VALUES ('test3',array(7

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

SDK，Data Lake Insight Software Development Kit）是对DLI服务提供的REST API进行的作业提交的封装，以简化用户的开发工作。用户直接调用DLI SDK提供的接口函数即可实现使用提交DLI SQL和DLI Spark作业。 DLI支持的SDK分为SDK

帮助中心 > 数据湖探索 DLI > SDK参考
Hudi数据表Compaction规范 - 数据湖探索 DLI

1:8。 Compaction作业是将存量的parquet文件内的数据与新增的log中的数据进行合并，需要消耗较高的内存资源，按照之前的表设计规范以及实际流量的波动结合考虑，建议Compaction作业CPU与内存的比例按照1:4~1:8配置，保证Compaction作业稳定运行

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
percentlie - 数据湖探索 DLI
percentlie - 数据湖探索 DLI

假设列int_test中的元素为1、2、3、4，类型为INT类型。返回3.0999999999999996。 select percentile(int_test,0.7) FROM int_test; 返回3.997。 select percentile(int_test,0.999)

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
GROUPING SETS - 数据湖探索 DLI
GROUPING SETS - 数据湖探索 DLI

BY col_name_list GROUPING SETS(col_name_list); 关键字 GROUPING SETS：为对GROUP BY的扩展，例如 SELECT a, b, sum(expression) FROM table GROUP BY a, b GROUPING

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

据：对于Flink SQL作业，您可以勾选“开启Checkpoint”，并合理配置Checkpoint间隔（权衡执行Checkpoint对业务性能的影响以及异常恢复的时长），同时勾选“异常自动重启”，并勾选“从Checkpoint恢复”。配置后，作业异常重启，会从最新成功的Ch

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

直接失败。升级引擎版本后是否对作业有影响：有影响。示例代码1：准备数据： CREATE TABLE test0(id int, name string); CREATE TABLE test_like_properties LIKE test0 LOCATION 'obs

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
运行Spark作业报java.lang.AbstractMethodError - 数据湖探索 DLI

运行Spark作业报java.lang.AbstractMethodError Spark 2.3对内部接口Logging做了行为变更，如果用户代码里直接继承了该Logging，且编译时使用的是低版本的Spark，那么应用程序在Spark 2.3的环境中运行将会报java.lang

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通操作场景公网数据源指的是可以通过互联网访问的数据源。这些数据源资源有一个公网IP地址，配置DLI与公网网络联通可以实现对这些数据源的访问。本节提供了详细的操作指导，介绍如何通过设置SNAT规则和配置路由信息，实现DLI服务与公网的网络连接。操作流程图1 配置DLI队列访问公网流程

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
percentlie - 数据湖探索 DLI
percentlie - 数据湖探索 DLI

示例代码假设列int_test中的元素为1、2、3、4，类型为INT类型。返回3。 select percentile_approx(int_test,0.7) FROM int_test; 返回3。 select percentile_approx(int_test,0.75) FROM

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

'obs://obs-csv-parquet/test.csv' ) 在DLI的SQL编辑窗口，执行以下语句可以查询表test_csv_hw中的数据。图4 查询表test_csv_hw 在DLI的SQL编辑窗口中创建OBS表test_parquet_hw。 create table `test_parquet_hw`

帮助中心 > 数据湖探索 DLI > 最佳实践

总条数： 481

上一页
1
2
3
4
5
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询HBase表 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

字符串函数和运算符 - 数据湖探索 DLI

简单CASE函数 - 数据湖探索 DLI

CASE搜索函数 - 数据湖探索 DLI

Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

CLUSTERING - 数据湖探索 DLI

复杂数据类型 - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

percentlie - 数据湖探索 DLI

GROUPING SETS - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

运行Spark作业报java.lang.AbstractMethodError - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

percentlie - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线