搜索_华为云

Orc Format - 数据湖探索 DLI
Orc Format - 数据湖探索 DLI

WITH ( 'connector' = 'filesystem', 'format' = 'orc', 'path' = 'obs://xx' ); insert into sink select * from kafkaSource; 向kafka的作为source的topic中插入下列数据：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hudi表使用约束 - 数据湖探索 DLI

Hudi支持使用Spark SQL操作Hudi的DDL/DML的语法。但在使用DLI提供的元数据提交SparkSQL作业时，部分直接操作OBS路径的SQL语法暂不支持，详细说明请参考DLI Hudi SQL语法参考。不支持在HetuEngine中写Hudi表，以及修改Hudi表结构，仅支持读Hudi表。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

可视化智能调优界面。学习成本高，需要了解上百个调优参数。支持数据源云上：OBS、RDS、DWS、CSS、MongoDB、Redis。云下：自建数据库、MongoDB、Redis。云上：OBS。云下：HDFS。生态兼容 DLV、永洪BI、帆软。大数据生态工具。自定义镜像

 帮助中心 > 数据湖探索 DLI > 产品介绍
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。您可以使用本文档提供API对数据湖探索进行相关操作，包括队列、SQL作业、Flink

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

所在的位置，并指定了数据的结构，例如列名称、数据类型和表名称。数据库是表的逻辑分组。 OBS表、DLI表、CloudTable表不同表类型表示不同的数据存储位置。 OBS表表示数据存储在OBS服务的桶中。 DLI表表示数据存储在本服务内部的表中。 CloudTable表表示数据储存在CloudTable服务的表中。

帮助中心 > 数据湖探索 DLI > 产品介绍
典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

Kafka数据源配置。配置目的端DLI的数据源连接。登录CDM控制台，选择“集群管理”，选择已创建的CDM集群，在操作列选择“作业管理”。在作业管理界面，选择“连接管理”，单击“新建连接”，连接器类型选择“数据湖探索（DLI）”，单击“下一步”。图4 创建DLI数据源连接配置目的端DLI数

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Flink作业推荐配置指导 - 数据湖探索 DLI

计算配置，建议作业最大并行数为计算单元2倍为宜。勾选“保存作业日志”，选择一个OBS桶。如果该桶未授权，需要单击“立即授权”进行授权。配置该参数，可以在作业异常失败后，将作业日志保存到用户的OBS桶下，方便用户定位故障原因。图3 保存作业日志勾选“作业异常告警”，选择1中创

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
流生态作业开发指引 - 数据湖探索 DLI

自拓展生态：云服务生态 DLI服务在Stream SQL中支持与其他服务的连通。用户可以直接使用SQL从这些服务中读写数据，如DIS、OBS、CloudTable、MRS、RDS、SMN、DCS等。开源生态通过对等连接建立与其他VPC的网络连接后，用户可以在DLI的租户独享

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
Parquet Format - 数据湖探索 DLI
Parquet Format - 数据湖探索 DLI

( 'connector' = 'filesystem', 'format' = 'parquet', 'path' = 'obs://xx' ); insert into sink select * from kafkaSource; 向kafka的作为source的topic中插入下列数据：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

计算配置，建议作业最大并行数为计算单元2倍为宜。勾选“保存作业日志”，选择一个OBS桶。如果该桶未授权，需要单击“立即授权”进行授权。配置该参数，可以在作业异常失败后，将作业日志保存到用户的OBS桶下，方便用户定位故障原因。图3 保存作业日志勾选“作业异常告警”，选择1中创

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
查看Flink作业详情 - 数据湖探索 DLI

作业配置的每个TaskManager所占CU数量。单TM Slot数作业配置的每个TaskManager Slot数量。 OBS桶作业配置了OBS桶显示。当勾选“开启Checkpoint”和“保存作业日志”参数后，用于保存Checkpoint和作业运行日志。保存作业日志开启或关闭。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

并且促使各个厂商以及研究机构将该项技术推向极限。本示例将演示DLI直接对存储在OBS中的TPC-H数据集进行查询的操作，DLI已经预先生成了100M的TPC-H-2.18的标准数据集，已将数据集上传到了OBS的tpch文件夹中，并且赋予了只读访问权限，方便用户进行查询操作。 TPC-H的测试和度量指标

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

'hudi_table1', op => 'run', timestamp => 'xxx'); call run_compaction(path => 'obs://bucket/path/hudi_table1', op => 'run', timestamp => 'xxx'); 注意事项 compaction操作仅支持MOR表。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
创建并提交SQL作业 - 数据湖探索 DLI

提交SQL作业：提交SQL作业，创建数据库db1、表tb1、在表中插入数据，并查询数据接口相关信息 URI格式：POST /v1.0/{project_id}/jobs/submit-job {project_id}信息请从获取项目ID获取。请求参数说明详情，请参见提交SQL作业（推荐）。请求示例描

 帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
ALTER TABLE - 数据湖探索 DLI
ALTER TABLE - 数据湖探索 DLI

first; --修改分区表的存储位置（需要先在obs上创建目录，执行语句后，无法查到之前插入的那条数据） alter table altercolumn4 partition (c=500) set Location 'obs://bucket/user/hive/warehouse/c500';

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。 Spark离线完成Compaction计划的执行，以及Clean和Archive操作，详见Hudi数据表Compaction规范。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
Flink作业常用操作 - 数据湖探索 DLI

单击右上角“导出作业”，打开“导出作业”对话框。图2 导出作业选择保存作业的OBS桶。单击“下一步”。选择待导出的作业。默认导出所有作业，也可以勾选“自定义导出”选择需要导出的作业。单击“确认导出”，完成导出作业。导入作业用户可以将保存在OBS桶中的Flink作业配置文件导入至DLI的Flink作业管理中。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

百分比与运行时计算的随机值之间的比较）。系统采样中行的选择依赖于使用的connector。例如，如果使用Hive数据源，这将取决于数据在OBS上的布局。这种采样方法不能保证独立的抽样概率。 SELECT * FROM users TABLESAMPLE SYSTEM (75); 父主题：

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

using 参数hudi，定义和创建Hudi table。 table_comment 表的描述信息。 location_path OBS路径，指定该路径Hudi 表会创建为外表。 options_list Hudi table属性列表。表2 CREATE TABLE Options描述

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
ADD COLUMNS - 数据湖探索 DLI
ADD COLUMNS - 数据湖探索 DLI

add columns(new_col int comment 'add new column'); alter table delta.`obs://bucket_name0/db0/delta_table0` add columns(new_col string); 系统响应通

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Schema演进语法说明

总条数： 711

上一页
1
...
29
30
31
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Orc Format - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

流生态作业开发指引 - 数据湖探索 DLI

Parquet Format - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

ALTER TABLE - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

ADD COLUMNS - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线