搜索_华为云

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述 CDC是变更数据捕获（Change Data Capture）技术的缩写，它可以将源数据库的增量变动记录，同步到一个或多个数据目的中。CDC在数据同步过程中，还可以对数据进行一定的处理，例如分组（GROUP

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Hudi表索引设计规范 - 数据湖探索 DLI

2GB的数据存储成列存Parquet文件后，大概的数据文件大小是150MB ~ 256MB左右。不同业务数据会有出入。而HDFS单个数据块一般会是128MB，这样可以有效地利用存储空间。数据读写占用的内存空间都是原始数据大小（包括空值也是会占用内存的），2GB在大数据计算过程中，处于单task读写可接受范围之内。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
OrderBy & Limit - 数据湖探索 DLI
OrderBy & Limit - 数据湖探索 DLI

orderTime; Limit 功能描述限制返回的数据结果个数注意事项 LIMIT 查询需要有一个 ORDER BY 字句示例 SELECT * FROM Orders ORDER BY orderTime LIMIT 3; 父主题：数据操作语句DML

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
使用DLI分析电商BI报表 - 数据湖探索 DLI

使用DLI进行电商数据分析的操作过程主要包括以下步骤：步骤1：上传数据。将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。步骤2：分析数据。使用DLI对待分析的数据进行查询。具体样例数据及详细SQL语句可以通过数据包进行下载。数据说明为保护用户的隐私和数据安全，所有数据均已进行了采样和脱敏。

帮助中心 > 数据湖探索 DLI > 最佳实践
OrderBy & Limit - 数据湖探索 DLI
OrderBy & Limit - 数据湖探索 DLI

orderTime; Limit 功能描述限制返回的数据结果个数注意事项 LIMIT 查询需要有一个 ORDER BY 字句示例 SELECT * FROM Orders ORDER BY orderTime LIMIT 3; 父主题：数据操作语句DML

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

I进行数据查询和分析 Tableau是一款数据分析和可视化工具，支持通过拖放式界面连接到各种数据源，创建交互式和共享式的数据可视化，从而将数据转化为可操作的见解。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Flink SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据 - 数据湖探索 DLI

SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据问题现象客户创建Flink SQL作业，消费Kafka后sink到es集群，作业执行成功，但无数据。原因分析查看客户作业脚本内容，排查无问题，作业执行成功，出现该问题可能的原因如下：数据不准确。数据处理有问题。处理步骤在Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
怎样查看DLI的数据扫描量？ - 数据湖探索 DLI

怎样查看DLI的数据扫描量？登录DLI管理控制台。选择“作业管理 > SQL作业”。筛选执行队列为default队列，查看相应的作业。单击展开作业，查看已扫描的数据。如图1所示。图1 查看作业扫描量父主题：计费相关问题

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
创建并使用LakeFormation元数据 - 数据湖探索 DLI

创建并使用LakeFormation元数据 DLI对接LakeFormation LakeFormation资源权限支持列表与策略项父主题：创建数据库和表

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
在DLI控制台预览表数据 - 数据湖探索 DLI

在DLI控制台预览表数据 “预览页面”将显示对应表的前10条数据。预览数据步骤预览数据的入口有两个，分别在“数据管理”和“SQL编辑器”页面。在“数据管理”页面预览数据。在管理控制台左侧，单击“数据管理”>“库表管理”。单击需导出数据对应数据库名称，进入该数据库“表管理”页面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 Power BI提供了数据集成、数据仓库、报告和数据可视化等功能，能够将复杂的数据转换为易于理解和交互的可视化图表和仪表板，从而帮助企业做出基于数据的决策。 Kyuubi是一个分布式SQL查询引擎，它允许用户通过标准的SQL接口来访问和分析数据。将Power

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

overwrite覆盖分区表数据的时候，覆盖了全量数据？当您使用insert overwrite语句覆盖分区表的数据时，如果发现它覆盖了全量数据而不是预期的分区数据，这可能是因为动态分区覆盖功能没有被启用。如果需要动态覆盖DataSource表指定的分区数据，您需要先配置参数 dli

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
资产识别与管理 - 数据湖探索 DLI

签将很容易帮助您对不同的应用进行使用量分析和成本核算。对DLI来说，标签用于标识购买的队列和创建数据库，对购买的DLI队列和数据库进行分类。为队列或数据库添加标签时，该队列或数据库上所有请求产生的计费话单里都会带上这些标签，您可以针对话单报表做分类筛选，进行更详细的成本分析。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
使用BI工具连接DLI分析数据 - 数据湖探索 DLI

使用BI工具连接DLI分析数据 BI工具连接DLI方案概述配置DBeaver连接DLI进行数据查询和分析配置DBT连接DLI进行数据调度和分析配置YongHong BI连接DLI进行数据查询和分析配置PowerBI通过Kyuubi连接DLI进行数据查询和分析配置Fine

帮助中心 > 数据湖探索 DLI > 最佳实践
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

业即可。后续指引如果您想通过Spark Jar作业访问其他数据源，请参考《使用Spark作业跨源访问数据源》。如果您想通过Spark Jar作业在DLI创建数据库和表，请参考《使用Spark作业访问DLI元数据》。完整样例代码参考认证用的access.key和secret

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

连接redis的超时时间，单位ms，默认值2000（2秒超时）。保存类型：Overwrite、Append、ErrorIfExis、Ignore 四种如果需要保存嵌套的DataFrame，则通过“.option("model","binary")”进行保存指定数据过期时间：“.option("ttl"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

车企数字化服务转型大数据ETL处理运营商大数据分析运营商数据体量在PB~EB级，其数据种类多，有结构化的基站信息数据，非结构化的消息通信数据，同时对数据的时效性有很高的要求，DLI服务提供批处理、流处理等多模引擎，打破数据孤岛进行统一的数据分析。优势大数据ETL：具备TB~

帮助中心 > 数据湖探索 DLI > 产品介绍
配置Hudi数据列默认值 - 数据湖探索 DLI

配置Hudi数据列默认值该特性允许用户在给表新增列时，设置列的默认值。查询历史数据时新增列返回默认值。使用约束新增列在设置默认值前，如果数据已经进行了重写，则查询历史数据不支持返回列的默认值，返回NULL。数据入库、更新、执行Compaction、Clustering都会导致部分或全部数据重写。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
DLI如何访问OBS桶中的数据 - 数据湖探索 DLI

DLI如何访问OBS桶中的数据创建OBS表。具体语法请参考《数据湖探索SQL语法参考》。添加分区。具体语法请参考《数据湖探索SQL语法参考》。往分区导入OBS桶中的数据。具体语法请参考《数据湖探索SQL语法参考》。查询数据。具体语法请参考《数据湖探索SQL语法参考》。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Hudi表模型设计规范 - 数据湖探索 DLI

Hudi表必须配置precombine字段。在数据同步过程中不可避免会出现数据重复写入、数据乱序问题，例如：异常数据恢复、写入程序异常重启等场景。通过设置合理precombine字段值可以保证数据的准确性，老数据不会覆盖新数据，也就是幂等写入能力。该字段可用选择的类型包括：业务表中更新时间戳、数据库的提交时间戳

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范

总条数： 1508

上一页
1
...
8
9
10
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

OrderBy & Limit - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

OrderBy & Limit - 数据湖探索 DLI

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Flink SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据 - 数据湖探索 DLI

怎样查看DLI的数据扫描量？ - 数据湖探索 DLI

创建并使用LakeFormation元数据 - 数据湖探索 DLI

在DLI控制台预览表数据 - 数据湖探索 DLI

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

使用BI工具连接DLI分析数据 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

DLI如何访问OBS桶中的数据 - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线