搜索_华为云

Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

流式处理读取的默认间隔为'1 min'，Hive 流式处理temporal join的默认间隔为 '60 min'，这是因为在当前 Hive 流式处理临时连接实现中，每个 TM 都会访问 Hive metaStore，这可能会对 metaStore 产生压力，这将在未来得到改善。 streaming-source

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency> <groupId>org.apache.spark</groupId>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
Spark SQL常用配置项说明 - 数据湖探索 DLI

对于包含count(distinct)的多维分析（with cube）的查询场景，spark典型的执行计划是将cube使用expand算子来实现，但该操作会导致查询膨胀，为了避免出现查询膨胀，建议执行如下配置： spark.sql.keep.distinct.expandThreshold：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖。涉及到的mvn依赖库 1 2 3 4 5 <dependency> <groupId>org.apache.spark</groupId>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

企业项目对于已成功关联企业项目的用户，仅需在“企业项目”下拉框中选择目标项目。 default 购买数量实例购买数量 1 只读实例为了实现读取能力的弹性扩展，分担数据库压力，您可以在某个区域中创建一个或多个只读实例。暂不购买单击“立即购买”，进入规格确认页面。单击“提交”，完成购买RDS

帮助中心 > 数据湖探索 DLI > 快速入门
pyspark样例代码 - 数据湖探索 DLI

认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现详解 import相关依赖包 1 2 3 from __future__ import print_function from pyspark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

ublic”。如果选择界面没有待选择的模式或表空间，请确认对应连接里的账号是否有元数据查询的权限。说明：该参数支持配置通配符（*），实现导出以某一前缀开头或者以某一后缀结尾的所有数据库。例如： SCHEMA*表示导出所有以“SCHEMA”开头的数据库。 *SCHEMA表示导出所有以“SCHEMA”结尾的数据库。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现详解导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency> <groupId>org.apache.spark</groupId>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
Hudi表索引设计规范 - 数据湖探索 DLI

优点：写入过程中对主键进行hash分桶写入，性能比较高，不受表的数据量限制。Flink和Spark引擎都支持，Flink和Spark引擎可以实现交叉混写同一张表。缺点：Bucket个数不能动态调整，数据量波动和整表数据量持续上涨会导致单个Bucket数据量过大出现大数据文件。需要结合分区表来进行平衡改善。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

GROUPING SETS ((user), (product)); GROUP BY中使用HAVING过滤功能描述利用HAVING子句在表分组后实现过滤。语法格式 1 2 3 4 5 SELECT [ ALL | DISTINCT ] { * | projectItem [, projectItem

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

GROUPING SETS ((user), (product)); GROUP BY中使用HAVING过滤功能描述利用HAVING子句在表分组后实现过滤。语法格式 1 2 3 4 5 SELECT [ ALL | DISTINCT ] { * | projectItem [, projectItem

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

GROUPING SETS ((user), (product)); GROUP BY中使用HAVING过滤功能描述利用HAVING子句在表分组后实现过滤。语法格式 1 2 3 4 5 SELECT [ ALL | DISTINCT ] { * | projectItem [, projectItem

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

TPC-H 基准测试是由 TPC-D（由 TPC 组织于 1994 年制定的标准，用于决策支持系统方面的测试基准）发展而来的。TPC-H用3NF实现了一个数据仓库，共包含8个基本关系，其数据量可以设定从1G~3T不等。TPC-H 基准测试包括 22 个查询(Q1~Q22)，其主要评价指

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
pyspark样例代码 - 数据湖探索 DLI

认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现详解 import相关依赖包 1 2 3 from __future__ import print_function from pyspark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

Service，CSMS），提供一种安全、可靠、简单易用隐私数据加解密方案。用户或应用程序通过凭据管理服务，创建、检索、更新、删除凭据，轻松实现对敏感凭据的全生命周期的统一管理，有效避免程序硬编码或明文配置等问题导致的敏感信息泄露以及权限失控带来的业务风险。本节操作介绍Flink

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

数据桶。该桶用于存储使用DLI服务产生的临时数据，例如：作业日志、作业结果等。如果不创建该桶，将无法查看作业日志。可以通过配置生命周期规则实现定时删除OBS桶中的对象或者定时转换对象的存储类别。桶名称为系统默认。如果不需要创建DLI临时数据桶，并且希望不再收到该提示，可以勾选“下次不再提示”并单击“取消”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
pyspark样例代码 - 数据湖探索 DLI

认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现详解 import相关依赖包 1 2 3 from __future__ import print_function from pyspark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
Hudi数据表Compaction规范 - 数据湖探索 DLI

过调大内存占比解决。建议通过增加并发数提升Compaction性能。 CPU和内存比例配置合理会保证Compaction作业是稳定的，实现单个Compaction task的稳定运行。但是Compaction整体的运行时长取决于本次Compaction处理文件数以及分配的cp

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

li.sql.dynamicPartitionOverwrite.enabled=true，再通过“insert overwrite”语句实现，“dli.sql.dynamicPartitionOverwrite.enabled”默认值为“false”，表示覆盖整表数据。例如： 1

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
Json函数和运算符 - 数据湖探索 DLI

23,456]' AS ARRAY(INTEGER)); -- [1, 23, 456] JSON函数 NULL到JSON的转换并不能简单地实现。从独立的NULL进行转换将产生一个SQLNULL，而不是JSON 'null'。不过，在从包含NULL的数组或Map进行转换时，生成的JSON将包含NULL。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符

总条数： 145

上一页
1
...
4
5
6
7
8
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hive源表 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

Json函数和运算符 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线