搜索_华为云

权限策略和授权项 - 数据湖探索 DLI

授权项：自定义策略中支持的Action，在自定义策略中的Action中写入授权项，可以实现授权项对应的权限功能。依赖的授权项：部分Action存在对其他Action的依赖，需要将依赖的Action同时写入授权项，才能实现对应的权限功能。 IAM项目(Project)/企业项目(Enterprise

帮助中心 > 数据湖探索 DLI > API参考
Hudi数据表Compaction规范 - 数据湖探索 DLI

过调大内存占比解决。建议通过增加并发数提升Compaction性能。 CPU和内存比例配置合理会保证Compaction作业是稳定的，实现单个Compaction task的稳定运行。但是Compaction整体的运行时长取决于本次Compaction处理文件数以及分配的cp

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
pyspark样例代码 - 数据湖探索 DLI

认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现详解 import相关依赖包 1 2 3 from __future__ import print_function from pyspark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency> <groupId>org.apache.spark</groupId>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

li.sql.dynamicPartitionOverwrite.enabled=true，再通过“insert overwrite”语句实现，“dli.sql.dynamicPartitionOverwrite.enabled”默认值为“false”，表示覆盖整表数据。例如： 1

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
创建Flink Jar作业 - 数据湖探索 DLI

具中将scope设为provided 日志配置文件（例如：“log4j.properties”或者“logback.xml”等）日志输出实现类JAR包（例如：log4j等）注意事项创建作业提交任务前，建议先开通云审计服务，用于记录与DLI服务相关的操作事件，便于日后的查询、

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

而且在延迟时间内到达的每个数据都会更新输出结果。说明：当时间窗口为处理时间时，无论lateness_interval为何值，都不会有效果。 period_interval和lateness_interval不可为负数。当period_interval为0时，表示没有使用窗口的周期触发策略；

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

编写UDTF函数代码。完整样例代码请参考样例代码。 UDTF的类需要继承“org.apache.hadoop.hive.ql.udf.generic.GenericUDTF”，实现initialize，process，close三个方法。 UDTF首先会调用initialize方法，此方法返回UDTF的返回行的信息，如，返回个数，类型等。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

x版本的执行方式，您可以通过将 spark.sql.legacy.respectNullabilityInTextDatasetConversion设置为true来实现。升级引擎版本后是否对作业有影响：有影响。示例代码：执行sql： spark.read.schema(StructType( StructField("f1"

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
Json函数和运算符 - 数据湖探索 DLI

23,456]' AS ARRAY(INTEGER)); -- [1, 23, 456] JSON函数 NULL到JSON的转换并不能简单地实现。从独立的NULL进行转换将产生一个SQLNULL，而不是JSON 'null'。不过，在从包含NULL的数组或Map进行转换时，生成的JSON将包含NULL。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

如需及时了解Prometheus监控状态并做出响应，您还需要配置告警通知，SMN服务为您提供了灵活的消息推送能力，可以将Prometheus的告警事件通知发送到不同的终端，从而实现多通道告警事件通知。本节操作介绍配置Prometheus监控告警通知的操作步骤。了解SMN计费规则请参考SMN计费说明。创建SMN主题并添加订阅。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
Upsert Kafka结果表 - 数据湖探索 DLI

sink会保证至少一次将数据插入Kafka topic。这意味着，Flink可以将具有相同key的重复记录写入Kafka topic。因此，upsert-kafka 连接器可以实现幂等写入。语法格式 1 2 3 4 5 6 7 8 9 10 11 12 create table kafkaSource(

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
pyspark样例代码 - 数据湖探索 DLI

认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现详解 import相关依赖包 1 2 3 from __future__ import print_function from pyspark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

流式处理读取的默认间隔为'1 min'，Hive 流式处理temporal join的默认间隔为 '60 min'，这是因为在当前 Hive 流式处理临时连接实现中，每个 TM 都会访问 Hive metaStore，这可能会对 metaStore 产生压力，这将在未来得到改善。 streaming-source

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

ublic”。如果选择界面没有待选择的模式或表空间，请确认对应连接里的账号是否有元数据查询的权限。说明：该参数支持配置通配符（*），实现导出以某一前缀开头或者以某一后缀结尾的所有数据库。例如： SCHEMA*表示导出所有以“SCHEMA”开头的数据库。 *SCHEMA表示导出所有以“SCHEMA”结尾的数据库。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

必须同时设置 lookup.batch.interval 和 lookup.batch.size 选项。此外，由于底层批处理间隔干扰机制的实现，用户必须在 flink 配置中显式启用 table.exec.batch-lookup.enabled' 选项 ignore-retractions

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

数据桶。该桶用于存储使用DLI服务产生的临时数据，例如：作业日志、作业结果等。如果不创建该桶，将无法查看作业日志。可以通过配置生命周期规则实现定时删除OBS桶中的对象或者定时转换对象的存储类别。桶名称为系统默认。如果不需要创建DLI临时数据桶，并且希望不再收到该提示，可以勾选“下次不再提示”并单击“取消”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

企业项目对于已成功关联企业项目的用户，仅需在“企业项目”下拉框中选择目标项目。 default 购买数量实例购买数量 1 只读实例为了实现读取能力的弹性扩展，分担数据库压力，您可以在某个区域中创建一个或多个只读实例。暂不购买单击“立即购买”，进入规格确认页面。单击“提交”，完成购买RDS

帮助中心 > 数据湖探索 DLI > 快速入门
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

则返回0。此函数所有可能的值相对于正确的值的误差服从近似正态分布，其标准差应小于e。它不保证任何特定输入集的误差的上限。当前该函数的实现中，e的取值范围为[0.0040625,0.26000]。 select approx_distinct(weight,0.0040625)

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符

总条数： 139

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

权限策略和授权项 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

Json函数和运算符 - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线