搜索_华为云

典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

端口：允许远端地址访问指定端口，取值范围为：1～65535。本例中选择TCP协议，端口值不填或者填写为步骤1：获取外部数据源的内网IP、端口和安全组获取的数据源的端口。类型 IP地址类型。 IPv4 源地址源地址用于放通来自IP地址或另一安全组内的实例的访问。本例填写步骤2：获取DLI队列网段获取的队列网段。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？ - 数据湖探索 DLI

acls.enable配置项，所以不涉及Apache Spark 命令注入漏洞（CVE-2022-33891）。该漏洞主要影响在启用了ACL（访问控制列表）时，可以通过提供任意用户名来执行命令导致数据安全受到威胁。 DLI在设计时充分考虑了数据安全和数据隔离，因此没有启用相关的配置项，所以不会受到这个漏洞的影响。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

LI提交作业访问共享VPC中的资源。此时需要建立DLI与共享VPC中资源的网络连接。例如：账号A为企业IT管理账号，是VPC资源的所有者，创建VPC、子网。并将VPC、子网共享给企业业务账号B。账号B为企业业务账号，使用共享的VPC和子网创建资源，并使用DLI访问资源。前提条件

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

Database中的表名，由字母、数字和下划线（_）组成。 boolExpression 过滤条件表达式。 columnList z排序指定的字段列表，Z顺序列应与分区列不同。所需权限 SQL权限表2 OPTIMIZE所需权限列表权限描述表的UPDATE权限细粒度权限：dli:table:update。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
BI工具连接DLI方案概述 - 数据湖探索 DLI

DLI服务通过对数据的融合分析处理，可以为BI工具提供标准的、有效的高质量数据，供给后续的数据统计分析使用。通过连接到DLI，BI工具可以更加灵活的使用DLI访问和分析数据，帮助企业快速做出基于数据的决策。 DLI为BI工具提供了便捷的连接方法： DBeaver、DBT和YongHong BI，可以

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
ClickHouse - 数据湖探索 DLI
ClickHouse - 数据湖探索 DLI

15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据创建

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。若需要获取key的值，则可以通过在flink中设置主键获取，主键字段即对应redis的key。若定义主键，则

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

多导致的。解决方案：设置并发数：通过设置合适的并发数，可以启动多任务并行运行，从而提高作业的处理能力。例如访问DWS大批量数据库数据时设置并发数，启动多任务的方式运行，避免作业运行超时。具体并发设置可以参考对接DWS样例代码中的partitionColumn和numPartitions相关字段和案例描述。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
max - 数据湖探索 DLI
max - 数据湖探索 DLI

STRING类型。指定表名。必须对表有读权限。返回值说明返回STRING类型的值。返回最大的一级分区的值。如果只是用alter table的方式新加了一个分区，但是此分区中并无任何数据，则此分区不会做为返回值。示例代码例如 table1 是分区表，该表对应的分区为2012080

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

或处理时间（流处理）上。 HOP(time_attr, interval, interval) 定义一个跳跃的时间窗口（在 Table API 中称为滑动窗口）。滑动窗口有一个固定的持续时间（第二个 interval 参数）以及一个滑动的间隔（第一个 interval 参数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
DWS Connector概述 - 数据湖探索 DLI

15版本支持两种DWS Connector方式用于接入GaussDB数据：（推荐使用）DWS服务自研的DWS Connector：更关注于直接与DWS的性能与交互，用户能够更加灵活便捷的与DWS进行数据的读写操作。您可以通过自定义函数（UDF）的方式使用DWS自研的DWS Conne

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
离线Compaction配置 - 数据湖探索 DLI

要求较小，为避免资源浪费，使用DataArts调度的话可以compaction作为一个任务，clean、archive作为一个任务分别配置不同的资源执行来节省资源使用。执行资源 Compaction调度的间隔应小于Compaction计划生成的间隔，例如1小时左右生成一个Com

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
count函数如何进行聚合 - 数据湖探索 DLI

count(http_method) FROM apigateway WHERE service_id = 'ecs' Group BY http_method 或者 SELECT http_method FROM apigateway WHERE service_id

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
GROUPING SETS - 数据湖探索 DLI
GROUPING SETS - 数据湖探索 DLI

NULL, NULL, sum(expression) FROM table; 注意事项所要分组的表必须是已经存在的表，否则会出错。不同于ROLLUP，GROUPING SETS目前仅支持一种格式。示例根据group_id与job两个字段生成交叉表格行，返回每种聚合情况下的salary总和。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

中所定义的顺序依次执行。请确保 join 所指定的表在顺序执行中不会产生不支持的 cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

Hive，每天通过批处理流水线作业或 Flink 作业更新一次，kafka流来自实时在线业务数据或日志，需要与维度表连接以扩充流。使用spark sql 创建 hive obs 外表，并插入数据。 CREATE TABLE if not exists dimension_hive_table ( product_id

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
DLI增强型跨源连接DWS失败怎么办？ - 数据湖探索 DLI

放）。客户安全组入方向和出方向配置的都是DLI队列的子网。建议客户将入方向源地址配成0.0.0.0/0，端口8000，表示任意地址都可以访问DWS8000端口。将入方向源地址配成0.0.0.0/0，端口8000，仍然无法连接，继续排查子网配置。客户的DWS子网关联了网络ACL

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

中所定义的顺序依次执行。请确保 join 所指定的表在顺序执行中不会产生不支持的 cross join （笛卡儿积）以致查询失败。流查询中可能会因为不同行的输入数量导致计算结果的状态无限增长。请提供具有有效保留间隔的查询配置，以防止出现过多的状态。示例 SELECT * FROM Orders

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
Flink作业性能调优 - 数据湖探索 DLI

5则为HIGH。时延 Source端会周期性地发送带当前时间戳的LatencyMarker，下游算子接收到该标记后，通过当前时间减去标记中带的时间戳的方式，计算时延指标。算子的反压状态和时延可以通过Flink UI或者作业任务列表查看，一般情况下反压和高时延成对出现：图2 反压状态和时延性能分析

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Spark SQL常用配置项说明 - 数据湖探索 DLI

by a1, a2 with cube spark.sql.distinct.aggregator.enabled false dli.jobs.sql.resubmit.enable null 通过设置该参数可以控制在driver故障、队列重启时Spark SQL作业是否重新提交。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考

总条数： 986

上一页
1
...
45
46
47
...
50
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？ - 数据湖探索 DLI

建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

BI工具连接DLI方案概述 - 数据湖探索 DLI

ClickHouse - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

max - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

count函数如何进行聚合 - 数据湖探索 DLI

GROUPING SETS - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

DLI增强型跨源连接DWS失败怎么办？ - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线