搜索_华为云

入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

入门实践我们整理了从队列网络连通、不同类型的作业分析、数据迁移场景的常用开发指南和最佳实践内容，帮助您更好的使用DLI进行大数据分析和处理。表1 DLI常用开发指南与最佳实践场景操作指导描述 Spark SQL作业开发使用Spark SQL作业分析OBS数据介绍使用Spark

帮助中心 > 数据湖探索 DLI > 快速入门
使用DLI分析电商BI报表 - 数据湖探索 DLI

4表示大于50条评论 has_bad_comment int 是否有差评 0表示无，1表示有 bad_comment_rate float 差评率差评数占总评论数的比重行为数据表4 行为数据字段名称字段类型字段说明取值范围 user_id int 用户编号脱敏 product_id

帮助中心 > 数据湖探索 DLI > 最佳实践
Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？问题描述用户执行Flink Opensource SQL, 采用Flink 1.10版本。初期Flink作业规划的Kafka的分区数partition设置过小或过大，后期需要更改Kafka区分数。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

erved: 5/508/3 原因分析当前访问的DWS数据库连接已经超过了最大连接数。错误信息中，non-active的个数表示空闲连接数，例如，non-active为508，说明当前有大量的空闲连接。解决方案出现该问题时建议通过以下操作步骤解决。登录DWS命令执行窗口，

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
IP Address函数 - 数据湖探索 DLI
IP Address函数 - 数据湖探索 DLI

IP Address函数 contains(network, address) → boolean 当CIDR网络中包含address时返回true。 SELECT contains('10.0.0.0/8', IPADDRESS '10.255.255.255'); -- true

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

创建函数功能描述 DLI支持创建使用UDF和UDTF等自定义函数应用于Spark作业开发当中。具体使用自定义函数端到端的开发指导可以参考：Spark SQL作业使用UDF和Spark SQL作业使用UDTF。语法格式 1 2 3 4 5 CREATE FUNCTION [db_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
增强型跨源连接绑定队列失败怎么办？ - 数据湖探索 DLI

增强型跨源连接绑定队列失败怎么办？问题现象客户创建增强型跨源连接后，在队列管理测试网络连通性，网络不通，单击对应的跨源连接查看详情，发现绑定队列失败，报错信息如下： Failed to get subnet 86ddcf50-233a-449d-9811-cfef2f603213

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

后面使用DLI完成数据分析做准备。步骤2：分析数据。使用DLI对待分析的数据进行查询。示例代码具体样例数据及详细SQL语句可以通过数据包进行下载。方案优势数据免搬迁：DLI支持与多种数据源的对接，直接通过SQL建表就可以完成数据源的映射。简单易用：直接使用标准SQL编

 帮助中心 > 数据湖探索 DLI > 最佳实践
创建并使用跨源链接 - 数据湖探索 DLI

通常为6~10分钟。创建增强型跨源连接之前需要获取需要建立连接的服务对应VPC的ID和其所在子网的网络ID。获取VPC的ID接口，具体请参考《虚拟私有云API参考》。获取子网网络ID接口，具体请参考《虚拟私有云API参考》。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
创建DLI程序包 - 数据湖探索 DLI

创建DLI程序包 DLI支持用户通过批处理方式将程序包提交至通用队列中运行。如果用户需要更新程序包，可以使用相同的程序包或文件上传至DLI的同一个位置（同一个分组），直接覆盖原有的程序包或文件。前提条件所使用的程序包需提前上传至OBS服务中保存。创建程序包步骤在管理控制

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
DLI内置依赖包 - 数据湖探索 DLI

DLI内置依赖包 DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业jar包时，不需要额外上传这些依赖包，以免与平台内置依赖包冲突。 Spark 3.1.1 依赖包表1 Spark 3.1.1 依赖包依赖包名称 accessors-smart-1

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
程序包管理概述 - 数据湖探索 DLI

程序包管理概述在执行DLI作业前需要将UDF Jar包或Jar作业程序包上传到云平台进行统一的管理和维护。有以下两种方式管理程序包：（推荐使用）上传至OBS管理程序包：提前将对应的jar包上传至OBS桶中，在作业配置时选择对应的OBS路径。（DLI程序包功能即将停用）上传

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
新建跨源连接，显示已激活，但使用时提示communication link failure错误怎么办？ - 数据湖探索 DLI

新建跨源连接，显示已激活，但使用时提示communication link failure错误怎么办？根因分析网络连通性问题，建议用户检查安全组选择是否正确，检查安全组网络（vpc）配置。解决方案示列：创建RDS跨源，使用时报“communication link failure”错误。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
配置DLI程序包权限 - 数据湖探索 DLI

配置DLI程序包权限针对不同用户，可以通过权限设置分配不同的程序包组或程序包，不同用户之间的作业效率互不影响，保障作业性能。管理员用户、程序包组拥有程序包组的所有权限。不需要进行权限设置，且其他用户无法修改其程序包组权限。管理员用户、程序包的所有者拥有程序包的所有权限。不需

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

步骤5：创建DLI连接Kafka的增强型跨源连接通过增强型跨源连接建立DLI弹性资源池与Kafka实例的网络连通。步骤6：创建DLI连接RDS的增强型跨源连接通过增强型跨源连接建立DLI弹性资源池与RDS实例的网络连通。步骤7：使用DEW管理访问凭据，并配置允许DLI访问DEW的委托跨源分析场

 帮助中心 > 数据湖探索 DLI > 快速入门
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

MySQL实例内网地址，进行网络连通性测试。在RDS控制台“实例管理”页面，单击对应实例名称，查看“连接信息”>“内网地址”，即可获取对应信息。测试结果显示可达，则DLI队列与MySQL实例的网络已经联通。图7 测试结果如果测试结果不可达，请参考创建跨源成功但测试网络连通性失败怎么办？进行排查。

帮助中心 > 数据湖探索 DLI > 快速入门
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Kafka Sink配置发送失败重试机制 - 数据湖探索 DLI

server disconnected before a response was received. 问题原因由于CPU使用率过高，导致网络闪断。解决方案在SQL语句中配置发送失败重试：connector.properties.retries=5 create table kafka_sink(

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
DWS维表（不推荐使用） - 数据湖探索 DLI

每次从数据库拉取数据的行数。默认值为0，表示不限制。 scan.auto-commit 否 true Boolean 设置自动提交标志。它决定每一个statement是否以事务的方式自动提交。 lookup.cache.max-rows 否无 Integer 维表配置，缓存的最大行数，超过该值时，最先添加的数据将被标记为过期。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ - 数据湖探索 DLI

classno Jordon 88 aa bb" null null 解决方案创建OBS外表时，通过multiLine=true来指定列数据包含回车换行符。针对举例的建表语句，可以通过如下示例解决： CREATE TABLE test06 (name string, id int

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类

总条数： 339

上一页
1
2
3
4
5
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

入门实践 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

IP Address函数 - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

增强型跨源连接绑定队列失败怎么办？ - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

创建DLI程序包 - 数据湖探索 DLI

DLI内置依赖包 - 数据湖探索 DLI

程序包管理概述 - 数据湖探索 DLI

新建跨源连接，显示已激活，但使用时提示communication link failure错误怎么办？ - 数据湖探索 DLI

配置DLI程序包权限 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

Kafka Sink配置发送失败重试机制 - 数据湖探索 DLI

DWS维表（不推荐使用） - 数据湖探索 DLI

创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线