搜索_华为云

测试地址连通性 - 数据湖探索 DLI

在“测试地址连通性”页面填写需要测试的地址。支持域名和IP，可指定端口。数据源地址支持以下输入格式：IPv4地址、IPv4+端口号、域名、域名+端口号。 · IPv4地址：192.168.x.x · IPv4+端口号：192.168.x.x:8080 · 域名：domain-xxxxxx.com · 域名+端口号：domain-xxxxxx

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

创建一个Kafka源表，用来从Kafka指定Topic中读取消费数据；创建一个结果表，用来通过JDBC向MySQL中写入结果数据。实现相应的处理逻辑，以实现各个指标的统计。为了简化最终的处理逻辑，使用创建视图进行数据预处理。利用over窗口条件和过滤条件结合以去除重复数据（该方式是利用了top

帮助中心 > 数据湖探索 DLI > 最佳实践
Flink Jar作业开发基础样例 - 数据湖探索 DLI

安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。获取MRS集群全部节点的ip和域名映射，在DLI跨源连接修改主机信息中配置host映射。如何添加IP域名映射，请参见《数

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

link作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式帮助用户实现功能扩展。用户使用自定义镜像功能需要具备Docker相关的基础知识。使用限制创建自定义镜像必须使用DLI提供的基础镜像。不能随意修改基础镜像中DLI相关组件及目录。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
Flink作业如何保存作业日志？ - 数据湖探索 DLI

Flink作业如何保存作业日志？在创建Flink SQL作业或者Flink Jar作业时，可以在作业编辑页面，勾选“保存作业日志”参数，将作业运行时的日志信息保存到OBS。勾选“保存作业日志”参数后，需配置“OBS桶”参数，选择OBS桶用于保存用户作业日志信息。如果选择的OB

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
Spark jar 如何读取上传文件 - 数据湖探索 DLI

Spark jar 如何读取上传文件 Spark可以使用SparkFiles读取 –-file中提交上来的文件的本地路径，即：SparkFiles.get("上传的文件名")。 Driver中的文件路径与Executor中获取的路径位置是不一致的，所以不能将Driver中获取到的

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

公网数据源指的是可以通过互联网访问的数据源。这些数据源资源有一个公网IP地址，配置DLI与公网网络联通可以实现对这些数据源的访问。本节提供了详细的操作指导，介绍如何通过设置SNAT规则和配置路由信息，实现DLI服务与公网的网络连接。操作流程图1 配置DLI队列访问公网流程步骤1：创建VPC

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
查看增强型跨源连接的基本信息 - 数据湖探索 DLI

查看增强型跨源连接的基本信息增强型跨源连接创建完成后您可以通过管理控制台查看和管理您的增强型跨源连接。本节操作介绍在管理控制台如何查看增强型跨源连接基本信息，包括增强型跨源连接的是否支持IPv6、主机信息等。查看增强型跨源连接的基本信息登录DLI管理控制台。选择“跨源管理

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
Flink作业提交错误，如何定位 - 数据湖探索 DLI

Flink作业提交错误，如何定位在Flink作业管理页面，将鼠标悬停到提交失败的作业状态上，查看失败的简要信息。常见的失败原因可能包括： CU资源不足：需扩容队列。生成jar包失败：检查SQL语法及UDF等。如果信息不足以定位或者是调用栈错误，可以进一步单击作业名称，进入

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
SQL作业运行慢如何定位 - 数据湖探索 DLI

SQL作业运行慢如何定位作业运行慢可以通过以下步骤进行排查处理。可能原因1：FullGC原因导致作业运行慢判断当前作业运行慢是否是FullGC导致：登录DLI控制台，单击“作业管理 > SQL作业”。在SQL作业页面，在对应作业的“操作”列，单击“更多 > 归档日志”。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
count函数如何进行聚合 - 数据湖探索 DLI

count函数如何进行聚合使用count函数进行聚合的正确用法如下： SELECT http_method, count(http_method) FROM apigateway WHERE service_id = 'ecs' Group BY http_method

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
DLI如何访问OBS桶中的数据 - 数据湖探索 DLI

DLI如何访问OBS桶中的数据创建OBS表。具体语法请参考《数据湖探索SQL语法参考》。添加分区。具体语法请参考《数据湖探索SQL语法参考》。往分区导入OBS桶中的数据。具体语法请参考《数据湖探索SQL语法参考》。查询数据。具体语法请参考《数据湖探索SQL语法参考》。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Flink作业运行异常，如何定位 - 数据湖探索 DLI

Flink作业运行异常，如何定位在“Flink作业”管理页面，对应作业“操作”列单击“编辑”按钮，在作业运行界面确认作业是否勾选“保存作业日志”参数。图1 保存作业日志是，则执行3。否，则运行日志不会转储OBS桶，需要先执行2保存作业运行日志。在作业运行界面勾选“保存作

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

记录与DLI服务相关的操作事件，便于日后的查询、审计和回溯。云审计服务支持的DLI操作列表详见使用CTS审计DLI服务。关于如何开通云审计服务以及如何查看追踪事件，请参考《云审计服务快速入门》。创建Flink OpenSource SQL作业在DLI管理控制台的左侧导航栏中

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

列。如果需要购买其他规格的队列，则可以先创建上述某一规格队列后，通过如下操作实现： “包年/包月”队列：则可以通过变更普通队列规格操作来实现。 “按需计费”队列：则可以通过普通队列弹性扩缩容操作来实现。购买时长选择“包年/包月”计费模式时，需要选择“购买时长”。购买时长越长

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？数据湖探索（DLI）服务对于PySpark是原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Py

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Flink Opensource SQL如何解析复杂嵌套 JSON？ - 数据湖探索 DLI

Flink Opensource SQL如何解析复杂嵌套 JSON？ kafka message { "id": 1234567890, "name": "swq", "date": "1997-04-25", "obj": { "time1": "12:12:12"

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中使用Spark将数据写入到DLI表中，主要设置如下参数： fs.obs.access.key fs.obs.secret.key fs.obs.impl fs.obs.endpoint 示例如下： import logging from operator

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表如果需要关联OBS桶中嵌套的JSON格式数据，可以使用异步模式创建表。以下是一个示例的建表语句，展示了如何使用 JSON 格式选项来指定 OBS 中的路径： create table tb1 using json options(path

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况查看Spark作业原始资源配置登录DLI 控制台，单击左侧“作业管理”>“Spark作业”，在作业列表中找到需要查看的Spark作业，单击“作业ID”前的，即可查看对应Spark作业的原始资源配置参数。在创建Spark作业时，

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类

总条数： 327

上一页
1
2
3
4
5
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

测试地址连通性 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

Flink作业如何保存作业日志？ - 数据湖探索 DLI

Spark jar 如何读取上传文件 - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

查看增强型跨源连接的基本信息 - 数据湖探索 DLI

Flink作业提交错误，如何定位 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

count函数如何进行聚合 - 数据湖探索 DLI

DLI如何访问OBS桶中的数据 - 数据湖探索 DLI

Flink作业运行异常，如何定位 - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

Flink Opensource SQL如何解析复杂嵌套 JSON？ - 数据湖探索 DLI

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线