搜索_华为云

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

> 待操作的集群名称 > 服务 > kafka > 实例”，获取kafka角色实例的IP地址，为后续步骤做准备。参考安装MRS客户端下载并安装Kafka客户端。例如，当前Kafka客户端安装在MRS主机节点的“/opt/kafkaclient”目录上。以root用户进入客户端安装目录下。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

请参见图7。图7 查询数据表数据在“创建数据集”页面工具栏中单击“保存”，完成创建数据集。在YongHong BI连接DLI数据源并创建和数据集后，即可在YongHong BI中按需制作BI图表。父主题：使用BI工具连接DLI分析数据

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

-d testdwsdb -h DWS集群连接地址 -U dbadmin -p 8000 -W password -r 执行以下命令创建表并插入数据。创建表： CREATE TABLE table1(id int, a char(6), b varchar(6),c varchar(6))

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
pyspark样例代码 - 数据湖探索 DLI

控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择spark版本为2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

理权限的基础单元是数据库，赋权以数据库为单位。在DLI中，表和数据库是定义底层数据的元数据容器。表中的元数据让DLI知道数据所在的位置，并指定了数据的结构，例如列名称、数据类型和表名称。数据库是表的逻辑分组。 OBS表、DLI表、CloudTable表不同表类型表示不同的数据存储位置。

帮助中心 > 数据湖探索 DLI > 产品介绍
配置DLI程序包权限 - 数据湖探索 DLI

在“程序包管理”页面，选择要授权的程序包组或程序包，单击“操作”列中的“权限管理”。进入“用户权限信息”页面，单击页面右上角“授权”新增授权用户，并选择对应的权限。如果创建程序包时选择了分组，则权限管理为对应程序包组的权限管理。如果创建程序包时选择了不分组，则权限管理为对应程序包的权限管理。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Flink Jar作业开发基础样例 - 数据湖探索 DLI

指定加载的Jar包类名，如KafkaMessageStreaming。默认：根据Jar包文件的Manifest文件指定。指定：必须输入“类名”并确定类参数列表（参数间用空格分隔）。说明：当类属于某个包时，需携带包路径，例如：packagePath.KafkaMessageStreaming

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

角色：同时选择2中创建的角色和Manager_viewer角色。图2 MRS Manager上创建Hive用户参考安装MRS客户端下载并安装Hive客户端。例如，当前Hive客户端安装在MRS主机节点的“/opt/hiveclient”目录上。以root用户进入客户端安装目录下。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
与其他云服务的关系 - 数据湖探索 DLI

统一身份认证服务（Identity and Access Management）为DLI提供了华为云统一入口鉴权功能。具体操作请参考《创建用户并授权使用DLI》和《DLI自定义策略》。与云审计服务（CTS）的关系云审计服务（Cloud Trace Service）为DLI提供对应用户的操作审计。

帮助中心 > 数据湖探索 DLI > 产品介绍
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

在DLI服务中提交Spark或者Flink jar作业时选择自定义镜像。打开管理控制台的Spark作业或者Flink作业编辑页面，在自定义镜像列表中选择已上传并共享的镜像，运行作业，即可使用自定义镜像运行作业。如果选择的镜像不是共享镜像，自定义镜像处会提示该镜像未授权，则需要授权后才可以使用。具体

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

03-21 16:00:00。示例该示例是从Kafka数据源中读取数据，并写入Redis到结果表中，其具体步骤如下：参考增强型跨源连接，根据Redis所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置Redis的安全组，添加入向规则使其

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

records，如果遇到不能转换的字段，则整行为null DROPMALFORMED：忽略掉无法解析的bad records FAILFAST：遇到无法解析的记录时，抛出异常并使Job失败 BADRECORDSPATH：指定导入过程中错误记录的存储目录。 OPTIONS('BADRECORDSPATH'='obs://bucket/path')

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
配置SQL防御规则 - 数据湖探索 DLI

间进行灵活切换，系统会将发生的SQL防御事件实时写入到防御审计日志中。运维人员可进行日志分析，评估现网SQL质量，提前感知潜在SQL风险，并做出有效预防措施。本节操作介绍创建SQL防御规则以增加SQL防御能力的配置方法。 DLI SQL防御规则约束与限制仅Spark 3.3.x及以上版本支持SQL防御功能。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
FileSystem结果表 - 数据湖探索 DLI

int的数量。如果合并时间较长，可能会引起反压，延长checkpoint所需时间。开启该功能后，checkpoint时会产生最终文件，并打开新的文件接收下个checkpoint产生的数据。示例一使用datagen随机生成数据写入obs的bucketName桶下的fileN

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

ar包名J2。新创建的自定义函数F2立即生效无影响。如果创建自定义函数携带OR REPLACE，表示需要对已有的函数内容进行功能替换并实时生效。该功能开启当前需要提交工单开通白名单。如果要在所有SQL队列上立即生效，需要分别选择SQL队列执行一遍：CREATE OR REPLACE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
窗口聚合 - 数据湖探索 DLI
窗口聚合 - 数据湖探索 DLI

语法。Grouping Sets 可以通过一个标准的 GROUP BY 语句来描述更复杂的分组操作。数据按每个指定的 Grouping Sets 分别分组，并像简单的 GROUP BY 子句一样为每个组进行聚合。 GROUPING SETS 窗口聚合中 GROUP BY 子句必须包含 window_start

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
对象存储OBS结果表 - 数据湖探索 DLI

int的数量。如果合并时间较长，可能会引起反压，延长checkpoint所需时间。开启该功能后，checkpoint时会产生最终文件，并打开新的文件接收下个checkpoint产生的数据。示例1 使用datagen随机生成数据写入obs的bucketName桶下的fileN

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
数据湖探索简介 - 数据湖探索 DLI

s融合处理分析服务。用户不需要管理任何服务器，即开即用。 DLI支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自

 帮助中心 > 数据湖探索 DLI > 产品介绍
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

/opt/livy/conf/livy-client.conf”。 vi /opt/livy/conf/livy-client.conf 添加如下内容，并根据注释修改配置项。 #当前ECS的私有IP地址，也可以使用ifconfig命令查询。 livy.rsc.launcher.address =

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
pyspark样例代码 - 数据湖探索 DLI

keytab文件添加到作业的其他依赖文件中，未开启Kerberos认证该步骤忽略。如图1所示：图1 添加依赖文件在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择spark版本为2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase

总条数： 741

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

配置DLI程序包权限 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

与其他云服务的关系 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

窗口聚合 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线