搜索_华为云

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Power BI提供了数据集成、数据仓库、报告和数据可视化等功能，能够将复杂的数据转换为易于理解和交互的可视化图表和仪表板，从而帮助企业做出基于数据的决策。 Kyuubi是一个分布式SQL查询引擎，它允许用户通过标准的SQL接口来访问和分析数据。将Power BI与Kyuubi对接，通

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
在DLI控制台创建数据库和表 - 数据湖探索 DLI

在DLI控制台创建数据库和表数据库是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。表是数据库最重要的组成部分之一。表是由行与列组合成的。每一列被当作是一个字段。每个字段中的值代表一种类型的数据。数据库是一个框架，表是其实质内容。一个数据库包含一个或者多个表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

iii. 此外，您还必须确保该云服务的实例与CDM集群所属的企业项目必须相同，如果不同，需要修改工作空间的企业项目。本示例CDM集群的虚拟私有云、子网以及安全组和RDS MySQL实例保持一致。步骤一：数据准备 RDS的MySQL的数据库实例上创建数据库和表。登录RDS

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

TE BY 1”，可以将多个task生成的多个文件汇总为一个文件。操作步骤在管理控制台检查对应SQL作业详情中的“结果条数”是否正确。检查发现读取的数据量是正确的。图1 检查读取的数据量确认客户验证数据量的方式是否正确。客户验证的方式如下：通过OBS下载数据文件。通

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

b已创建的DLI数据源连接。资源队列选择已创建的DLI SQL类型的队列。数据库名称选择DLI下已创建的数据库。当前示例为在DLI上创建数据库和表中创建的数据库名，即为“testdb”。表名选择DLI下已创建的表名。当前示例为在DLI上创建数据库和表中创建的表名，即为“tablecss”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

在开始页面的“连接”窗格中，选择你想要连接的数据源类型。本例选择Hive类型的数据连接。配置数据连接信息。连接：Hive 服务器：Kyuubi主机的IP地址。端口：连接Kyuubi的端口，Hive Thrift协议对接，默认端口10009。身份验证：本例选择用户名的认证方式。用户名：Kyuubi用户名。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

while trying to read 143805 bytes 问题原因上述报错可能原因是当前导入的文件数据量较大，同时因为spark.sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案建议可以尝试调小spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

选择已创建的DLI数据源连接。资源队列选择已创建的DLI SQL类型的队列。数据库名称选择DLI下已创建的数据库。当前示例为在DLI上创建数据库和表创建的数据库名，即为“testdb”。表名选择DLI下已创建的表名。当前示例为在DLI上创建数据库和表创建的表名，即为“tabletest”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
导出DLI表数据至OBS中 - 数据湖探索 DLI

权限信息的读取权限，以及路径的读写权限，则A账户可将数据导出至B账户的OBS路径中。导出数据步骤导出数据的入口有两个，分别在“数据管理”和“SQL编辑器”页面。在“数据管理”页面导出数据。在管理控制台左侧，单击“数据管理”>“库表管理”。单击需导出数据的表对应的数据库，进入该数据的“表管理”页面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

已创建DLI的SQL队列。创建DLI队列的操作可以参考创建DLI队列。创建DLI队列时队列类型需要选择为“SQL队列”。已创建包含Kafka组件的MRS安全集群。具体创建MRS集群的操作可以参考创建MRS集群。本示例创建的MRS集群版本为：MRS 3.1.0。本示例创建的MRS集群开启了Kerberos认证。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Python SDK环境配置 - 数据湖探索 DLI

Studio ”，可能是由于缺少C++编译器导致的报错，建议您根据提示信息安装相应版本的Visual Studio编译器解决。部分操作系统Visual Studio安装后需重启才可以生效。安装DLI服务Python SDK。选择SDK获取与安装获取的安装包，解压安装包。将"dli-sdk-python-<version>

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列-->找到作业的所属队列-->更多-->测试地址连通性-->输入kafka的地址-->测试）。若能连通，则表示跨源已经绑定成功；否则表示未成功。创建flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

b已创建的DLI数据源连接。资源队列选择已创建的DLI SQL类型的队列。数据库名称选择DLI下已创建的数据库。当前示例为在DLI上创建数据库和表中创建的数据库名，即为“testdb”。表名选择DLI下已创建的表名。当前示例为在DLI上创建数据库和表中创建的表名，即为“user_info”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？什么是数据倾斜？数据倾斜是在SQL作业执行中常见的问题，当数据分布不均匀的情况下，一部分计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所示，查看到一个stage运行时间超过

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？问题现象 DLI分区内表导入了CSV文件数据，导入的文件数据没有包含对应分区列的字段数据。分区表查询时需要指定分区字段，导致查询不到表数据。问题根因 DLI分区内表在导入数据时，如果文件数据没

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Beeline是数据分析师和数据工程师的重要工具之一，适用于大规模数据处理的场景。Beeline提供了的SQL引擎，使得用户可以使用SQL的语言来执行数据查询、数据分析和管理任务。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据。通

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

SQL作业存在join小表操作时，会触发自动广播所有executor，使得join快速完成。但同时该操作会增加executor的内存消耗，如果executor内存不够时，导致作业运行失败。解决措施排查执行的SQL中是否有使用“/*+ BROADCAST(u) */”强制做broadcastjoin。如果有，则需要去掉该标识。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

窗口去重功能描述窗口去重是一种特殊的去重，它根据指定的多个列来删除重复的行，保留每个窗口和分区键的第一个或最后一个数据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

驱动：选择2.a中的驱动。数据库名称：DLI的数据库名称。主机：安装Kyuubi主机IP地址。端口：访问Kyuubi主机的端口。端口默认10009 认证方式：本例选择密码认证方式。用户名：Kyuubi数据库的访问凭证，Kyuubi用户名。密码：Kyuubi数据库的访问凭证，Kyuubi访问密码。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
查询批处理作业状态 - 数据湖探索 DLI

是批处理作业的ID。请求消息无请求参数。响应消息表2 响应参数说明参数名称是否必选参数类型说明 id 否 String 批处理作业的ID，采用UUID（通用唯一识别码）格式。 state 否 String 批处理作业的状态，请参见创建批处理作业中的表7。请求示例

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API

总条数： 227

上一页
1
2
3
4
5
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

查询批处理作业状态 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线