搜索_华为云

Flink Jar作业运行报错，报错信息为Authentication failed - 数据湖探索 DLI

Authentication failed 问题原因因为账号没有在全局配置中配置服务授权，导致该账号在创建跨源连接访问外部数据时因为权限不足而导致跨源访问失败。解决方案登录DLI管理控制台，选择“全局配置 > 服务授权”。在委托设置页面，按需选择所需的委托权限。其中“DLI Datasource

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中问题现象 SQL作业中存在join操作，作业提交后状态一直是运行中，没有结果返回。问题根因 Spark SQL作业存在join小表操作时，会触发自动广播所有executor，使得join快速完成。但同时该操

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

及云服务具有完全的访问权限，可以重置用户密码、分配用户权限等。由于账号是付费主体，为了确保账号安全，建议您不要直接使用账号进行日常管理工作，而是创建用户并使用他们进行日常管理工作。用户由账号在IAM中创建的用户，是云服务的使用人员，具有身份凭证（密码和访问密钥）。在我的凭证

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
权限管理 - 数据湖探索 DLI
权限管理 - 数据湖探索 DLI

在华为云上购买DLI资源后，如果您需要给企业中的员工设置不同的访问权限，以达到不同员工之间的权限隔离，可以使用统一身份认证服务（Identity and Access Management，简称IAM）进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能，可以帮助您安全地控制华为云资源的访问。通过

 帮助中心 > 数据湖探索 DLI > 产品介绍
配置DLI云服务委托权限 - 数据湖探索 DLI

除dli_management_agency提供的委托权限外，一些场景需要用户自行在IAM页面创建相关委托，并在作业配置中添加新建的委托信息。例如允许DLI读写OBS将日志转储、允许DLI在访问DEW获取数据访问凭证场景的委托需求等，具体操作请参考创建DLI自定义委托权限和常见场景的委托权限策略。

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

说明：默认情况下，空值在CSV数据源中，2.4.5版本空字符串为""，升级到spark3.3.1后空字符串无引号。 Spark2.4.x：空值在CSV数据源中为""。 Spark3.3.x：空值在CSV数据源中无引号。如需在Spark3.3.x版本中恢复Spark2.4.x的格式，可以通过设置spark

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
创建并提交SQL作业 - 数据湖探索 DLI

《数据湖探索SQL语法参考》。在总览页面，单击左侧导航栏中的“SQL编辑器”或SQL作业简介右上角的“创建作业”，可进入“SQL编辑器”页面。本节内容介绍使用DLI的SQL编辑器创建并提交SQL作业。使用须知首次进入SQL编辑器，页面会提示设置DLI作业桶。该桶用于存储使

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
使用DLI分析电商BI报表 - 数据湖探索 DLI

action表数据：data/JData_Action 步骤2：分析数据创建数据库、表在portal页面上方菜单栏中单击“产品”，单击“大数据”分类中的“数据湖探索 DLI”。创建demo数据库，在DLI控制台总览页面，选择“作业管理 > SQL作业”，单击“创建作业”，进入SQL作业编辑器。在

 帮助中心 > 数据湖探索 DLI > 最佳实践
修改弹性资源池的主机信息 - 数据湖探索 DLI

域名即可访问对应的主机。在跨源连接创建完成后，支持修改主机信息。常见的访问MRS的HBase集群时需要配置实例的主机名（即域名）与主机对应的IP地址。约束限制已获取MRS主机信息。请参考怎样获取MRS主机信息? 修改主机信息登录DLI管理控制台。在左侧导航栏中，选择“跨源管理

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ - 数据湖探索 DLI

跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ Spark中没有datetime数据类型，其使用的是TIMESTAMP类型。您可以通过函数进行转换。例如： select cast(create_date as string)

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
导出DLI表数据至OBS中 - 数据湖探索 DLI

导出DLI表数据至OBS中支持将数据从DLI表中导出到OBS服务中，导出操作将在OBS服务新建文件夹，或覆盖已有文件夹中的内容。注意事项支持导出json格式的文件，且文本格式仅支持UTF-8。只支持将DLI表（表类型为“Managed”）中的数据导出到OBS桶中，且导出的路径必须指定到文件夹级别。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
DLI常用跨源分析开发方式 - 数据湖探索 DLI

DLI常用跨源分析开发方式跨源分析当DLI有访问外部数据源的业务需求时，首先需要通过建立增强型跨源连接，打通DLI与数据源之间的网络，再开发不同的作业访问数据源以实现DLI跨源分析。本节操作介绍DLI支持的数据源对应的开发方式。使用须知 Flink作业访问DIS，OBS和SMN数据源，无需创建跨源连接，可以直接访问。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
怎样判断当前DLI队列中的作业是否有积压？ - 数据湖探索 DLI

数据湖探索”，进入到云服务监控页面。在云服务监控页面，“名称”列对应队列名称，单击对应队列名称，进入到队列监控页面。在队列监控页面，分别查看以下指标查看当前队列的作业运行情况。 “提交中作业数”：展示当前队列中状态为“提交中”的作业数量。 “运行中作业数”：展示当前队列中状态为“运行中”的作业数量。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
Spark作业使用咨询 - 数据湖探索 DLI

SQL语法创建表时是否支持定义主键 Spark SQL语法不支持定义主键。 DLI Spark jar作业是否能访问DWS跨源表？可以访问。详细操作请参考访问DWS和访问SQL库表。如何查看Spark内置依赖包的版本？ DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

公网数据源指的是可以通过互联网访问的数据源。这些数据源资源有一个公网IP地址，配置DLI与公网网络联通可以实现对这些数据源的访问。本节提供了详细的操作指导，介绍如何通过设置SNAT规则和配置路由信息，实现DLI服务与公网的网络连接。操作流程图1 配置DLI队列访问公网流程步骤1：创建VPC

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

就已经考虑到这一点了，那就是基于PyFiles来指定依赖，在DLI Spark作业页面中可以直接选取存放在OBS上的Python第三方程序库（支持zip、egg等）。图1 Spark作业编辑页面对于依赖的这个Python第三方库的压缩包有一定的结构要求，例如，PySpark程

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
数组函数和运算符 - 数据湖探索 DLI

数组函数和运算符下标操作符：[] 描述：下标操作符用于访问数组中的元素，并从1开始建立索引。 select myarr[5] from (values array [1,4,6,78,8,9],array[2,4,6,8,10,12]) as t(myarr); _col0

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

列CU时套餐包”下线（EOL）公告公告说明为了更好的实现资源共享，提高计算资源利用率，DLI将“包年/包月”和“按需计费”计费模式队列升级为“弹性资源池队列”。即使用DLI计算资源需先购买弹性资源池，并在弹性资源池中创建队列。 DLI“包年/包月”和“按需计费”计费模式队列和

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

配置Notebook实例连接DLI。在Notebook实例的列表中单击操作类的“打开”跳转至Notebook实例页面。在Notebook实例页面单击右上角的“connect”连接DLI。图2 连接DLI 在Connect Cluster页面中，填写作业运行的相关信息。图3 Connect Cluster

帮助中心 > 数据湖探索 DLI > 用户指南
如何获取AK/SK？ - 数据湖探索 DLI

将鼠标移动到右上角用户名上，在下拉列表中单击“我的凭证”。在左侧导航栏单击“访问密钥”。单击“新增访问密钥”，进入“新增访问密钥”页面。根据提示输入对应信息，单击“确定”，在弹出的提示页面单击“立即下载”。下载成功后，打开凭证文件，获取AK/SK信息。为防止访问密钥泄露，建议您将其保存到安全的位置。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类

总条数： 957

上一页
1
...
4
5
6
...
48
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink Jar作业运行报错，报错信息为Authentication failed - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

权限管理 - 数据湖探索 DLI

配置DLI云服务委托权限 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

修改弹性资源池的主机信息 - 数据湖探索 DLI

跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

怎样判断当前DLI队列中的作业是否有积压？ - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

数组函数和运算符 - 数据湖探索 DLI

DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

如何获取AK/SK？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线