搜索_华为云

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

insert into testcsvdata2source VALUES('Aarn','98','20'); insert作业运行成功后，查询OBS表“testcsvdata2source”数据。 select * from testcsvdata2source; 图3 查询结果在O

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
使用DLI分析电商BI报表 - 数据湖探索 DLI

-1表示未知 gender int 性别 0表示男 1表示女 2表示保密 rank Int 用户等级有顺序的级别枚举，越高级别数字越大 register_time string 用户注册日期单位：天商品数据表2 商品数据字段名称字段类型字段说明取值范围 product_id

帮助中心 > 数据湖探索 DLI > 最佳实践
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

Studio资源。请参考环境准备。创建数据库和表：提交SQL脚本创建数据库和表。请参考步骤1：创建数据库和表。导入业务数据：提交SQL脚本导入业务数据。请参考步骤2：业务数据的计算与处理。数据查询与分析：提交SQL脚本分析业务数据，例如查询单日销售情况。请参考步骤3：销售情况的查询与分析。作业编排：

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

其他选项不需要填写，也无需勾选“需要登录”选项。图1 添加数据源配置表2 数据库连接参数参数描述 URL URL的格式如下。 jdbc:dli://<endPoint>/<projectId>?<key1>=<val1>;<key2>=<val2>… 说明： endpoint指DLI的终端节点，具体请参考地区和终端节点。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

连接容器镜像服务。登录SWR管理控制台。选择左侧导航栏的“总览”，单击页面右上角的“登录指令”，在弹出的页面中单击复制登录指令。在安装容器引擎的虚拟机中执行上一步复制的登录指令。创建容器镜像组织。如果已创建组织则本步骤可以忽略。登录SWR管理控制台。选择左侧导航栏的“组织管理”，单击页面右上角的“创建组织”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
标示符 - 数据湖探索 DLI
标示符 - 数据湖探索 DLI

output_format_classname partition_col_name partition_col_value partition_specs property_name property_value regex_expression result_expression row_format

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

执行SQL写入刚才创建的Hudi表： INSERT INTO hudi_table VALUES (1, 100, 'aaa', '2021-08-28'), (2, 200, 'bbb', '2021-08-28'); 随后可以在编辑器下方的”执行历史（最近一天）”窗格中检查执行结果，或者点击左侧”作业管理”->

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
DLI作业开发流程 - 数据湖探索 DLI

DLI作业开发流程本节内容为您介绍DLI作业开发流程。创建IAM用户并授权使用DLI 如果您是企业用户，并计划使用IAM对您所拥有的DLI资源进行精细的权限管理，请创建IAM用户并授权使用DLI。具体操作请参考创建IAM用户并授权使用DLI。首次使用DLI您需要根据控制台的

 帮助中心 > 数据湖探索 DLI > 用户指南
更新表分区信息（只支持OBS表） - 数据湖探索 DLI

SERDEPROPERTIES：Serde属性。参数说明表1 参数描述参数描述 table_name 表名称。 partition_specs 分区字段。 obs_path OBS存储路径。注意事项该命令的主要应用场景是针对分区表，如当手动在OBS上面添加分区目录时，再通过上

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Flink作业性能调优 - 数据湖探索 DLI

记中带的时间戳的方式，计算时延指标。算子的反压状态和时延可以通过Flink UI或者作业任务列表查看，一般情况下反压和高时延成对出现：图2 反压状态和时延性能分析由于Flink的反压机制，流作业在存在性能问题的情况下，会导致数据源消费速率跟不上生产速率，从而引起Kafka消

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
库表管理标签管理 - 数据湖探索 DLI

单击“添加/编辑标签”，弹出“添加/编辑标签”对话框，配置参数。输入框输入内容后单击'添加'，将标签添加到输入框中。图2 数据表添加/编辑标签表2 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。如果添加预定义标签，用户需要预先

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
手动续费 - 数据湖探索 DLI
手动续费 - 数据湖探索 DLI

自定义查询条件。可在“手动续费项”、“自动续费项”、“到期转按需项”、“到期不续费项”页签查询全部待续费资源，对资源进行手动续费的操作。图2 续费管理所有需手动续费的资源都可归置到“手动续费项”页签，具体操作请参见如何恢复为手动续费。手动续费资源。单个续费：在资源页面找到需要续费的资源，单击操作列的“续费”。

帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

配新版本引擎时的影响。 log4j依赖从1.x版本修改为2.x版本说明： log4j依赖从1.x版本修改为2.x版本 Spark2.4.x：log4j依赖1.x版本（社区不再支持）。 Spark3.3.x：log4j依赖2.x版本。升级引擎版本后是否对作业有影响：有影响 Spark3

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

DLI进行Spark作业访问DLI元数据开发流程参考如下：图1 Spark作业访问DLI元数据开发流程表2 开发流程说明序号阶段操作界面说明 1 创建DLI通用队列 DLI控制台创建作业运行的DLI队列。 2 OBS桶文件配置 OBS控制台如果是创建OBS表，则需要上传文件数据到OBS桶下。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

EXISTS”避免该错误。语法格式 1 2 3 ALTER TABLE [db_name.]table_name DROP [IF EXISTS] PARTITION partition_spec1[,PARTITION partition_spec2,...]; 关键字 DROP：删除表分区。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
MRS配置 - 数据湖探索 DLI
MRS配置 - 数据湖探索 DLI

conf文件。创建MRS HBase表创建DLI表关联MRS HBase表之前确保HBase的表是存在的。以样例代码为例，具体的流程是：远程登录ECS，通过hbase shell命令查看表信息。其中，“hbtest”是要查询的表名。 describe 'hbtest' （可选）如果不存在

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
添加Flink作业标签 - 数据湖探索 DLI

单击“标签”页签，显示当前作业的标签信息。图1 管理作业标签单击“添加/编辑标签”，弹出“添加/编辑标签”对话框。在“添加/编辑标签”对话框中配置标签参数。图2 添加标签表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。如果添加预定义标签，用户需要预

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

具体创建DWS集群的操作可以参考创建DWS集群。整体作业开发流程整体作业开发流程参考图1。图1 作业开发流程步骤1：创建队列：创建DLI作业运行的队列。步骤2：创建RDS Postgres数据库：创建RDS Postgres的数据库和表。步骤3：创建DWS数据库和表：创建用于接收数据的DWS数据库和表。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
数组函数和运算符 - 数据湖探索 DLI

combinations(ARRAY[1, 2, 2], 2); -- [[1, 2], [1, 2], [2, 2]] 子组以及子组中的元素，虽未指明，都是有序的。参数n必须不大于5，且产生的子组个数最大不超过100000。 contains(x, element) 描述：如果数组x中包含element，则返回true。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

选择“增强型跨源”，单击“创建”。配置增强型跨源连接信息，详细参数介绍请参见表2。创建增强型跨源连接时：弹性资源池：选择步骤1：创建弹性资源池并添加通用队列创建的弹性资源池。虚拟私有云：选择步骤2：创建虚拟私有云和安全组创建的虚拟私有云。步骤4：注册ModelArts自定义镜像

 帮助中心 > 数据湖探索 DLI > 用户指南

总条数： 372

上一页
1
...
8
9
10
...
19
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

标示符 - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

更新表分区信息（只支持OBS表） - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

库表管理标签管理 - 数据湖探索 DLI

手动续费 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

删除分区 - 数据湖探索 DLI

MRS配置 - 数据湖探索 DLI

添加Flink作业标签 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

数组函数和运算符 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线