搜索_华为云

Spark作业开发类 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK 如何查看DLI Spark作业的实际资源使用情况将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark.sql

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
MRS配置 - 数据湖探索 DLI
MRS配置 - 数据湖探索 DLI

conf文件。创建MRS HBase表创建DLI表关联MRS HBase表之前确保HBase的表是存在的。以样例代码为例，具体的流程是：远程登录ECS，通过hbase shell命令查看表信息。其中，“hbtest”是要查询的表名。 describe 'hbtest' （可选）如果不存在

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

大CU。同一队列不同扩缩容策略的时间段区间不能有交集。弹性资源池队列中的扩缩容策略时间段仅支持整点的时间段设置，并且包含设置的开启时间，不包含设置的结束时间，例如设置时间段00-09，则时间段范围为：[00:00，09:00)。默认的扩缩容策略不支持时间段配置修改。弹性资源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
string_split - 数据湖探索 DLI
string_split - 数据湖探索 DLI

sql作业，输入以下作业运行脚本，提交运行作业。注意：创建作业时，在作业编辑界面的“运行参数”处，“Flink版本”选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。如下脚本中的加粗参数请根据实际环境修改。 CREATE TABLE kafkaSource (

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数 > 表值函数
string_split - 数据湖探索 DLI
string_split - 数据湖探索 DLI

sql作业，输入以下作业运行脚本，提交运行作业。注意：创建作业时，在作业编辑界面的“运行参数”处，“Flink版本”选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。如下脚本中的加粗参数请根据实际环境修改。 CREATE TABLE kafkaSource (

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数 > 表值函数
责任共担 - 数据湖探索 DLI
责任共担 - 数据湖探索 DLI

户的安全责任在于对使用的IaaS、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
管理Spark作业模板 - 数据湖探索 DLI

可直接将配置完成的作业信息设置为模板。在DLI管理控制台的左侧导航栏中，单击“作业模板”>“Spark模板”，页面跳转至Spark作业页面。参考创建Spark作业配置作业参数。作业编辑完成后，单击“设为模板”。输入模板名称和描述信息。设置模板的分组信息。便于模板的统一管理。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
什么是用户配额？ - 数据湖探索 DLI

什么是用户配额？配额是指云平台预先设定的资源使用限制，包括资源数量和容量等。设置配额是为了确保资源合理的分配和使用，避免资源过度集中和资源浪费。如果资源配额限制满足不了用户的使用需求，可以通过工单系统来提交您的申请，并告知您申请提高配额的理由。在通过审理之后，系统会更新您的

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI资源配额类
GROUP BY - 数据湖探索 DLI
GROUP BY - 数据湖探索 DLI

customer GROUP BY mktsegment; GROUPING SETS 可以指定多个列进行分组，结果列中不属于分组列的将被设置为NUll。具有复杂分组语法（GROUPING SETS、CUBE或ROLLUP）的查询只从基础数据源读取一次，而使用UNION ALL的

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
Spark SQL常用配置项说明 - 数据湖探索 DLI

false 当前配置设置为“false”时，DLI在覆盖写之前，会删除所有符合条件的分区。例如，分区表中有一个“2021-01”的分区，当使用INSERT OVERWRITE语句向表中写入“2021-02”这个分区的数据时，会把“2021-01”的分区数据也覆盖掉。当前配置设置为“tru

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
禁止或恢复表的生命周期 - 数据湖探索 DLI

表生命周期功能支持Hive、DataSource语法创建表、多版本表，暂不支持跨源表、Carbon表。生命周期单位为天，取值为正整数。生命周期只能在表级别设置，不能在分区级设置。为分区表指定的生命周期，适用于该表所有的分区。语法格式该语法在表级别禁止或恢复表的生命周期 1 ALTER TABLE table_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
pyspark样例代码 - 数据湖探索 DLI

StructField("value", DoubleType())]) 设置数据 1 dataList = sparkSession.sparkContext.parallelize([("aaa", "abc",

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
修改表生命周期的时间 - 数据湖探索 DLI

表生命周期功能支持Hive、DataSource语法创建表、多版本表，暂不支持跨源表、Carbon表。生命周期单位为天，取值为正整数。生命周期只能在表级别设置，不能在分区级设置。为分区表指定的生命周期，适用于该表所有的分区。语法格式 ALTER TABLE table_name SET TBLPROPERTIES("dli

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
创建DLI表关联Oracle - 数据湖探索 DLI

/driver/ojdbc6.jar' ); 关键字表1 CREATE TABLE关键字说明参数描述 url Oracle的连接地址。 Oracle url支持以下格式：格式一：jdbc:oracle:thin:@host:port:SID，其中SID是oracle数据库的唯一标识符。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接Oracle表
使用Hive语法创建OBS表 - 数据湖探索 DLI

3及以上版本支持使用Hive语法的CTAS语句创建分区表。关于创建表时设置多字符的分隔符：只有指定ROW FORMAT SERDE为org.apache.hadoop.hive.contrib.serde2.MultiDelimitSerDe时，字段分隔符才支持设置为多字符。只有Hive OBS表支持在建表时指定多字符的分隔符，Hive

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
Hudi数据表Clean规范 - 数据湖探索 DLI

具体可以按照下面的计算公式来保留2个小时的历史版本数据：版本数设置为3600*2/版本interval时间，版本interval时间来自于flink作业的checkpoint周期，或者上游批量写入的周期。 COW表如果业务没有历史版本数据保留的特殊要求，保留版本数设置为1。 COW表的每个版本都是表的全量

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

登录DEW管理控制台选择“凭据管理”，进入“凭据管理”页面。单击“创建凭据”。配置凭据基本信息 DLI Spark jar作业编辑界面设置作业参数。 Spark参数： spark.hadoop.fs.obs.bucket.USER_BUCKET_NAME.dew.access

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
删除表后再重新创建同名的表，需要对操作该表的用户和项目重新赋权吗？ - 数据湖探索 DLI

表管理”。单击需要设置权限的表所在的数据库名，进入该数据库的“表管理”页面。单击所选表“操作”栏中的“权限管理”，将显示该表对应的权限信息。单击表权限管理页面右上角的“授权”按钮。在弹出的“授权”对话框中选择相应的权限。单击“确定”，完成表权限设置。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
增强型跨源连接绑定弹性资源池 - 数据湖探索 DLI

列和数据源已连通。建议前往队列管理页面测试数据源网络是否打通。操作步骤如下：在队列管理页面选择队列。单击“操作”列中的“更多 > 测试地址连通性”。输入数据源的“IP:端口”测试网络连通性。在增强型跨源连接的详情页可以查看对等连接的相关信息。对等连接ID：增强型跨源在该队列所在集群中创建的对等连接ID。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
Hive维表 - 数据湖探索 DLI
Hive维表 - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。 Hive 方言支持的 DDL 语句，Flink 1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive

总条数： 506

上一页
1
...
20
21
22
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark作业开发类 - 数据湖探索 DLI

MRS配置 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

string_split - 数据湖探索 DLI

string_split - 数据湖探索 DLI

责任共担 - 数据湖探索 DLI

管理Spark作业模板 - 数据湖探索 DLI

什么是用户配额？ - 数据湖探索 DLI

GROUP BY - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

修改表生命周期的时间 - 数据湖探索 DLI

创建DLI表关联Oracle - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

删除表后再重新创建同名的表，需要对操作该表的用户和项目重新赋权吗？ - 数据湖探索 DLI

增强型跨源连接绑定弹性资源池 - 数据湖探索 DLI

Hive维表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线