搜索_华为云

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

n程序也有依赖一些第三方库，尤其是基于PySpark的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
EXCEPT - 数据湖探索 DLI
EXCEPT - 数据湖探索 DLI

的记录，EXCEPT默认不去重。与UNION相同，每一个SELECT语句返回的列数必须相同，列的类型和列名不一定要相同。注意事项不能在多个集合运算间（UNION，INTERSECT，EXCEPT）加括号，否则会出错示例先将“SELECT * FROM student_1”查询结果减去“SELECT

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 集合运算SELECT
OVER - 数据湖探索 DLI
OVER - 数据湖探索 DLI

PARTITION BY：可以用一个或多个键分区。和GROUP BY子句类似，PARTITION BY将表按分区键分区，每个分区是一个窗口，窗口函数作用于各个分区。单表分区数最多允许7000个。 ORDER BY：决定窗口函数求值的顺序。可以用一个或多个键排序。通过ASC或DESC决定

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
keyvalue - 数据湖探索 DLI
keyvalue - 数据湖探索 DLI

用于作为分隔符的字符串，按照指定的两个分隔符拆分源字符串。如果表达式中没有指定这两项，默认split1为";"，split2为":"。当某个被split1拆分后的字符串中有多个split2时，返回结果未定义。 key 否 BIGINT 将字符串按照split1和split2拆分后，返回key值对应的Value。返回值说明

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
查询作业详情 - 数据湖探索 DLI

响应参数说明参数名称是否必选参数类型说明 is_success 否 String 执行请求是否成功。“true”表示请求执行成功。 message 否 String 系统提示信息，执行成功时，信息可能为空。 job_detail 否 Object 作业详情。请参见表3。表3

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Hudi数据表Clean规范 - 数据湖探索 DLI

clean作业每天至少执行一次，可以2~4小时执行一次。 Hudi的MOR表和COW表都需要保证每天至少1次Clean，MOR表的Clean可以参考2.2.1.6小节和Compaction放在一起异步去执行。COW的Clean可以在写数据时自动判断是否执行。父主题： Hudi数据表管理操作规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
清理多版本数据 - 数据湖探索 DLI

清理多版本数据功能描述多版本数据保留周期是在表每次执行insert overwrite或者truncate语句时触发，所以当表的多版本数据在保留周期时间外但是后续该表不会再执行insert overwrite或者truncate语句时，多版本保留周期外的数据不会自动清理。可以

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
更新Flink Jar作业 - 数据湖探索 DLI

作业类型。响应消息表3 响应参数说明参数名称是否必选参数类型说明 is_success 否 String 执行请求是否成功。“true”表示请求执行成功。 message 否 String 消息内容。 job 否 object 作业更新信息。具体请参考表4。表4 job参数说明

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
concat - 数据湖探索 DLI
concat - 数据湖探索 DLI

concat_ws concat_ws函数用于连接多个字符串，字符串之间以指定的分隔符分隔。命令格式 concat_ws(string <separator>, string <str1>, string <str2>[,...]) 或 concat_ws(string <separator>

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
OpenTSDB结果表 - 数据湖探索 DLI
OpenTSDB结果表 - 数据湖探索 DLI

其个数需要为1或者和“connector.tsdb-values”的个数相同。多个timestamp请使用“;”分隔。 connector.tsdb-values 是数据点的value，支持指定动态列或者常数值。多个values请使用“;”分隔。 connector.tsdb-tags

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

已参考初始化DLI客户端完成客户端DLIClient的初始化，参考队列相关完成队列创建等操作。提交批处理作业 DLI提供执行批处理作业的接口。您可以使用该接口执行批处理作业。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

'obs://bucket/path/hudi_table'; 等待下方执行历史显示作业执行成功，代表建表成功，此时创建了一张Hudi的COW分区表。可以执行 SHOW TABLES 检查建表是否成功： SHOW TABLES; 执行SQL写入刚才创建的Hudi表： INSERT INTO hudi_table

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
Upsert Kafka结果表 - 数据湖探索 DLI

Upsert Kafka结果表功能描述 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。DLI将Flink作业的输出数据以upsert的模式输出到Kafka中。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
新建Flink Jar作业 - 数据湖探索 DLI

但首尾不能含有空格。响应消息表4 响应参数说明参数名称是否必选参数类型说明 is_success 否 String 执行请求是否成功。“true”表示请求执行成功。 message 否 String 消息内容。 job 否 Object 作业状态信息。具体请参考表5。表5 job参数说明

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
使用DLI分析电商BI报表 - 数据湖探索 DLI

"obs://DLI-demo/data/JData_Action"); 执行查询常用查询语句可以设置为模板，下次查询的时候在模板管理页面可以查看，具体操作可参见《数据湖探索用户指南》中的《模板管理》。分析出10大用户点赞数最多的产品执行以下SQL语句，可以分析出10大用户点赞数最多的产品。 SELECT

帮助中心 > 数据湖探索 DLI > 最佳实践
配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

JAVA_HOME=/usr/local/jdk-1.8.0_261 export PATH=$PATH:$JAVA_HOME/bin 执行以下命令应用环境变量。 source ~/.bashrc 执行命令java -version，检查是否安装成功，如下显示版本号信息说明java环境安装成功。 java version

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

Spark队列操作OBS表如何设置AK/SK？更多 Flink作业相关问题怎样将OBS表映射为DLI的分区表？更多技术专题技术、观点、课程专题呈现 Cloud Native Lives Kubernetes系列课程，带你走进云原生技术的核心 GO语言深入之道介绍几个Go语言及相关开源框架的插件机制跟唐老师学习云网络

 帮助中心 > 数据湖探索 DLI > 成长地图
重命名分区（只支持OBS表） - 数据湖探索 DLI

该命令仅支持操作OBS表，不支持对DLI表进行操作。所要重命名分区的表和分区必须已存在，否则会出错。新分区名不能与其他分区重名，否则将出错。若分区表是按照多个字段进行分区的，重命名分区时需要指定所有的分区字段，指定字段的顺序可任意。 “partition_specs”中的参数默认带有“( )”，例如：PARTITION

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
查看Flink作业详情 - 数据湖探索 DLI

算子运行结束时间。查看Flink作业执行计划用户通过查看执行计划了解到运行中的作业的算子流向。在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Flink作业”，进入Flink作业管理页面。单击需要查看的作业名称，进入“作业详情”页面。单击“执行计划”，在“执行计划”页签可以查看作业的算子流向。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
全局变量的使用中，一个子账号是否可以使用其他子账号创建的全局变量 - 数据湖探索 DLI

局变量同账号同项目下的用户共用。如果同账号同项目下存在多个相同名称的全局变量时，需要将多余相同名称的全局变量删除，保证同账号同项目下唯一，此时具备该全局变量修改权限的用户均可以修改对应的变量值。如果同账号同项目下存在多个相同名称的全局变量，优先删除用户自建的。如果仅存在唯一名

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类

总条数： 616

上一页
1
...
9
10
11
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

EXCEPT - 数据湖探索 DLI

OVER - 数据湖探索 DLI

keyvalue - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

清理多版本数据 - 数据湖探索 DLI

更新Flink Jar作业 - 数据湖探索 DLI

concat - 数据湖探索 DLI

OpenTSDB结果表 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

重命名分区（只支持OBS表） - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

全局变量的使用中，一个子账号是否可以使用其他子账号创建的全局变量 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线