搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

sparkSession.sql("select * from css_table") jdbcDF.show() 操作结果提交Spark作业将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spa

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
使用DLI分析账单消费数据 - 数据湖探索 DLI

空间，并给出使用DLI过程中降低成本的一些优化措施。流程介绍使用DLI进行账单分析与优化的操作过程主要包括以下步骤：步骤1：获取消费数据。获取账户的实际消费数据。步骤2：分析账户消费结构并优化。在DLI上分析账户消费结构，找出开支较大的资源或用户，并给出降底成本的优化措施。

帮助中心 > 数据湖探索 DLI > 最佳实践
查询分组资源列表（废弃） - 数据湖探索 DLI

String 项目编号，用于资源隔离。获取方式请参考获取项目ID。表2 query参数说明参数名称是否必选参数类型说明 kind 否 String 指定文件类型。包括以下文件类型： jar：用户jar文件。 pyFile：用户python文件。 file：用户文件。 modelFile：用户AI模型文件。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

sparkSession.sparkContext().addFile("obs://桶名/地址/truststore.jks"); // 获取当前工作目录的路径 String pathUser = System.getProperty("user.dir");

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
CSS安全集群配置 - 数据湖探索 DLI

CSS安全集群配置准备工作当前CSS服务提供的Elasticsearch 6.5.4或以上集群版本为用户增加了安全模式功能，开启安全模式后，将会为用户提供身份验证、授权以及加密等功能。DLI服务对接CSS安全集群时，需要先进行以下准备工作。选择CSS Elasticsearch

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
上传分组资源（废弃） - 数据湖探索 DLI

参数说明表1 URI参数说明参数名称是否必选参数类型说明 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。请求消息表2 请求参数参数名称是否必选参数类型说明 paths 是 Array of Strings 用户OB

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

有影响，jar需要升级scala版本编译。 PySpark支持python版本变更说明： PySpark支持python版本变更。 Spark2.4.x：PySpark支持python版本范围2.6+版本到3.7+版本。 Spark3.3.x：PySpark支持Python版本范围3.6及以上版本。升级引擎版本后是否对作业有影响：

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
DLI内置依赖包 - 数据湖探索 DLI

r-20131024-2017.jar zstd-jni-1.4.4-11.jar Flink 1.15依赖包请在Flink作业的日志中获取Flink 1.15相关依赖包信息：查看Flink日志。登录DLI管理控制台，选择“作业管理 > Flink作业”。单击作业名称，选择“运行日志”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Flink jobmanager日志一直报Timeout expired while fetching topic metadata怎么办？ - 数据湖探索 DLI

JobManager提示 "Timeout expired while fetching topic metadata" ，说明Flink作业在尝试获取Kafka主题的元数据时超时了。此时您需要先检查Flink作业和Kafka的网络连通性，确保执行Flink作业所在的队列可以访问Kafka所在的VPC网络。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
数组函数和运算符 - 数据湖探索 DLI

outputFunction(S, R)) 返回从数组减少的单个值。将按顺序为数组中的每个元素调用inputFunction。除了获取元素之外，inputFunction还获取当前状态，最初为initialState，然后返回新状态。将调用outputFunction将最终状态转换为结果值。它可能是恒等函数（i->

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
查看赋权对象使用者权限信息 - 数据湖探索 DLI

参数名称是否必选参数类型说明 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。表2 query参数参数名称是否必选参数类型说明 object 是 String 授权对象，和赋权API中的“object”对应。 "jobs.flink

帮助中心 > 数据湖探索 DLI > API参考 > 权限相关API
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

包文件的OBS路径，格式为：obs://桶名/文件夹路径名/包名。依赖python文件（--py-files）运行spark作业依赖的py-files。可以输入Python文件名称，也可以输入Python文件对应的OBS路径，格式为：obs://桶名/文件夹路径名/文件名。其他依赖文件（--files）

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
dateadd - 数据湖探索 DLI
dateadd - 数据湖探索 DLI

dateadd dateadd函数用于按照指定的单位datepart和幅度delta修改date的值。如需要获取当前日期基础上指定变动幅度的日期，可结合current_date或getdate函数共同使用。命令格式 dateadd(string date, bigint delta

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
Lambda 表达式 - 数据湖探索 DLI
Lambda 表达式 - 数据湖探索 DLI

场景：不支持子查询 x -> 2 + (SELECT 3) 不支持聚合函数 x -> max(y) 示例通过transform()函数获取数组元素的平方： SELECT numbers, transform(numbers, n -> n * n) as squared_numbers

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
date - 数据湖探索 DLI
date - 数据湖探索 DLI

date_sub date_sub函数按照days幅度递减startdate日期的天数。如需要获取当前日期基础上指定变动幅度的日期，可结合current_date或getdate函数共同使用。请注意date_sub函数与date_add函数逻辑反。命令格式 date_sub(string

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
date - 数据湖探索 DLI
date - 数据湖探索 DLI

date_add date_add函数用于计算按照days幅度递增startdate日期的天数。如需要获取当前日期基础上指定变动幅度的日期，可结合current_date或getdate函数共同使用。请注意date_add函数与date_sub函数逻辑反。命令格式 date_add(string

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
怎样查看DLI SQL日志？ - 数据湖探索 DLI

怎样查看DLI SQL日志？场景概述日常运维时需要查看DLI SQL日志。操作步骤在DataArts Studio控制台获取DataArts Studio执行DLI作业的job id。图1 查看日志图2 查找job id 在DLI控制台，选择“作业管理”>“SQL作业”。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

系统default队列不支持创建跨源连接。步骤1：获取外部数据源的内网IP、端口和安全组表2 各数据源信息获取数据源参数获取 DMS Kafka 在Kafka管理控制台，选择“Kafka专享版”，单击对应的Kafka名称，进入到Kafka的基本信息页面。在“连接信息”中获取该Kafka的“内网连接

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
Upsert Kafka结果表 - 数据湖探索 DLI

用于对Kafka消息中key部分序列化和反序列化的格式。key字段由PRIMARY KEY语法指定。支持的格式如下： csv json avro 请参考Format页面以获取更多详细信息和格式参数。 key.fields-prefix 否 (none) String 为键格式的所有字段定义自定义前缀，以避免与值格式的字段发生名称冲突。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
创建批处理作业 - 数据湖探索 DLI

参数说明表1 URI参数参数名称是否必选参数类型说明 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。请求消息表2 请求参数参数名称是否必选参数类型说明 file 是 String 用户已上传到DLI资源管理系统

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API

总条数： 403

上一页
1
...
4
5
6
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

查询分组资源列表（废弃） - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

CSS安全集群配置 - 数据湖探索 DLI

上传分组资源（废弃） - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

DLI内置依赖包 - 数据湖探索 DLI

Flink jobmanager日志一直报Timeout expired while fetching topic metadata怎么办？ - 数据湖探索 DLI

数组函数和运算符 - 数据湖探索 DLI

查看赋权对象使用者权限信息 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

dateadd - 数据湖探索 DLI

Lambda 表达式 - 数据湖探索 DLI

date - 数据湖探索 DLI

date - 数据湖探索 DLI

怎样查看DLI SQL日志？ - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线