搜索_华为云

scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

1 jdbcDF.select("id","name").where("id<4").show() selectExpr 对字段进行特殊处理。例如，可使用selectExpr修改字段名。示例如下：将name字段取名name_test，age数据加1。 1 jdbcDF.selectExpr("id"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
JSON Format - 数据湖探索 DLI
JSON Format - 数据湖探索 DLI

"2020-12-30T12:13:14.123Z" 且会以相同的格式输出。 json.map-null-key.mode 否 'FALL' String 指定处理 Map 中 key 值为空的方法。当前支持的值有：'FAIL'，'DROP'和'LITERAL'。 Option 'FAIL' 将抛出异常，如果遇到

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
更新Flink Jar作业 - 数据湖探索 DLI

当用户设置“feature”为“custom”时，该参数生效。用户可通过与“feature”参数配合使用，指定作业运行使用自定义的Flink镜像。关于如何使用自定义镜像，请参考《数据湖探索用户指南》。 resume_checkpoint 否 Boolean 异常重启是否从checkpoint恢复。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
创建DLI表关联HBase - 数据湖探索 DLI

接。管理控制台操作请参考增强型跨源连接。请确保在DLI队列host文件中添加MRS集群master节点的“/etc/hosts”信息。如何添加IP域名映射，请参见《数据湖探索用户指南》中增强型跨源连接章节。该语法不支持安全集群。语法格式单个RowKey 1 2 3 4 5

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
创建队列 - 数据湖探索 DLI
创建队列 - 数据湖探索 DLI

CU时收费。 enterprise_project_id 否 String 企业项目ID，“0”表示default，即默认的企业项目。关于如何设置企业项目请参考《企业管理用户指南》。说明：开通了企业管理服务的用户可设置该参数绑定指定的项目。 platform 否 String

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
lag - 数据湖探索 DLI
lag - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明参数的数据类型。示例代码示例数据为便于理解函数的使用方法，本文为您提供源数据，基于源数据提供函数相关示例。创建表logs，并添加数据，命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

streaming-source.monitor-interval 配置数据更新间隔。示例该示例展示了一个经典的业务流水线，维度表来自 Hive，每天通过批处理流水线作业或 Flink 作业更新一次，kafka流来自实时在线业务数据或日志，需要与维度表连接以扩充流。使用spark sql 创建 hive

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
查询所有队列 - 数据湖探索 DLI

队列的资源ID。 enterprise_project_id 否 String 企业项目ID。0”表示default，即默认的企业项目。关于如何设置企业项目请参考《企业管理用户指南》。说明：开通了企业管理服务的用户可设置该参数绑定指定的项目。 cidr_in_vpc 否 String

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
查询作业模板列表 - 数据湖探索 DLI

表5。 conf Object batch配置项，参考Spark Configuration。 name String 创建时用户指定的批处理名称，不能超过128个字符。 driverMemory String Spark应用的Driver内存，参数配置例如2G, 2048M。该

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

spark.dli.job.agency.name 是 - String 自定义委托名称。样例代码本章节JAVA样例代码演示将DataGen数据处理后写入到OBS，具体参数配置请根据实际环境修改。创建DLI访问DEW的委托并完成委托授权。详细步骤请参考自定义DLI委托权限。在DE

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
新建Flink Jar作业 - 数据湖探索 DLI

当用户设置“feature”为“custom”时，该参数生效。用户可通过与“feature”参数配合使用，指定作业运行使用自定义的Flink镜像。关于如何使用自定义镜像，请参考《数据湖探索用户指南》。 resume_checkpoint 否 Boolean 异常重启是否从checkpoint恢复。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

HH:mm:ss。时间戳格式由Java的时间模式字符串指定。Java时间模式字符串定义详见表3 日期及时间模式字符定义。 MODE：指定导入过程错误记录的处理模式，支持三种选项：PERMISSIVE、DROPMALFORMED和FAILFAST。 OPTIONS('MODE'='permissive')

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
窗口聚合 - 数据湖探索 DLI
窗口聚合 - 数据湖探索 DLI

Flink 支持在 TUMBLE， HOP 和 CUMULATE 上进行窗口聚合。在流模式下，窗口表值函数的时间属性字段必须是事件时间或处理时间。关于窗口函数更多信息，参见窗口表值函数（Windowing TVFs）。在批模式下，窗口表值函数的时间属性字段必须是 TIMESTAMP

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
权限管理 - 数据湖探索 DLI
权限管理 - 数据湖探索 DLI

系统策略的扩展和补充。详细操作请参考创建自定义策略。相关链接《IAM产品介绍》《创建用户组、用户并授予DLI权限》《策略语法》《如何修改用户策略》《队列赋权》（API赋权）《数据赋权》（API赋权）《设置队列权限》（Console赋权）《数据库权限管理》（Console赋权）

帮助中心 > 数据湖探索 DLI > 产品介绍
Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

flink.dli.job.agency.name 是 - String 自定义委托名称。样例代码本章节JAVA样例代码演示将DataGen数据处理后写入到OBS，具体参数配置请根据实际环境修改。创建DLI访问DEW的委托并完成委托授权。详细步骤请参考自定义DLI委托权限。在DEW

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

请参考创建OBS表。如果是通过API接口调用提交该作业请参考以下操作说明：调用创建批处理作业接口，参考以下请求参数说明。详细的API参数说明请参考《数据湖探索API参考》>《创建批处理作业》。将请求参数中的“catalog_name”参数设置为“dli”。 conf 中需要增加"spark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

考Spark Configuration。表2 spark-defaults.conf可选参数说明 Spark作业参数对应Spark批处理参数备注 spark.dli.user.file file 如果是对接notebook工具场景时不需要设置。 spark.dli.user

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

如果所建队列属于企业项目，可选择对应的企业项目。企业项目是一种云资源管理方式，企业项目管理服务提供统一的云资源按项目管理，以及项目内的资源管理、成员管理。关于如何设置企业项目请参考《企业管理用户指南》。说明：只有开通了企业管理服务的用户才显示该参数。描述所创建队列的相应描述。输入长度不能超过128个字符。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列

总条数： 433

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

scala样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

JSON Format - 数据湖探索 DLI

更新Flink Jar作业 - 数据湖探索 DLI

创建DLI表关联HBase - 数据湖探索 DLI

创建队列 - 数据湖探索 DLI

lag - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

查询作业模板列表 - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

窗口聚合 - 数据湖探索 DLI

权限管理 - 数据湖探索 DLI

Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线