搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

FROM person".stripMargin).collect().foreach(println) 提交Spark作业将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spa

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
pyspark样例代码 - 数据湖探索 DLI

1 sparkSession.sql("select * from test_dds").show() 提交Spark作业将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spa

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
窗口关联 - 数据湖探索 DLI
窗口关联 - 数据湖探索 DLI

window_end 等值条件。窗口关联支持 INNER/LEFT/RIGHT/FULL OUTER/ANTI/SEMI JOIN。更多介绍和使用请参考开源社区文档：窗口关联。注意事项窗口关联需要在 join on 条件中包含两个输入表的 window_start 等值条件和 window_end

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
窗口聚合 - 数据湖探索 DLI
窗口聚合 - 数据湖探索 DLI

连续表上的聚合不同，窗口聚合不产生中间结果，只在窗口结束产生一个总的聚合结果，另外，窗口聚合会清除不需要的中间状态。更多介绍和使用请参考开源社区文档：窗口聚合。分组窗口的开始和结束时间戳可以通过 window_start 和 window_end 来选定。窗口表值函数 Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
pyspark样例代码 - 数据湖探索 DLI

sql("select * from dli_to_rds") jdbcDF_after.show() 操作结果提交Spark作业将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spa

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
pyspark样例代码 - 数据湖探索 DLI

sparkSession.sql("select * from dli_to_dws").show() 操作结果提交Spark作业将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spar

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
pyspark样例代码 - 数据湖探索 DLI

sparkSession.sql("select * from css_table") jdbcDF.show() 操作结果提交Spark作业将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spa

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
DLI作业开发流程 - 数据湖探索 DLI

置到自定义镜像中，可以改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式帮助用户实现功能扩展。创建自定义镜像请参考使用自定义镜像增强作业运行环境。 DLI元数据是SQL作业、Sp

帮助中心 > 数据湖探索 DLI > 用户指南
使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

创建Flink Jar对应的程序包主要参数说明参数名称说明示例包类型支持的包类型如下： JAR：用户jar文件 PyFile：用户Python文件 File：用户文件 ModelFile：用户AI模型文件 JAR OBS路径选择对应程序包的OBS路径。说明：程序包需提前上传至OBS服务中保存。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink Jar作业开发指南
使用Hive语法创建DLI表 - 数据湖探索 DLI

short, int, bigint, long, decimal, float, double, date, timestamp等hive开源支持的类型。支持指定多个分区字段，分区字段只需在PARTITIONED BY关键字后指定，不能像普通字段一样在表名后指定，否则将出错。单表分区数最多允许200000个。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
创建Flink Jar作业 - 数据湖探索 DLI

Jar作业时，需要将二次开发的应用代码构建为Jar包，上传到已经创建的OBS桶中。由于DLI服务端已经内置了Flink的依赖包，并且基于开源社区版本做了安全加固。为了避免依赖包兼容性问题或日志输出及转储问题，打包时请注意排除以下文件：系统内置的依赖包，或者在Maven或者Sb

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
使用Hive语法创建DLI表 - 数据湖探索 DLI

short, int, bigint, long, decimal, float, double, date, timestamp等hive开源支持的类型。支持指定多个分区字段，分区字段只需在PARTITIONED BY关键字后指定，不能像普通字段一样在表名后指定，否则将出错。单表分区数最多允许200000个。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 创建DLI表
Flink Jar作业开发基础样例 - 数据湖探索 DLI

DLI不支持下载功能，如果需要更新已上传的数据文件，可以将本地文件更新后重新上传。由于DLI服务端已经内置了Flink的依赖包，并且基于开源社区版本做了安全加固。为了避免依赖包兼容性问题或日志输出及转储问题，打包时请注意排除以下文件：系统内置的依赖包，或者在Maven或者S

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink Jar作业开发指南
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

UPDATE_BEFORE 和 UPDATE_AFTER 分别编码为 DELETE 和 INSERT 类型的 Debezium 消息。更多具体使用可参考开源社区文档：Debezium Format。支持的Connector Kafka Filesystem 注意事项重复的变更事件在正常的操作环境下，Debezium

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Elasticsearch结果表 - 数据湖探索 DLI

志分析、站内搜索等场景。云搜索服务（Cloud Search Service，简称CSS）为DLI提供托管的分布式搜索引擎服务，完全兼容开源Elasticsearch搜索引擎，支持结构化、非结构化文本的多条件检索、统计、报表。云搜索服务的更多信息，请参见《云搜索服务用户指南》

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Elasticsearch结果表 - 数据湖探索 DLI

志分析、站内搜索等场景。云搜索服务（Cloud Search Service，简称CSS）为DLI提供托管的分布式搜索引擎服务，完全兼容开源Elasticsearch搜索引擎，支持结构化、非结构化文本的多条件检索、统计、报表。云搜索服务的更多信息，请参见《云搜索服务用户指南》

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

的OBS路径中。程序包程序包支持删除，但不支持删除程序包组。支持上传的程序包类型： JAR：用户jar文件。 PyFile：用户Python文件。 File：用户文件。 ModelFile：用户AI模型文件。更多资源相关约束限制请参考数据管理。增强型跨源连接约束限制在

 帮助中心 > 数据湖探索 DLI > 产品介绍
pyspark样例代码 - 数据湖探索 DLI

id、location、city：限定了长度，插入数据时须按长度给定数据值，否则查询时会发生编码格式错误。操作结果；提交Spark作业将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。如果MR

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
使用Hive语法创建OBS表 - 数据湖探索 DLI

short, int, bigint, long, decimal, float, double, date, timestamp等hive开源支持的类型。支持指定多个分区字段，分区字段只需在PARTITIONED BY关键字后指定，不能像普通字段一样在表名后指定，否则将出错。单表分区数最多允许200000个。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
使用Hive语法创建OBS表 - 数据湖探索 DLI

short, int, bigint, long, decimal, float, double, date, timestamp等hive开源支持的类型。支持指定多个分区字段，分区字段只需在PARTITIONED BY关键字后指定，不能像普通字段一样在表名后指定，否则将出错。单表分区数最多允许200000个。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 创建OBS表

总条数： 143

上一页
1
...
4
5
6
7
8
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

窗口关联 - 数据湖探索 DLI

窗口聚合 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线