搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

创建CSS跨源表的参数详情可参考表1。插入数据 1 sparkSession.sql("insert into css_table values(3,'tom')") 查询数据 1 2 jdbcDF = sparkSession.sql("select * from css_table") jdbcDF.show()

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
pyspark样例代码 - 数据湖探索 DLI

插入数据 1 sparkSession.sql("insert into dli_to_dws values(2,'John',24)") 查询数据 1 jdbcDF = sparkSession.sql("select * from dli_to_dws").show() 操作结果

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

进入Spark作业编辑页面，页面会提示系统将创建DLI临时数据桶。该桶用于存储使用DLI服务产生的临时数据，例如：作业日志、作业结果等。如果不创建该桶，将无法查看作业日志。可以通过配置生命周期规则实现定时删除OBS桶中的对象或者定时转换对象的存储类别。桶名称为系统默认。如果不需要创建DLI临时数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
创建弹性资源池并添加队列 - 数据湖探索 DLI

管理弹性资源池弹性资源池不支持切换区域。 Flink 1.10及其以上版本的作业支持在弹性资源池运行。弹性资源池网段设置后不支持更改。仅支持查看30天以内的弹性资源池扩缩容历史。弹性资源池无法直接访问公网。弹性资源池关联队列弹性资源池关联队列：仅支持关联按需计费模式的队列（包括专属队列）。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

条记录进行取值。但在批处理模式下，它在查询开始时计算一次，并对每一行使用相同的结果。 LOCALTIME TIME 返回本地时区的当前 SQL 时间，返回类型为 TIME(0)。在流模式下为每条记录进行取值。但在批处理模式下，它在查询开始时计算一次，并对每一行使用相同的结果。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Confluent Avro Format - 数据湖探索 DLI

使用下述命令在当前ecs集群中安装jdk1.8.0_232(其中<yourJdkPath>可以在jdk1.8.0_232文件夹下使用"pwd"查看)： export JAVA_HOME=<yourJdkPath> export PATH=$JAVA_HOME/bin:$PATH export

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

访问DDS集群密码。插入数据 sparkSession.sql("insert into test_dds values('3', 'Ann',23)") 查询数据 sparkSession.sql("select * from test_dds").show() 操作结果通过DataFrame

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
生成Flink SQL作业的静态流图 - 数据湖探索 DLI

\"[PROCESS, UDF]\",\n \"input_operators_id\" : [ ]\n } ]\n}" } 为了便于查看返回体信息，我们将stream_graph格式化后如下所示： "jid": "65b6a7b0c1ad95b1722a92b49d2f6eba"

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
DLI自定义策略 - 数据湖探索 DLI

"dli:*:*:database:*" ] } ] } 授权用户拥有在所在区域中数据库db中表tb中列col的查询权限。 { "Version": "1.1", "Statement": [ { "Effect":

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

分钟内没有观测到新纪录，这个窗口将会被关闭。会话时间窗口可以使用事件时间（批处理、流处理）或处理时间（流处理）。在流处理表中的 SQL 查询中，分组窗口函数的 time_attr 参数必须引用一个合法的时间属性，且该属性需要指定行的处理时间或事件时间。 time_attr设置为

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

WINDOW 语法说明 Group Window定义在GROUP BY里，每个分组只输出一条记录，包括以下几种：分组函数在流处理表中的 SQL 查询中，分组窗口函数的 time_attr 参数必须引用一个合法的时间属性，且该属性需要指定行的处理时间或事件时间。 time_attr设置为

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
Flink作业常用操作 - 数据湖探索 DLI

单击“启动”后，跳转至“作业配置清单”页面。在“作业配置清单”页面，确认作业信息及价格，如果无误，单击“立即启动”。作业启动后，可在对应作业的“状态”列中查看运行成功或失败。停止作业当用户不需要运行某个作业时，用户可以将状态为“运行中”和“提交中”的作业停止。在DLI管理控制台的左侧导航栏

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
创建批处理作业 - 数据湖探索 DLI

例如：obs://桶名/包名。 modules 否 Array of Strings 依赖的系统资源模块名，具体模块名可通过查询组内资源包（废弃）接口查看。 DLI系统提供了用于执行跨源作业的依赖模块，各个不同的服务对应的模块列表如下： CloudTable/MRS HBase:

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

如果队列名称已存在，单击“提交”时，系统会提示“Queue xxx already exists”错误，可返回“上一步”进行修改。队列创建成功后，您可以在“队列管理”页面查看和选择使用对应的队列。新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。父主题：创建弹性资源池和队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

sparkSession.sql("insert into css_table values(13, 'John'),(22, 'Bob')") 查询数据。 1 2 val dataFrame = sparkSession.sql("select * from css_table") dataFrame

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
使用Hive语法创建DLI表 - 数据湖探索 DLI

compression = 'zstd')来指定表压缩格式为zstd。 select_statement 否用于CTAS命令，将源表的select查询结果或某条数据插入到新创建的DLI表中。示例1：创建DLI非分区表示例说明：创建名为table1的DLI非分区表，并用STORED A

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
pyspark样例代码 - 数据湖探索 DLI

'12333' or id='11111'").show() id、location、city：限定了长度，插入数据时须按长度给定数据值，否则查询时会发生编码格式错误。操作结果；提交Spark作业将写好的python代码文件上传至OBS桶中。如果MRS集群开启了Kerbero

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

grade.science[1]'), JSON_VAL(message,'$.grade.dddd') from kafkaSource; 查看taskmanager的out文件的输出结果 +I[null, James, [80,85], [80,85], 85, null] 父主题：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

grade.science[1]"),JSON_VAL(message,"$.grade.dddd") from kafkaSource; 查看sink中kafka的topic中的输出结果 {"message1":null,"message2":"swq","message3":"[80

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

grade.science[1]"), JSON_VAL(message,"$.grade.dddd") FROM kafkaSource; 查看输出结果 {"message1":null,"message2":"swq","message3":"[80,85]","message4":"[80

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数

总条数： 705

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

生成Flink SQL作业的静态流图 - 数据湖探索 DLI

DLI自定义策略 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线