搜索_华为云

java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

\"age\":\"23\"}")); Dataset<Row> dataFrame = sqlContext.read().json(javaRDD); 设置连接参数 String url = "192.168.4.62:8635,192.168.5.134:8635/test?authSource=admin";

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF Jar”选择创建的程序包，单击“保存”。选定JAR包以后，SQL里添加UDF声明语句，就可以像普通函数一样使用了。 1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
DataGen - 数据湖探索 DLI
DataGen - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
pyspark样例代码 - 数据湖探索 DLI

sparkSession = SparkSession.builder.appName("datasource-mongo").getOrCreate() 设置连接参数 1 2 3 4 5 6 url = "192.168.4.62:8635,192.168.5.134:8635/test?authSource=admin"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

登录DEW管理控制台选择“凭据管理”，进入“凭据管理”页面。单击“创建凭据”。配置凭据基本信息 DLI Spark jar作业编辑界面设置作业参数。 Spark参数： spark.hadoop.fs.obs.bucket.USER_BUCKET_NAME.dew.access

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark作业委托场景开发指导
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

com/artifactory/api/pypi/cbu-pypi-public/simple 内容拷贝到基础镜像中 USER omm 其中，主要包含了以下步骤：设置pip的可用仓库地址。使用pip3安装tensorflow算法包。将安装了算法包的临时镜像builder里的内容复制到基础镜像中（这一

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
pyspark样例代码 - 数据湖探索 DLI

sparkSession = SparkSession.builder.appName("datasource-redis").getOrCreate() 设置连接参数 1 2 3 4 host = "192.168.4.199" port = "6379" table = "person" auth

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
权限策略和授权项 - 数据湖探索 DLI

/v1.0/{project_id}/jobs/submit-job，SQL语句调用 dli:table:showPartitions √ × 设置表配置 POST /v1.0/{project_id}/jobs/submit-job，SQL语句调用 dli:table:alterTableSetProperties

帮助中心 > 数据湖探索 DLI > API参考
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF Jar”选择创建的程序包，单击“保存”。选定JAR包以后，SQL里添加UDF声明语句，就可以像普通函数一样使用了。 1

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 函数
lag - 数据湖探索 DLI
lag - 数据湖探索 DLI

10:10:00 cookie2 2015-04-10 11:00:00 url77 2015-04-10 10:50:01 说明：因为没有设置默认值，当没有上两行时显示为NULL。示例2： SELECT cookieid, createtime, url, LAG(createtime

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 内置函数 > 分析窗口函数
更新SQL作业 - 数据湖探索 DLI
更新SQL作业 - 数据湖探索 DLI

cu_number 否 Integer 用户为作业选择的CU数量。默认值为“2”。 parallel_number 否 Integer 用户设置的作业并行数目。默认值为“1”。 checkpoint_enabled 否 Boolean 是否开启作业自动快照功能。开启：true 关闭：false

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
lag - 数据湖探索 DLI
lag - 数据湖探索 DLI

10:10:00 cookie2 2015-04-10 11:00:00 url77 2015-04-10 10:50:01 说明：因为没有设置默认值，当没有上两行时显示为NULL。示例2： SELECT cookieid, createtime, url, LAG(createtime

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

登录DLI管理控制台，在左侧导航栏单击“跨源管理”，在跨源管理界面，单击“增强型跨源”，单击“创建”。在增强型跨源创建界面，配置具体的跨源连接参数。具体参考如下。连接名称：设置具体的增强型跨源名称。本示例输入为：dli_kafka。弹性资源池：选择步骤1：创建队列中已经创建的队列。虚拟私有云：选择Kafka的虚拟私有云。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink OpenSource SQL作业开发指南
导入数据（废弃） - 数据湖探索 DLI

入CSV及JSON类型数据时可指定。 bad_records_path 否 String 作业执行过程中的bad records存储目录。设置该配置项后，bad records不会导入到目标表。 timestamp_format 否 String 指定特定的时间格式，默认为“yyyy-MM-dd

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

建议为streaming-source.monitor-interval（最新分区作为临时表）或 lookup.join.cache.ttl（所有分区作为临时表）设置一个相对较大的值。否则，作业容易出现性能问题，避免表更新和重新加载过于频繁。缓存刷新需加载整个Hive表。无法区分新数据和旧数据。参数说明

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

temporal之间的时间间隔。允许temporal在timepoint之前，如(DATE '1997-04-25', DATE '1997-04-23')也合法。当temporal是INTERVAL时，(timepoint, temporal)表示timepoint, timepoint+temporal之间的时间间隔。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
使用DLI进行账单分析与优化 - 数据湖探索 DLI

> 数据湖探索DLI”。在消费汇总中可以发现DLI计算资源使用量消费最多。图2 费用汇总单击“账单详情 > 自定义账单”，单击“维度设置”，选择“按使用量”。“统计周期”选择“明细”。在显示数据的标题行，“产品类型”选择“数据湖探索 DLI”，“产品”选择“DLI计算资源使用量”，单击“导出账单”。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

sparkSession.sql("select * from test_dds").show() 操作结果通过DataFrame API访问设置连接参数 val url = "192.168.4.62:8635,192.168.5.134:8635/test?authSource=admin"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

keytab','principal'='krbtest') "); 与未开启kerberos认证相比，开启了kerberos认证需要多设置三个参数，如表1所示。表1 参数说明参数名称与参数值参数说明 'krb5conf' = './krb5.conf' krb5.conf的地址。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
从Kafka读取数据写入到RDS - 数据湖探索 DLI

登录DLI管理控制台，在左侧导航栏单击“跨源管理”，在跨源管理界面，单击“增强型跨源”，单击“创建”。在增强型跨源创建界面，配置具体的跨源连接参数。具体参考如下。连接名称：设置具体的增强型跨源名称。本示例输入为：dli_kafka。弹性资源池：选择步骤1：创建队列中已经创建的队列名称。（未添加至资源池的队列，请直接选择队列名称。）

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink OpenSource SQL作业开发指南

总条数： 507

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

java样例代码 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

DataGen - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

权限策略和授权项 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

lag - 数据湖探索 DLI

更新SQL作业 - 数据湖探索 DLI

lag - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

使用DLI进行账单分析与优化 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线