搜索_华为云

java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

\"age\":\"23\"}")); Dataset<Row> dataFrame = sqlContext.read().json(javaRDD); 设置连接参数 String url = "192.168.4.62:8635,192.168.5.134:8635/test?authSource=admin";

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
Confluent Avro Format - 数据湖探索 DLI

nt avro的形式写入作为sink的topic中根据kafka和ecs所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka和ecs的地址测试队列连通性（通用队列-->找到作业的所属队列-->更多-

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF Jar”选择创建的程序包，单击“保存”。选定JAR包以后，SQL里添加UDF声明语句，就可以像普通函数一样使用了。 1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF Jar”选择创建的程序包，单击“保存”。选定JAR包以后，SQL里添加UDF声明语句，就可以像普通函数一样使用了。 1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
pyspark样例代码 - 数据湖探索 DLI

sparkSession = SparkSession.builder.appName("datasource-mongo").getOrCreate() 设置连接参数 1 2 3 4 5 6 url = "192.168.4.62:8635,192.168.5.134:8635/test?authSource=admin"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF Jar”选择创建的程序包，单击“保存”。选定JAR包以后，SQL里添加UDF声明语句，就可以像普通函数一样使用了。 1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
DataGen - 数据湖探索 DLI
DataGen - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
更新SQL作业 - 数据湖探索 DLI
更新SQL作业 - 数据湖探索 DLI

cu_number 否 Integer 用户为作业选择的CU数量。默认值为“2”。 parallel_number 否 Integer 用户设置的作业并行数目。默认值为“1”。 checkpoint_enabled 否 Boolean 是否开启作业自动快照功能。开启：true 关闭：false

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
lag - 数据湖探索 DLI
lag - 数据湖探索 DLI

10:10:00 cookie2 2015-04-10 11:00:00 url77 2015-04-10 10:50:01 说明：因为没有设置默认值，当没有上两行时显示为NULL。示例2： SELECT cookieid, createtime, url, LAG(createtime

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

登录DLI管理控制台，在左侧导航栏单击“跨源管理”，在跨源管理界面，单击“增强型跨源”，单击“创建”。在增强型跨源创建界面，配置具体的跨源连接参数。具体参考如下。连接名称：设置具体的增强型跨源名称。本示例输入为：dli_kafka。弹性资源池：选择步骤1：创建队列中已经创建的队列。虚拟私有云：选择Kafka的虚拟私有云。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
pyspark样例代码 - 数据湖探索 DLI

sparkSession = SparkSession.builder.appName("datasource-redis").getOrCreate() 设置连接参数 1 2 3 4 host = "192.168.4.199" port = "6379" table = "person" auth

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

com/artifactory/api/pypi/cbu-pypi-public/simple 内容复制到基础镜像中 USER omm 其中，主要包含了以下步骤：设置pip的可用仓库地址。使用pip3安装tensorflow算法包。将安装了算法包的临时镜像builder里的内容复制到基础镜像中（这一

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
权限策略和授权项 - 数据湖探索 DLI

/v1.0/{project_id}/jobs/submit-job，SQL语句调用 dli:table:showPartitions √ × 设置表配置 POST /v1.0/{project_id}/jobs/submit-job，SQL语句调用 dli:table:alterTableSetProperties

帮助中心 > 数据湖探索 DLI > API参考
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

percentage)→array<[same as x]> 描述：按照百分比percentage，返回所有x输入值的近似百分位数。每一项的权重值为w且必须为正数。x设置有效的百分位。percentage的值必须在0到1之间，并且所有输入行必须为常量。 select approx_percentile(x,

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
导入数据（废弃） - 数据湖探索 DLI

入CSV及JSON类型数据时可指定。 bad_records_path 否 String 作业执行过程中的bad records存储目录。设置该配置项后，bad records不会导入到目标表。 timestamp_format 否 String 指定特定的时间格式，默认为“yyyy-MM-dd

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
使用DLI分析账单消费数据 - 数据湖探索 DLI

> 数据湖探索DLI”。在消费汇总中可以发现DLI计算资源使用量消费最多。图2 费用汇总单击“账单详情 > 自定义账单”，单击“维度设置”，选择“按使用量”。“统计周期”选择“明细”。在显示数据的标题行，“产品类型”选择“数据湖探索 DLI”，“产品”选择“DLI计算资源使用量”，单击“导出账单”。

帮助中心 > 数据湖探索 DLI > 最佳实践
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

keytab','principal'='krbtest') "); 与未开启kerberos认证相比，开启了kerberos认证需要多设置三个参数，如表1所示。表1 参数说明参数名称与参数值参数说明 'krb5conf' = './krb5.conf' krb5.conf的地址。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
使用DLI分析电商BI报表 - 数据湖探索 DLI

USING csv OPTIONS (path "obs://DLI-demo/data/JData_Action"); 执行查询常用查询语句可以设置为模板，下次查询的时候在模板管理页面可以查看，具体操作可参见《数据湖探索用户指南》中的《模板管理》。分析出10大用户点赞数最多的产品执

 帮助中心 > 数据湖探索 DLI > 最佳实践
典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

登录DLI管理控制台，在左侧导航栏单击“跨源管理”，在跨源管理界面，单击“增强型跨源”，单击“创建”。在增强型跨源创建界面，配置具体的跨源连接参数。具体参考如下。连接名称：设置具体的增强型跨源名称。弹性资源池：选择DLI的队列。（未添加至资源池的队列，请直接选择队列名称。）虚拟私有云：选择步骤1：获取外部数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
创建增强型跨源连接 - 数据湖探索 DLI

增强型跨源连接需要使用VPC、子网、路由、对等连接功能，因此需要获得VPC（虚拟私有云）的VPC Administrator权限。可在服务授权中进行设置。使用DLI增强型跨源时，弹性资源池/队列的网段与数据源网段不能重合。访问跨源表需要使用已经创建跨源连接的队列。跨源表不支持Preview预览功能。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）

总条数： 425

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

java样例代码 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

DataGen - 数据湖探索 DLI

更新SQL作业 - 数据湖探索 DLI

lag - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

权限策略和授权项 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线