搜索_华为云

开启Flink作业动态扩缩容 - 数据湖探索 DLI

在Flink作业进行动态扩缩时后台作业需要停止继而从savepoint恢复，因此未恢复成功前，作业无法处理数据。因扩缩容过程中需要触发savepoint，因此必须配置obs桶，并保存日志，同时请注意开启checkpoint。扩缩容检测周期不要设置过小，避免频繁启停作业。扩缩容作业恢复过程中的时间长短受sa

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

sparkSession.sparkContext(); sc.addFile("obs://xietest1/lzq/krb5.conf"); sc.addFile("obs://xietest1/lzq/user.keytab"); Thread

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
清理多版本数据 - 数据湖探索 DLI

需要为yyyy-MM-dd HH:mm:ss 注意事项 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表SQL语法可以参考使用Hive语法创建OBS表。该命令不会删除当前版本数据。示例删除dliTable表在2021-09-25 23:59:59之前生

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

tore.jks文件传入OBS中。具体方式请参考客户端SSL加密功能使用说明。端口请注意使用KafKa服务配置中设置的ssl.port端口，默认值为9093。 with参数中security.protocol请设置为SSL。 MRS集群kafka服务配置中，设置ssl.mode

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

认即可。所属队列：选择步骤1：创建队列中创建的队列。 Flink版本：选择1.12。保存作业日志：勾选。 OBS桶：选择保存作业日志的OBS桶，根据提示进行OBS桶权限授权。开启Checkpoint：勾选。 Flink作业编辑框中输入具体的作业SQL，本示例作业参考如下。SQL中加粗的参数需要根据实际情况修改。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Upsert Kafka源表 - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。 Upsert Kafka 始终以upsert方式工作，并且需要在DDL中定义主键。在具有相同主键值的消息按序存储在同一个分区的前提下，在

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Checkpoint和Savepoint生成机制及格式一致，因而，也可以通过Flink作业列表“操作”列中的“更多”>“导入保存点”，导入OBS中最新成功的Checkpoint，并从中恢复。图3 停止作业图4 恢复保存点父主题： Flink作业性能调优类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式 create table jbdcSource ( attr_name attr_type

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
查询作业结果-方式一（废弃） - 数据湖探索 DLI

详细请参见导出查询结果。 URI URI格式： GET/v1.0/{project_id}/queues/{queue_name}/jobs/{job_id}?page-size=size&current-page=page_number 参数说明表1 URI 参数名称是否必选

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
T-Digest函数 - 数据湖探索 DLI
T-Digest函数 - 数据湖探索 DLI

T-Digest函数概述 T-digest是存储近似百分位信息的数据草图。HetuEngine中用tdigest表示这种数据结构。T-digest可以合并，在存储时可以强转为VARBINARY，检索时再由VARBINARY转换为T-digest 函数 merge(tdigest)→tdigest

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
使用DLI分析账单消费数据 - 数据湖探索 DLI

左侧导航栏，选择“导出记录”。下载对应的消费明细数据。步骤2：分析账户消费结构并优化在DLI上进行消费明细分析。将1下载的消费明细数据上传到已建好的OBS桶中。在数据湖探索服务中创建表。登录DLI控制台，左侧导航栏单击“SQL编辑器”，执行引擎选择“spark”，选择执行的队列和数据库。本次演示队列和数据库选择“default”。

帮助中心 > 数据湖探索 DLI > 最佳实践
创建跨源成功但测试网络连通性失败怎么办？ - 数据湖探索 DLI

路由ID，因此跨源连接失败。解决措施：请在服务授权添加DLI Datasource Connections Agency Access授权。了解DLI更新委托权限。图4 查看连接日志-2 图5 查看连接日志-3 图6 DLI服务授权检查对端安全组是否放通队列的网段创建完

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
CLUSTER BY - 数据湖探索 DLI
CLUSTER BY - 数据湖探索 DLI

按字段实现表的分桶及桶内排序。语法格式 1 2 SELECT attr_expr_list FROM table_reference CLUSTER BY col_name [,col_name ,...]; 关键字 CLUSTER BY：根据指定的字段进行分桶，支持单字段及多字段，并在桶内进行排序。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 排序
DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

------------------------------------------------------------------------- web obs://bucket/user/hive/warehouse/web.db dli USER (1 row) 父主题：辅助命令语法

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何呢？其实PySpark本身就已经考虑到这一点了，那就是基于PyFiles来指定依赖，在DLI Spark作业页面中可以直接选取存放在OBS上的Python第三方程序库（支持zip、egg等）。图1 Spark作业编辑页面对于依赖的这个Python第三方库的压缩包有一定的结

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
原生数据类型 - 数据湖探索 DLI

原生数据类型 DLI支持原生数据类型，请参见表1。表1 原生数据类型数据类型描述存储空间范围 OBS表支持情况 DLI表支持情况 INT 有符号整数 4字节 -2147483648～2147483647 是是 STRING 字符串 - - 是是 FLOAT 单精度浮点型

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取.out文件查看结果日志。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
在DLI控制台配置数据库权限 - 数据湖探索 DLI

策略》和《统一身份认证服务用户指南》中的创建用户组。注意事项如果需要查看管理员或者其他用户账号下的数据库，需要对当前用户授权（显示权限），具体请参考常用操作与系统权限关系。数据库和表赋权对象具有层级关系，用户赋予上一层级的权限会自动继承到下一层级对象上，层级关系为：数据库>表>列。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
从Kafka读取数据写入到RDS - 数据湖探索 DLI

认即可。所属队列：选择步骤1：创建队列中创建的队列。 Flink版本：选择1.12。保存作业日志：勾选。 OBS桶：选择保存作业日志的OBS桶，根据提示进行OBS桶权限授权。开启Checkpoint：勾选。 Flink作业编辑框中输入具体的作业SQL，本示例作业参考如下。SQL中加粗的参数需要根据实际情况修改。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发

总条数： 708

上一页
1
...
19
20
21
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开启Flink作业动态扩缩容 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

清理多版本数据 - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

Upsert Kafka源表 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

查询作业结果-方式一（废弃） - 数据湖探索 DLI

T-Digest函数 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

创建跨源成功但测试网络连通性失败怎么办？ - 数据湖探索 DLI

CLUSTER BY - 数据湖探索 DLI

DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

原生数据类型 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

在DLI控制台配置数据库权限 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线