搜索_华为云

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

所属队列：选择步骤1：创建队列中创建的队列。 Flink版本：选择1.12。保存作业日志：勾选。 OBS桶：选择保存作业日志的OBS桶，根据提示进行OBS桶权限授权。开启Checkpoint：勾选。 Flink作业编辑框中输入具体的作业SQL，本示例作业参考如下。SQL中加粗的参数需要根据实际情况修改。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

登录DLI管理控制台，选择“ 数据管理 > 程序包管理”页面，选择对应的UDTF Jar包，单击“操作”列中的“权限管理”，进入权限管理页面，单击右上角“授权”，勾选对应权限。自定义函数中引用static类或接口时，必须要加上“try catch”异常捕获，否则可能会造成包冲突，导致函数功能异常。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

航栏单击“全局配置 > 服务授权”。在委托设置页面，勾选基础使用、跨源场景、运维场景的委托权限后，单击“更新委托权限”。查看并了解更新委托的提示信息，单击“确定”。完成DLI委托权限的更新。图1 配置DLI委托访问授权完成配置后，在IAM控制台的委托列表中，可查看到dli

帮助中心 > 数据湖探索 DLI > 快速入门
Java SDK概述 - 数据湖探索 DLI
Java SDK概述 - 数据湖探索 DLI

Key)或Token两种认证方式初始化客户端，具体操作请参考初始化DLI客户端 Java SDK列表表1 Java SDK列表类型说明 OBS授权介绍将OBS桶的操作权限授权给DLI的Java SDK使用说明。队列相关介绍创建队列、获取默认队列、查询所有队列、删除队列的Java SDK使用说明。资源相关

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
Flink作业性能调优 - 数据湖探索 DLI

并行算子都不存在反压（绿色）该场景说明性能瓶颈在Vertex2或者Vertex3，为了进一步确定具体瓶颈点算子，可以在FlinkUI页面开启inPoolUsage监控。如果某个算子并发对应的inPoolUsage长时间为100%，则该算子大概率为性能瓶颈点，需分析该算子以进行下一步优化。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
ADD COLUMNS - 数据湖探索 DLI
ADD COLUMNS - 数据湖探索 DLI

ADD COLUMNS 功能开启配置参数： hoodie.schema.evolution.enable=true 命令功能 ADD COLUMNS命令用于为现有表添加新列。命令语法 ALTER TABLE tableName ADD COLUMNS(col_spec[, col_spec

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Schema演进语法说明
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

检查该Hudi表Compaction是否正常。因为当长时间不做Compaction时list性能会变差。流读Hudi MOR表时，建议开启log index特性提升Flink流读性能 Hudi的Mor表可以通过log index提升读写性能， Sink和Source表添加属性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

queueName DLI队列名称。 spark.dli.user.access.key 对应用户的访问密钥。该用户需要有Spark作业相关权限，权限说明详见权限管理。密钥获取方式请参考获取AK/SK。 spark.dli.user.secret.key spark.dli.user.projectId

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

Connector。详细操作请参考Flink OpenSource SQL1.15语法概览。 Flink 1.15需要配置租户面自定义委托，并在作业中配置委托信息。委托的权限需要根据作业具体的业务场景需求进行配置。详情操作请参考DLI自定义委托。 Flink 1.15作业管理凭据的方法： Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
Flink 1.15版本说明 - 数据湖探索 DLI

Jar作业最小化提交，通过在运行优化参数中配置flink.dli.job.jar.minimize-submission.enabled=true可以开启最小化提交。 Flink相关依赖作用域请使用provided，即在依赖中添加<scope>provided</scope>。主要包含org

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Upsert Kafka结果表 - 数据湖探索 DLI

Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。注意事项对接的Kafka集群不支持开启SASL_SSL。语法格式 1 2 3 4 5 6 7 8 9 10 11 12 create table kafkaSource(

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。注意事项对接的Kafka集群不支持开启SASL_SSL。语法格式 1 2 3 4 5 6 7 8 9 10 11 12 create table kafkaSource(

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
查询作业模板列表 - 数据湖探索 DLI

obs_bucket String 保存Spark作业的obs桶，需要保存作业时配置该参数。 auto_recovery Boolean 是否开启重试功能，如果开启，可在Spark作业异常失败后自动重试。默认值为“false”。 max_retry_times Integer 最大重试次数。最大值为“100”，默认值为“20”。

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
查询作业列表 - 数据湖探索 DLI

job_config参数说明参数名称是否必选参数类型说明 checkpoint_enabled 否 Boolean 是否开启作业自动快照功能。 true：开启 false：关闭默认为“false”。 checkpoint_mode 否 String 快照模式,。两种可选： ex

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

CPU核数）} x1 driver所占CUs数=max [（ driver内存÷4）， driver CPU核数] x1 Spark作业未开启高级配置时默认按A类型资源规格配置。 Spark作业中显示计算资源规格的单位为CPU单位，1CU包含1CPU和4GB内存。上述公式中x1代表CPU单位转换为CU单位。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
Orc Format - 数据湖探索 DLI
Orc Format - 数据湖探索 DLI

输入kafka的地址 > 测试）。如果能连通，则表示跨源已经绑定成功；否则表示未成功。创建flink opensource sql作业，开启checkpoint，并提交运行，其代码如下： CREATE TABLE kafkaSource ( order_id string,

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
实时任务接入 - 数据湖探索 DLI

streaming.enabled' = 'true', //开启流读 'read.streaming.check-interval' = '60',

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
查询作业详情 - 数据湖探索 DLI

job_config参数说明参数名称是否必选参数类型说明 checkpoint_enabled 否 Boolean 是否开启作业自动快照功能。 true：开启 false：关闭默认为“false”。 checkpoint_interval 否 Integer 快照时间间隔。单位为秒，默认值为“10”。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

DLI侧创建的Kerberos类型的跨源认证名称。使用跨源认证则无需在作业中置账号密码。数据类型映射 HBase以字节数组存储所有数据。在读和写过程中要序列化和反序列化数据。 Flink 的 HBase 连接器利用 HBase（Hadoop) 的工具类org.apache.hadoop.hbase

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

为DWS集群上创建数据库和表中创建的数据库“testdwsdb”。用户名待连接数据库的用户。该数据库用户需要有数据表的读写权限，以及对元数据的读取权限。本示例使用创建DWS数据库实例的默认管理员用户“dbadmin”。密码对应的DWS数据库用户的密码。图2 CDM配置DWS数据源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI

总条数： 403

上一页
1
...
15
16
17
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

Java SDK概述 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

ADD COLUMNS - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

Flink 1.15版本说明 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

查询作业模板列表 - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

Orc Format - 数据湖探索 DLI

实时任务接入 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线