搜索_华为云

Flink作业概述 - 数据湖探索 DLI
Flink作业概述 - 数据湖探索 DLI

DLI允许用户提交编译为Jar包的Flink作业，提供了更高的灵活性和自定义能力，适合需要进行复杂数据处理的场景。当社区版Flink提供的Connector不能满足特定需求时，用户可以通过Jar作业来实现自定义的Connector或数据处理逻辑。适合需要实现UDF（用户定义函数）或特定库集成的场景，用户可以

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
修改普通队列的网段 - 数据湖探索 DLI

在DLI管理控制台左侧，选择“资源管理 > 队列管理”。选择待修改的队列，单击“操作”列“更多”中的“修改网段”。图1 修改网段填写需要的网段后，单击“确定”。队列修改网段成功后，需要等待5~10分钟，待队列所属集群资源重新拉起后再运行作业。建议使用网段： 10.0.0.0~10.255.0.0/8~24

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
增强型跨源连接标签管理 - 数据湖探索 DLI

图1 添加标签表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。如果添加预定义标签，用户需要预先在标签管理服务中创建好预定义标签，然后在“标签键”的下拉框中进行选择。用户可以通过单击“查看预定义标签”进入标签管理服务的“预定义标签

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
弹性资源池标签管理 - 数据湖探索 DLI

添加/编辑标签表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。如果添加预定义标签，用户需要预先在标签管理服务中创建好预定义标签，然后在“标签键”的下拉框中进行选择。用户可以通过单击“查看预定义标签”进入标签管理服务的“预定义标签

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

读取数据库中的数据所在的表名 connector.driver 否连接数据库所需要的驱动。若未配置，则会自动通过URL提取 connector.username 否访问数据库所需要的账号 connector.password 否访问数据库所需要的密码 connector.write.flush.max-rows

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。若未在创建Redis结果表的语句中定义Redis key的字段，则会使用生成的uuid作为key。若需要指定Redis中的key，则需要在flink的Redis

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
生成Flink SQL作业的静态流图 - 数据湖探索 DLI

parallel_number 否 Integer 最大并行度。并行数为作业每个算子的并行数，适度增加并行数会提高作业整体算力，但也须考虑线程增多带来的切换开销，上限是计算单元CU数的4倍，最佳实践为计算单元CU数的1-2倍。 tm_cus 否 Integer 单个taskManagerCU数量。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
DWS维表（不推荐使用） - 数据湖探索 DLI

gauss200.jdbc.Driver。 username 否无 String 数据库认证用户名，需要和'password'一起配置。 password 否无 String 数据库认证密码，需要和'username'一起配置。 scan.partition.column 否无 String

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

提交成功，可以在Spark作业管理页面查看提交的作业的状态和日志。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.rds。如果选择Spark版本为3.1.1及以上版本时，无需选择Module模块，

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
SQL作业运行慢如何定位 - 数据湖探索 DLI

在OBS目录下，获取归档日志文件夹，详细如下。 Spark SQL作业：查看带有“driver”或者为“container_xxx_000001”的日志文件夹则为需要查看的Driver日志目录。图2 带有driver的归档日志文件夹名示例图3 container_xxx_000001归档日志文件夹示例

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
插入数据至RDS表 - 数据湖探索 DLI

已创建跨源连接的DLI表名称。 DLI_TEST 为包含待查询数据的表。 field1,field2...，field 表“DLI_TEST”中的列值，需要匹配表“DLI_TABLE”的列值和类型。 where_condition 查询过滤条件。 num 对查询结果进行限制，num参数仅支持INT类型。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

DLI SDK简介 DLI SDK简介数据湖探索服务软件开发工具包（DLI SDK，Data Lake Insight Software Development Kit）是对DLI服务提供的REST API进行的作业提交的封装，以简化用户的开发工作。用户直接调用DLI SDK提供的接口函数即可实现使用提交DLI

帮助中心 > 数据湖探索 DLI > SDK参考
插入数据至DWS表 - 数据湖探索 DLI

已创建跨源连接的DLI表名称。 DLI_TEST 为包含待查询数据的表。 field1,field2...，field 表“DLI_TEST”中的列值，需要匹配表“DLI_TABLE”的列值和类型。 where_condition 查询过滤条件。 num 对查询结果进行限制，num参数仅支持INT类型。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DWS表
pyspark样例代码 - 数据湖探索 DLI

keytab',\ 'principal' ='krbtest')") 与未开启kerberos认证相比，开启了kerberos认证需要多设置三个参数，如表1所示。表1 参数说明参数名称与参数值参数说明 'krb5conf' = './krb5.conf' krb5.conf的地址。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
URL函数 - 数据湖探索 DLI
URL函数 - 数据湖探索 DLI

查询参数名和值中：字母字符不会被编码。字符 ., -, * 和 _不会被编码。 ASCII 空格字符会被编码为+ 。所有其他字符都将转换为UTF-8，并且字节被编码为字符串％XX，其中XX是UTF-8字节的大写十六进制值。 select url_encode('http://www

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
迁移数据场景概述 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI 数据迁移数据类型映射将其他云服务或业务平台数据迁移到DLI ，或者将DLI数据迁移到其他云服务或业务平台时，涉及到源和目的端数据类型的转换和映射，根据表2可以获取到源和目的端的数据类型映射关系。表2 数据类型映射表 MySQL Hive DWS Oracle PostgreSQL

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

在SQL编辑器中输入以下语句创建数据库“testdb”。详细的DLI创建数据库的语法可以参考创建DLI数据库。 create database testdb; 后续章节操作都需要在testdb数据库下进行操作。 DataSource和Hive两种语法创建OBS表的区别 DataSource语法和Hive语法主要区别

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

解决方案在DLI创建Flink结果表到OBS的作业时，如上述举例中的car_infos_sink表，是否开启了Checkpoint。如果未开启则需要开启Checkpoint参数，重新运行作业生成OBS数据文件。开启Checkpoint步骤如下。到DLI管理控制台，左侧导航栏选择“作业管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
javahash - 数据湖探索 DLI
javahash - 数据湖探索 DLI

命令格式 javahash(string a) 参数说明表1 参数说明参数是否必选参数类型说明 a 是 STRING类型。需要返回hash值的数据。返回值说明返回STRING类型的值。返回hash值，如果a为null，返回报错。示例代码返回 48690 select

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

在Spark作业编辑器中选择对应的Module模块并执行Spark作业。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.mongo。如果选择Spark版本为3.1.1及以上版本时，无需选择Module模块，

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo

总条数： 805

上一页
1
...
34
35
36
...
41
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink作业概述 - 数据湖探索 DLI

修改普通队列的网段 - 数据湖探索 DLI

增强型跨源连接标签管理 - 数据湖探索 DLI

弹性资源池标签管理 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

生成Flink SQL作业的静态流图 - 数据湖探索 DLI

DWS维表（不推荐使用） - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

插入数据至RDS表 - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

插入数据至DWS表 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

URL函数 - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

javahash - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线