搜索_华为云

从Kafka读取数据写入到DWS - 数据湖探索 DLI

从Kafka读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述该场景为对汽车驾驶的实时数据信息进行分析，将满足特定条件的数据结果进行汇总。汽车驾驶的实时数据信息为数据源发送到Kafka中，再将Kafka数据的分析结果输出到DWS中。例如，输入如下样例数据：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

从数据库读取相应的数据。前提条件要与实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
作业语义检验时提示DIS通道不存在怎么处理？ - 数据湖探索 DLI

作业语义检验时提示DIS通道不存在怎么处理？处理方法如下：登录到DIS管理控制台，在左侧菜单栏选择“通道管理”。检查Flink作业SQL语句中的DIS通道是否存在。如果Flink作业中的DIS通道还未创建，请参见《数据接入服务用户指南》中“开通DIS通道”章节。确保创建的

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
修改弹性资源池的主机信息 - 数据湖探索 DLI

息? 单击“确定”，完成主机信息的修改。怎样获取MRS主机信息? 方法一：在管理控制台查看MRS主机信息获取MRS集群主机名与IP地址，以MRS3.x集群为例，步骤如下：登录MRS管理控制台页面。单击“集群列表 > 现有集群”，在集群列表中单击指定的集群名称，进入集群信息页面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
最新动态 - 数据湖探索 DLI
最新动态 - 数据湖探索 DLI

用户可以在DLI管理控制台采用API接口模式设置参数及参数值。商用创建批处理作业API 2020年5月序号功能名称功能描述阶段相关文档 1 支持数据扫描量套餐包 DLI增加数据扫描量套餐包，降低数据扫描量费用。商用产品价格详情 2 支持全局变量功能 DLI支持设置全局变量，用于保护用户关键信息。

帮助中心 > 数据湖探索 DLI > 最新动态
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch 本指导仅适用于Flink 1.12版本。场景描述本示例场景对用户购买商品的数据信息进行分析，将满足特定条件的数据结果进行汇总输出。购买商品数据信息为数据源发送到Kafka中，再将Kafka数据的分析结果输出到Elasticsearch中。例如，输入如下样例数据：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
查看表元数据 - 数据湖探索 DLI

在“数据管理”页面查看元数据。在管理控制台左侧，单击“数据管理”>“库表管理”。单击需导出数据对应数据库名称，进入该数据库“表管理”页面。单击目标表“操作”栏中的“更多”，选择“表属性”，即可在“元数据”页签查看该表的元数据信息。在“SQL编辑器”页面查看元数据。在管理控制台左侧，单击“SQL编辑器”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

在GaussDB(DWS) 控制台设置会话闲置超时时长session_timeout，在闲置会话超过所设定的时间后服务端将主动关闭连接。 session_timeout默认值为600秒，设置为0表示关闭超时限制，一般不建议设置为0。 session_timeout设置方法如下：登录GaussDB(DWS)

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
CLUSTER BY - 数据湖探索 DLI
CLUSTER BY - 数据湖探索 DLI

]; 关键字 CLUSTER BY：根据指定的字段进行分桶，支持单字段及多字段，并在桶内进行排序。注意事项所排序的表必须是已经存在的，否则会出错。示例根据字段score对表student进行分桶并进行桶内局部降序排序。 1 2 SELECT * FROM student

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 排序
测试地址连通性 - 数据湖探索 DLI

常用于读写外部数据源场景，在配置了跨源连接后，检验DLI队列与绑定的跨源对端地址之间的通信能力。测试队列与数据源地址连通性登录DLI管理控制台，选择“资源管理 > 队列管理”。在“队列管理”页面，选择需要测试地址连通性的队列，单击操作列下的“更多 > 测试地址连通性”。在“测

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

所产生的请求次数和流量大小有关，请根据自己的业务进行预估。 DLI 在创建SQL作业前需购买队列，使用DLI的队列资源时，按照队列CU时进行计费。如购买按需计费的队列，在使用队列资源时，按照队列CU时进行计费。以小时为单位进行结算。不足一小时按一小时计费，小时数按整点计算。队

 帮助中心 > 数据湖探索 DLI > 最佳实践
从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

MySQL数据库和表登录RDS管理控制台，在“实例管理”界面，选择已创建的RDS MySQL实例，选择操作列的“更多 > 登录”，进入数据管理服务实例登录界面。输入实例登录的用户名和密码。单击“登录”，即可进入RDS MySQL数据库并进行管理。在数据库实例界面，单击“新建

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

操作步骤在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Spark作业”，进入“Spark作业”页面。单击右上角的“创建作业”，在Spark作业编辑窗口，可以选择使用“表单模式”或者“API模式”进行参数设置。以下以“表单模式”页面进行说明，“API模式”即采用A

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
Hudi表模型设计规范 - 数据湖探索 DLI

Hudi表模型设计规范规则 Hudi表必须设置合理的主键。 Hudi表提供了数据更新和幂等写入能力，该能力要求Hudi表必须设置主键，主键设置不合理会导致数据重复。主键可以为单一主键也可以为复合主键，两种主键类型均要求主键不能有null值和空值，可以参考以下示例设置主键： SparkSQL： //

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

Opensource SQL使用DEW管理访问凭据操作场景 DLI将Flink作业的输出数据写入到Mysql或DWS时，需要在connector中设置账号、密码等属性。但是账号密码等信息属于高度敏感数据，需要做加密处理，以保障用户的数据隐私安全。数据加密服务（Data Encryption

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

CLEANARCHIVE 命令功能用于对Hudi表的归档文件进行清理，以减少Hudi表的数据存储及读写压力。命令格式按文件容量进行清理，需要配置参数： hoodie.archive.file.cleaner.policy = KEEP_ARCHIVED_FILES_BY_SIZE;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
MRS配置 - 数据湖探索 DLI
MRS配置 - 数据湖探索 DLI

MRS配置 DLI跨源连接中配置MRS主机信息在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。对接MRS HBase需要在DLI队列的host文件中添加MRS集群节点的/etc/hosts信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

可以访问公网且防火墙规则已开放连接端口。数据源为云上的DWS、MRS等服务时，网络互通需满足如下条件： i. CDM集群与云上服务处于不同区域的情况下，需要通过公网或者专线打通网络。通过公网互通时，需确保CDM集群已绑定EIP，数据源所在的主机可以访问公网且防火墙规则已开放连接端口。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
pyspark样例代码 - 数据湖探索 DLI

driver = "org.postgresql.Driver" 设置数据 1 dataList = sparkSession.sparkContext.parallelize([(1, "Katie", 19)]) 设置schema 1 2 3 schema = StructType([StructField("id"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS

总条数： 748

上一页
1
...
10
11
12
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从Kafka读取数据写入到DWS - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

作业语义检验时提示DIS通道不存在怎么处理？ - 数据湖探索 DLI

修改弹性资源池的主机信息 - 数据湖探索 DLI

最新动态 - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

查看表元数据 - 数据湖探索 DLI

Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

CLUSTER BY - 数据湖探索 DLI

测试地址连通性 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

CLEANARCHIVE - 数据湖探索 DLI

MRS配置 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线