搜索_华为云

java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

\"age\":\"23\"}")); Dataset<Row> dataFrame = sqlContext.read().json(javaRDD); 设置连接参数 String url = "192.168.4.62:8635,192.168.5.134:8635/test?authSource=admin";

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
导出SQL作业结果 - 数据湖探索 DLI

业结果文件的场景，即不需要旧的作业结果的场景。结果条数否指定导出的结果条数。不填写数值或数值为“0”时，导出全部结果。表头否设置导出查询结果数据是否含表头。导出作业结果到本地异步DDL和QUERY语句支持将结果下载到本地。下载到本地默认仅支持下载1000条数据。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Print结果表 - 数据湖探索 DLI
Print结果表 - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式 1 2 3 4 5 6 7 8 9 create table printSink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
普通队列弹性扩缩容 - 数据湖探索 DLI

在DLI管理控制台左侧，选择“资源管理 > 队列管理”。选择需要扩容的队列，单击“操作”列“更多”中的“弹性扩缩容”。在“弹性扩缩容”页面，“变更方式”选择“扩容”，设置扩容的CU值。图1 弹性扩容确认费用无误后，单击“确定”。弹性缩容当计算业务较小，不需要那么大的队列规格时，可以通过手动变更队列规格来缩容当前队列。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

读取kafka中的数据，以avro格式反序列化，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
创建Kafka_SSL类型跨源认证 - 数据湖探索 DLI

Truststore密码 truststore密码。 Keystore路径上传SSL KEYSTORE(密钥和证书)文件的OBS路径。 Keystore密码 keystore(密钥和证书)密码。 Key密码 keystore中的私钥密码。图1 创建认证信息-Kafka_SSL 访

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
管理Flink作业模板 - 数据湖探索 DLI

保存保存修改。创建作业使用当前模板创建作业。格式化对SQL语句进行格式化，将SQL语句格式化后，需要重新编辑SQL语句。主题设置更改字体大小、自动换行、页面风格（黑色底或白色底）等配置。在SQL语句编辑区域，输入SQL语句，实现业务逻辑功能。SQL语句的编写请参考《数据湖探索SQL语法参考》。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
下载并安装JDBC驱动包 - 数据湖探索 DLI

登录DLI管理控制台。在页面右上角的用户名的下拉列表中选择“我的凭证”。在“我的凭证”页面，默认显示“项目列表”，切换到“管理访问密钥”页面。单击左侧“新增访问密钥”按钮，输入“登录密码”和“短息验证码”。单击“确定”，下载证书。下载成功后，在credentials文件中即可获取AK和SK信息。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
pyspark样例代码 - 数据湖探索 DLI

sparkSession = SparkSession.builder.appName("datasource-mongo").getOrCreate() 设置连接参数 1 2 3 4 5 6 url = "192.168.4.62:8635,192.168.5.134:8635/test?authSource=admin"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

maxwell-json.ignore-parse-errors 否 false Boolean 跳过解析错误而不是失败的字段和行。出现错误时，字段设置为空。 maxwell-json.timestamp-format.standard 否 'SQL' String 指定输入和输出时间戳格

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

Boolean 当解析异常时，是跳过当前字段或行，还是抛出错误失败（默认为 false，即抛出错误失败）。如果忽略字段的解析异常，则会将该字段值设置为null。 debezium-json.timestamp-format.standard 否 'SQL' String 声明输入和输出

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hudi数据表Compaction规范 - 数据湖探索 DLI

paction执行合并的过程必须和实时任务解耦，通过周期调度Spark任务来完成异步Compaction，这个方案的关键之处在于如何合理的设置这个周期，周期如果太短意味着Spark任务可能会空跑，周期如果太长可能会积压太多的Compaction Plan没有去执行而导致Spark

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

优先级当前弹性资源池中的优先级数字越大表示优先级越高。本例设置一条扩缩容策略，默认优先级为1。 1 时间段首条扩缩容策略是默认策略，不能删除和修改时间段配置。即设置00-24点的扩缩容策略。 00-24 最小CU 设置扩缩容策略支持的最小CU数。 16 最大CU 当前扩缩容策略支持的最大CU数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
数据权限列表 - 数据湖探索 DLI

命名表分区） ALTER_TABLE_RECOVER_PARTITION（恢复表分区） ALTER_TABLE_SET_LOCATION（设置分区的路径） SHOW_PARTITIONS（显示所有分区） SHOW_CREATE_TABLE（查看建表语句） TABLE上可以赋权/回收的权限：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据权限相关
Hudi数据表Archive规范 - 数据湖探索 DLI

automatic默认为true)。 Archive操作并不是每次写数据时都会触发，至少需要满足以下两个条件： Hudi表满足hoodie.keep.max.commits设置的阈值。如果是Flink写hudi至少提交的checkpoint要超过这个阈值；如果是Spark写hudi，写Hudi的次数要超过这个阈值。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
查看增强型跨源连接的基本信息 - 数据湖探索 DLI

选择“跨源管理 > 增强型跨源”。进入增强型跨源连接列表页面，选择您需要查看的增强型跨源连接。在列表页面的右上方单击可以自定义显示列，并设置表格内容显示规则、操作列显示规则。在列表页面上方的搜索区域，您可以名称和标签筛选需要的增强型跨源连接。单击查看增强型跨源连接详细信息。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

x：空值在CSV数据源中为""。 Spark3.3.x：空值在CSV数据源中无引号。如需在Spark3.3.x版本中恢复Spark2.4.x的格式，可以通过设置spark.sql.legacy.nullValueWrittenAsQuotedEmptyStringCsv为 true来实现。升级引擎版本后是否对作业有影响：

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
导出查询结果 - 数据湖探索 DLI

file_format为csv时，options参数可以参考表3。注意事项通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI表在OBS桶中插入的文件个数，同时，为了避免数据倾斜，在INSERT语句后可加上“distribute by rand()”，可以增加处理作业的并发量。例如：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
UNION | INTERSECT | EXCEPT - 数据湖探索 DLI

DISTINCT] query ALL和DISTINCT表示是否返回包含重复的行。ALL返回所有的行；DISTINCT返回只包含唯一的行。如果未设置，默认为DISTINCT。 INTERSECT query INTERSECT [DISTINCT] query INTERSECT仅返回

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

jar包冲突。用户提交的flink jar 与 DLI 集群中的hdfs jar包存在冲突。处理步骤 1. 将用户pom文件中的的hadoop-hdfs设置为： <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>h

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类

总条数： 506

上一页
1
...
21
22
23
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

java样例代码 - 数据湖探索 DLI

导出SQL作业结果 - 数据湖探索 DLI

Print结果表 - 数据湖探索 DLI

普通队列弹性扩缩容 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

创建Kafka_SSL类型跨源认证 - 数据湖探索 DLI

管理Flink作业模板 - 数据湖探索 DLI

下载并安装JDBC驱动包 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

数据权限列表 - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

查看增强型跨源连接的基本信息 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

UNION | INTERSECT | EXCEPT - 数据湖探索 DLI

Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线