搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

\ 'keytab'='./user.keytab',\ 'principal' ='krbtest')") 与未开启kerberos认证相比，开启了kerberos认证需要多设置三个参数，如表1所示。表1 参数说明参数名称与参数值参数说明 'krb5conf'

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Postgres CDC源表 - 数据湖探索 DLI

CDC要求Postgre版本为9.6或者10，11，12。要与实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

codec 否（none） String 仅用于文件系统，avro 压缩编解码器。默认不压缩。目前支持：deflate、snappy、bzip2、xz。数据类型映射目前，Avro schema 通常是从 table schema 中推导而来。尚不支持显式定义 Avro schema。因此，下表列出了从

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
查询作业详情 - 数据湖探索 DLI

“show_detail”为“true”时独有。最小值：2 最大值：400 默认为“2”。 parallel_number 否 Integer 用户设置的作业并行数。 “show_detail”为“true”时独有。最小值：1 最大值：2000 默认为“1”。 smn_topic 否 String

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

eckPoint间隔为分钟级。 checkpoint容忍失败次数设置，execution.checkpointing.tolerable-failed-checkpoints。 Flink On Hudi作业建议设置checkpoint容忍次数多次，如100。若需要使用Hive风格分区，需同时配置如下参数：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
使用DLI分析电商BI报表 - 数据湖探索 DLI

将文件或文件夹拖拽到指定的目录上，这样可以上传到指定的目录中。单击Best_Practice_04.zip获取本示例的测试数据，解压“Best_Practice_04.zip”压缩包，解压后将data文件夹上传到OBS桶根目录下。测试数据目录说明如下： user表数据：data/JData_User

帮助中心 > 数据湖探索 DLI > 最佳实践
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 DWS结果表中不允许指定所有属性为PRIMARY

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

String 仅用于FileSystem，avro 压缩编解码器。默认 snappy 压缩。目前支持：null, deflate、snappy、bzip2、xz。数据类型映射目前，Avro schema 通常是从 table schema 中推导而来。尚不支持显式定义 Avro schema。因此，下表列出了从

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
创建并使用跨源链接 - 数据湖探索 DLI

"hosts": [ { "ip":"192.168.0.1", "name":"ecs-97f8-0001" }, { "ip":"192.168.0.2", "name":"ecs-97f8-0002" }

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？在Flink 作业中，可以使用CREATE语句来定义Source表和Sink表，并指定它们的连接器类型以及相关的属性。如果需要将数据写入到不同的Elasticsearch集群，您需要为每个集群配置不

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
从Kafka读取数据写入到DWS - 数据湖探索 DLI

填，类型：IPv4，源地址为：10.0.0.0/16，单击“确定”完成安全组规则添加。登录DLI管理控制台，在左侧导航栏单击“跨源管理”，在跨源管理界面，单击“增强型跨源”，单击“创建”。在增强型跨源创建界面，配置具体的跨源连接参数。具体参考如下。连接名称：设置具体的增强型

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

(orc_table_property = value [, ...] ) ] 限制创建分区表时，如果bucket_count为-1且建表语句中未设置buckets，则使用默认值16。默认外部表存储位置{lakeformation_catalog_url}/{schema_name}.

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
增强型跨源连接权限管理 - 数据湖探索 DLI

选择待操作的增强型跨源连接，单击操作列的“更多 > 权限管理”。授权：在权限管理页面，权限设置选择“授权”。输入项目ID。单击“确定”，授予该项目弹性资源池的操作权限。回收权限：在权限管理页面，权限设置选择“回收”。输入项目ID。单击“确定”，回收指定项目的弹性资源池操作权。父主题：

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
创建批处理作业 - 数据湖探索 DLI

如果当前Spark组件版本为2.3.2，则不填写该参数。 image 否 String 自定义镜像。格式为：组织名/镜像名:镜像版本。当用户设置“feature”为“custom”时，该参数生效。用户可通过与“feature”参数配合使用，指定作业运行使用自定义的Spark镜像。关

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案建议可以尝试调小spark.sql.shuffle.partitions参数值来解决缓冲区不足问题。具体该参数设置步骤如下：登录DLI管理控制台，单击“作业管理 >

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
修改表分区位置（只支持OBS表） - 数据湖探索 DLI

PARTITION partition_specs SET LOCATION obs_path; 关键字 PARTITION：分区。 LOCATION：分区路径。参数说明表1 参数描述参数描述 table_name 表名称。 partition_specs 分区字段。 obs_path

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
取消批处理作业 - 数据湖探索 DLI

"msg": "deleted" } 状态码状态码如表3所示。表3 状态码状态码描述 200 删除成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题： Spark作业相关API

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

登录DLI管理控制台，在“SQL编辑器”中，单击“设置”。在参数设置中，添加参数“spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled”，值设置为“false”。图1 参数设置上述步骤参数设置完成后，则可以进行全表查询，不用查询表的时候要包含分区字段。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
查询批处理作业状态 - 数据湖探索 DLI

"state":"Success"} 状态码状态码如表3所示。表3 状态码状态码描述 200 查询成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题： Spark作业相关API

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

'topic' = 'TOPIC', 'properties.bootstrap.servers' = 'KafkaIP:PROT,KafkaIP:PROT,KafkaIP:PROT', 'properties.group.id' = 'GroupId', 'scan.startup

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive

总条数： 288

上一页
1
...
8
9
10
...
15
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

Postgres CDC源表 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

从Kafka读取数据写入到DWS - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

增强型跨源连接权限管理 - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

修改表分区位置（只支持OBS表） - 数据湖探索 DLI

取消批处理作业 - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

查询批处理作业状态 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线