搜索_华为云

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度操作场景 Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

支持的Connector Kafka UpsertKafka 示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
ClickHouse结果表 - 数据湖探索 DLI

kHouse集群所在安全组规则中的端口。建立增强型跨源连接，请参考《数据湖探索用户指南》中的“增强型跨源连接”章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项创建MRS的ClickHouse集群，集群版本选择MRS 3.1.0，且勿开启kerberos认证。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
管理DLI全局变量 - 数据湖探索 DLI

在编辑作业过程中重复定义，减少开发与维护成本。通过使用全局变量可以替换长难复杂变量，简化复杂参数，提升SQL语句可读性。本节操作为您介绍如何创建全局变量。创建全局变量在DLI控制台左侧导航栏中单击“全局配置 > 全局变量”。在“全局变量”页面，单击右上角“创建变量”，可创建新的全局变量。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
为什么DLI增强型跨源连接要创建对等连接？ - 数据湖探索 DLI

DLI增强型跨源连接创建对等连接的主要原因是为了实现DLI与不同VPC中的数据源之间的网络连通。当DLI需要访问外部数据源，而这些数据源位于不同的VPC中时，由于网络隔离，DLI默认无法直接读取这些数据源的数据。通过创建增强型跨源连接，可以采用对等连接的方式打通DLI与数据源的VPC网络，从而实现数据的互通和跨源分析。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

checkpoint 时是否保证刷出缓冲区中的数据。如果关闭这一选项，在进行checkpoint时 sink 将不再为所有进行中的请求等待 Elasticsearch 的执行完成确认。因此，在这种情况下 sink 将不对至少一次的请求的一致性提供任何保证。 sink.bulk-flush

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Orc Format - 数据湖探索 DLI
Orc Format - 数据湖探索 DLI

ARRAY - LIST MAP - MAP ROW - STRUCT 示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
责任共担 - 数据湖探索 DLI
责任共担 - 数据湖探索 DLI

责任共担华为云秉承“将公司对网络和业务安全性保障的责任置于公司的商业利益之上”。针对层出不穷的云安全挑战和无孔不入的云安全威胁与攻击，华为云在遵从法律法规业界标准的基础上，以安全生态圈为护城河，依托华为独有的软硬件优势，构建面向不同区域和行业的完善云服务安全保障体系。安全性是华为云与您的共同责任，如图1所示。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

直接访问。增强型跨源仅支持包年包月队列、按需计费模式下的专属队列。权限要求增强型跨源连接需要使用VPC、子网、路由、对等连接功能，因此需要获得VPC（虚拟私有云）的VPC Administrator权限。可在服务授权中进行设置。使用约束限制使用DLI增强型跨源时，弹性

 帮助中心 > 数据湖探索 DLI > 产品介绍
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据应用场景在车联网领域，云计算与大数据为企业提供了强大的分析挖掘能力，可以帮助企业和车队管理者更加科学、便捷地进行车辆数据管理与分析。方案架构根据已有的某货运公司车辆定时上报的详单数据和货运订单数据，DLI可以完成对该货运公司车辆行驶特点分析、记录明细的查询。

帮助中心 > 数据湖探索 DLI > 最佳实践
查询所有队列 - 数据湖探索 DLI

企业项目ID。0”表示default，即默认的企业项目。关于如何设置企业项目请参考《企业管理用户指南》。说明：开通了企业管理服务的用户可设置该参数绑定指定的项目。 cidr_in_vpc 否 String 队列的虚拟私有云（VPC）的网段。例如：10.0.0.0/8~24，172.16

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
区域和可用区 - 数据湖探索 DLI

区域和可用区用于描述数据中心的位置，您可以在特定的区域、可用区创建资源。区域（Region）：从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region，通用Region

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Parquet Format - 数据湖探索 DLI
Parquet Format - 数据湖探索 DLI

ARRAY - LIST MAP - MAP ROW - STRUCT 示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列>

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Flink作业性能调优类 - 数据湖探索 DLI

Flink作业性能调优类 Flink作业推荐配置指导 Flink作业性能调优 Flink作业重启后，如何保证不丢失数据？ Flink作业运行异常，如何定位 Flink作业重启后，如何判断是否可以从checkpoint恢复 DLI Flink作业提交运行后（已选择保存作业日志到OBS

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。若使用MRS HBase，请在增强型跨源的主机信息中添加MRS集群所有节点的主机IP信息。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
身份认证与访问控制 - 数据湖探索 DLI

授权方式 DLI FullAccess 数据湖探索所有权限。系统策略具体的授权方式请参考创建IAM用户并授权使用DLI以及《如何创建子用户》和《如何修改用户策略》。 DLI ReadOnlyAccess 数据湖探索只读权限。系统策略 Tenant Administrator

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

String 是否将 "null" 字符串转化为 null 值。示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。如果使用MRS HBase，请在增强型跨源的主机信息中添加MRS集群所有节点的主机ip信息。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

应用场景 DLI服务适用于海量日志分析、异构数据源联邦分析、大数据ETL处理。海量日志分析游戏运营数据分析游戏公司不同部门日常通过游戏数据分析平台，分析每日新增日志获取所需指标，通过数据来辅助决策。例如：运营部门通过平台获取新增玩家、活跃玩家、留存率、流失率、付费率等，了解

 帮助中心 > 数据湖探索 DLI > 产品介绍

总条数： 397

上一页
1
...
6
7
8
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

管理DLI全局变量 - 数据湖探索 DLI

为什么DLI增强型跨源连接要创建对等连接？ - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

Orc Format - 数据湖探索 DLI

责任共担 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

区域和可用区 - 数据湖探索 DLI

Parquet Format - 数据湖探索 DLI

Flink作业性能调优类 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

身份认证与访问控制 - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线