搜索_华为云

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在“程序包管理”页面，单击右上角的“创建”创建程序包。在“创建程序包”对话框，配置以下参数。包类型：选择“JAR”。 OBS路径：程序包所在的OBS路径。分组设置和组名称根据情况选择设置，方便后续识别和管理程序包。单击“确定”，完成创建程序包。创建UDAF函数。登录登录DLI管理控制台，创建SQL队列和数据库。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
将OBS数据导入至DLI - 数据湖探索 DLI

说明：路径同时支持文件和文件夹。 obs://DLI/sampledata.csv 表头:无/有当“文件格式”为“CSV”时该参数有效。设置导入数据源是否含表头。选中“高级选项”，勾选“表头:无”前的方框，“表头:无”显示为“表头:有”，表示有表头；取消勾选即为“表头:无”，表示无表头。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
日期、时间函数及运算符 - 数据湖探索 DLI

- interval '3' year - interval '5' month 2-7 时区转换运算符：AT TIME ZONE，用于设置一个时间戳的时区。 SELECT timestamp '2012-10-31 01:00 UTC';-- 2012-10-31 01:00:00

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
CONVERT TO DELTA - 数据湖探索 DLI
CONVERT TO DELTA - 数据湖探索 DLI

转换过程会收集统计信息，以提升转换后的 Delta 表的查询性能。如果提供表名，则元存储也将更新，以反映该表现在是 Delta 表。注意事项分区表转换需要设置参数spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled为false。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
Flink作业性能调优 - 数据湖探索 DLI

key不均衡场景下，group聚合计算存在单点或者数据倾斜问题，此时，可以通过将聚合计算拆分成Local-Global进行优化。配置方式为设置调优参数: table.optimizer.aggphase-strategy=TWO_PHASE count distinct优化在count

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

用户执行Flink Opensource SQL, 采用Flink 1.10版本。初期Flink作业规划的Kafka的分区数partition设置过小或过大，后期需要更改Kafka区分数。解决方案在SQL语句中添加如下参数： connector.properties.flink.partition-discovery

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
在Spark SQL作业中使用UDF - 数据湖探索 DLI

在“程序包管理”页面，单击右上角的“创建”创建程序包。在“创建程序包”对话框，配置以下参数。包类型：选择“JAR”。 OBS路径：程序包所在的OBS路径。分组设置和组名称根据情况选择设置，方便后续识别和管理程序包。单击“确定”，完成创建程序包。创建UDF函数。登录DLI管理控制台，单击“SQL编辑器”，执

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
pyspark样例代码 - 数据湖探索 DLI

mysql.jdbc.Driver" 参数说明请参考表1。设置数据 1 dataList = sparkSession.sparkContext.parallelize([(123, "Katie", 19)]) 设置schema 1 2 3 schema = StructTy

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
创建Bucket索引表调优 - 数据湖探索 DLI

024 分区表桶数 = 单分区数据量大小(G)/2G，再后向上取整，最小设置1个桶需要使用的是表的总数据大小，而不是压缩以后的文件大小桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。父主题： Bucket调优示例

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Hudi Clean操作说明 - 数据湖探索 DLI

SparkDataSource（option里设置如下参数，写数据时触发） hoodie.clean.automatic=true hoodie.cleaner.commits.retained=10 // 默认值为10，根据业务场景指定 Flink（with属性里设置如下参数，写数据时触发） clean

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
欠费说明 - 数据湖探索 DLI
欠费说明 - 数据湖探索 DLI

欠费后需要及时充值，详细操作请参见账户充值。若DLI的队列、弹性资源池等资源不再使用，您可以将他们删除，以免继续扣费。您可以在“费用中心 > 总览”页面设置“可用额度预警”功能，当可用额度、通用代金券和现金券的总额度低于预警阈值时，系统自动发送短信和邮件提醒。当产生欠费后，请您及时充值使可用

 帮助中心 > 数据湖探索 DLI > 计费说明
DLI对接LakeFormation - 数据湖探索 DLI

实例。设置实例为默认实例查看实例“基本信息”中“是否为默认实例”的参数值。 “true”表示当前实例为默认实例。 “false”表示当前实例不为默认实例。如果需要设置当前实例为默认实例，请单击页面右上角“设为默认实例”。勾选操作影响后单击“确定”，将当前实例设置为默认实例。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

using json options(path 'obs://....') using json：指定使用 JSON 格式。 options：用于设置表的选项。 path：指定OBS中JSON文件的路径。父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
创建并使用跨源链接 - 数据湖探索 DLI

"ip":"192.168.0.1", "name":"ecs-97f8-0001" }, { "ip":"192.168.0.2", "name":"ecs-97f8-0002" } ] } 响应示例 { "is_success":

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
套餐包计费 - 数据湖探索 DLI
套餐包计费 - 数据湖探索 DLI

续使用。购买套餐包登录DLI管理控制台。选择“资源管理 > 队列管理”。在队列管理页面，单击“购买套餐包”。在“购买套餐包”页面设置相关参数。表2 参数说明参数名称描述区域选择所在的区域。不同区域的云服务之间内网互不相通；请就近选择靠近您业务的区域，可减少网络时延，提高访问速度。

帮助中心 > 数据湖探索 DLI > 计费说明
增强型跨源连接标签管理 - 数据湖探索 DLI

在对应连接的“操作”列，选择“更多”>“标签”。进入标签管理页面，显示当前连接的标签信息。单击“添加/编辑标签”，弹出“添加/编辑标签”对话框，配置参数。标签键和标签值设置完成后，单击“添加”，将标签加入到输入框中。图1 添加标签表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
查询OpenTSDB表 - 数据湖探索 DLI
查询OpenTSDB表 - 数据湖探索 DLI

SELECT命令用于查询OpenTSDB表中的数据。若OpenTSDB上不存在metric，查询对应的DLI表会报错。若OpenTSDB开了安全模式，则访问时，需要设置conf:dli.sql.mrs.opentsdb.ssl.enabled=true 语法格式 1 SELECT * FROM table_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接OpenTSDB表
pyspark样例代码 - 数据湖探索 DLI

driver = "org.postgresql.Driver" 设置数据 1 dataList = sparkSession.sparkContext.parallelize([(1, "Katie", 19)]) 设置schema 1 2 3 schema = StructType([StructField("id"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

说明获取方式 DLI AKSK AK/SK认证就是使用AK/SK对请求进行签名，从而通过身份认证。获取AK/SK DLI Endpoint地址地区与终端节点，即云服务在不同Region有不同的访问域名。获取EndPoint DLI所在的项目ID 项目编号，用于资源隔离。获取项目ID

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据

总条数： 544

上一页
1
...
20
21
22
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

将OBS数据导入至DLI - 数据湖探索 DLI

日期、时间函数及运算符 - 数据湖探索 DLI

CONVERT TO DELTA - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

Hudi Clean操作说明 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

欠费说明 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

套餐包计费 - 数据湖探索 DLI

增强型跨源连接标签管理 - 数据湖探索 DLI

查询OpenTSDB表 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线