搜索_华为云

java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

\"age\":\"23\"}")); Dataset<Row> dataFrame = sqlContext.read().json(javaRDD); 设置连接参数 String url = "192.168.4.62:8635,192.168.5.134:8635/test?authSource=admin";

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

此处可以看到作业的执行状态。点击对应作业右侧的更多，可以在下拉菜单中跳转日志选单：归档日志：跳转OBS界面，可以看到该作业的全部日志归档地址，包含提交日志，Driver日志和Executor日志，在此处可以下载日志。提交日志：跳转到提交日志的聚合展示界面，可以查看任务提交中的日志信息。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

在“程序包管理”页面，单击右上角的“创建”创建程序包。在“创建程序包”对话框，配置以下参数。包类型：选择“JAR”。 OBS路径：程序包所在的OBS路径。分组设置和组名称根据情况选择设置，方便后续识别和管理程序包。单击“确定”，完成创建程序包。图11 创建程序包创建DLI的UDTF函数。登录DLI管理控

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
添加Flink作业标签 - 数据湖探索 DLI

单击“确定”。（可选）在标签列表中，单击“操作”列中“删除”可对选中的标签进行删除。根据标签查找作业对于已经添加过标签的作业，用户可以通过设置标签过滤条件进行搜索，以便快速查找到作业。在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Flink作业”，进入Flink作业管理页面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
Hudi Compaction操作说明 - 数据湖探索 DLI

入延迟，因而进行不阻塞摄入的异步Compaction很有意义。如何执行Compaction 仅执行Schedule Spark SQL（设置如下参数，写数据时触发） hoodie.compact.inline=true hoodie.schedule.compact.only.inline=true

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

Hudi当前只有int、bigint、float、double、decimal、string、date、timestamp、boolean、binary类型支持设置默认值。 Hudi表必须指定primaryKey与preCombineField。在指定路径下创建表时，如果路径下已存在Hudi表，则建

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

API语法说明设置写入方式 Hudi通过hoodie.datasource.write.operation参数设置写入模式。 insert：该操作不需要通过索引去查询具体更新的文件分区，因此它的速度比upsert快。当不包含更新数据时建议使用该操作，如果存在更新数据使用该操作会出现重复数据。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
DLI委托概述 - 数据湖探索 DLI
DLI委托概述 - 数据湖探索 DLI

服务以您的身份访问DEW服务。图1 DLI云服务委托 DLI委托在使用DLI前，为了确保正常使用DLI的功能，建议先进行DLI委托权限设置。 DLI默认提供以下类型的委托：dli_admin_agency、dli_management_agency、dli_data_clea

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

单引号（''）包围起来。 partition_specs 分区信息，key=value形式，key为分区字段，value为分区值。若分区字段为多个字段，可以不包含所有的字段，会删除匹配上的所有分区。“partition_specs”中的参数默认带有“( )”，例如：PARTITION

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
pyspark样例代码 - 数据湖探索 DLI

sparkSession = SparkSession.builder.appName("datasource-mongo").getOrCreate() 设置连接参数 1 2 3 4 5 6 url = "192.168.4.62:8635,192.168.5.134:8635/test?authSource=admin"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

eckPoint间隔为分钟级。 checkpoint容忍失败次数设置，execution.checkpointing.tolerable-failed-checkpoints。 Flink On Hudi作业建议设置checkpoint容忍次数多次，如100。若需要使用Hive风格分区，需同时配置如下参数：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
DLI SDK与API的对应关系 - 数据湖探索 DLI

getFlinkJobsMetrics - POST /v1.0/{project_id}/streaming/jobs/metrics 查询Flink作业APIG网关服务访问地址 getFlinkApigSinks - GET /v1.0/{project_id}/streaming/jobs/{job_id}/apig-sinks

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
Hudi Archive操作说明 - 数据湖探索 DLI

多会导致性能问题，所以元数据文件数量最好控制在1000以内。如何执行Archive 写完数据后archive Spark SQL（set设置如下参数，写数据时触发） hoodie.archive.automatic=true hoodie.keep.max.commits=30

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
MRS配置 - 数据湖探索 DLI
MRS配置 - 数据湖探索 DLI

conf文件。创建MRS HBase表创建DLI表关联MRS HBase表之前确保HBase的表是存在的。以样例代码为例，具体的流程是：远程登录ECS，通过hbase shell命令查看表信息。其中，“hbtest”是要查询的表名。 describe 'hbtest' （可选）如果不存在

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Spark作业开发类 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK 如何查看DLI Spark作业的实际资源使用情况将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark.sql

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

大CU。同一队列不同扩缩容策略的时间段区间不能有交集。弹性资源池队列中的扩缩容策略时间段仅支持整点的时间段设置，并且包含设置的开启时间，不包含设置的结束时间，例如设置时间段00-09，则时间段范围为：[00:00，09:00)。默认的扩缩容策略不支持时间段配置修改。弹性资源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
string_split - 数据湖探索 DLI
string_split - 数据湖探索 DLI

sql作业，输入以下作业运行脚本，提交运行作业。注意：创建作业时，在作业编辑界面的“运行参数”处，“Flink版本”选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。如下脚本中的加粗参数请根据实际环境修改。 CREATE TABLE kafkaSource (

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数 > 表值函数
string_split - 数据湖探索 DLI
string_split - 数据湖探索 DLI

sql作业，输入以下作业运行脚本，提交运行作业。注意：创建作业时，在作业编辑界面的“运行参数”处，“Flink版本”选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。如下脚本中的加粗参数请根据实际环境修改。 CREATE TABLE kafkaSource (

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数 > 表值函数
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

大CU。同一队列不同扩缩容策略的时间段区间不能有交集。弹性资源池队列中的扩缩容策略时间段仅支持整点的时间段设置，并且包含设置的开启时间，不包含设置的结束时间，例如设置时间段00-09，则时间段范围为：[00:00，09:00)。默认的扩缩容策略不支持时间段配置修改。弹性资源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
责任共担 - 数据湖探索 DLI
责任共担 - 数据湖探索 DLI

户的安全责任在于对使用的IaaS、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全

总条数： 538

上一页
1
...
21
22
23
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

java样例代码 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

添加Flink作业标签 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

DLI委托概述 - 数据湖探索 DLI

删除分区 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

DLI SDK与API的对应关系 - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

MRS配置 - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

string_split - 数据湖探索 DLI

string_split - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

责任共担 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线