搜索_华为云

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

单击所建桶“dli-test-obs01”，进入“对象”页面。选择左侧列表中的“对象”，选择“上传对象”，将需要上传的文件，例如“spark-examples.jar”上传到指定目录，单击“确定”。本例文件上传成功后，文件路径为“obs://dli-test-obs01/spark-examples.jar”。

帮助中心 > 数据湖探索 DLI > 快速入门
创建表（废弃） - 数据湖探索 DLI

"timestamp_format": "yyyy-MM-dd HH:mm:ss" } “date_format”和“timestamp_format”的格式需与导入的csv文件中的时间格式一致。创建data_location为DLI的表。 { "table_name": "tb2", "data_location":

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

影响作业执行。如需使用UDF热加载功能请提交工单开通白名单。关键字 USING <resources>：需要加载的资源。可以是JAR、文件或者URI的列表。 OR REPLACE：支持自定义函数热加载功能。如果创建自定义函数时不携带OR REPLACE，则需要注意以下场景：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
ALTER TABLE - 数据湖探索 DLI
ALTER TABLE - 数据湖探索 DLI

PARTITION时指定了分区保存路径，那么在DROP PARTITION执行后，分区所在文件夹和数据不会被删除。如果ADD PARTITION时未指定分区保存路径，分区目录将从OBS上删除，数据会移到.Trash/Current文件夹。 ALTER TABLE table_name DROP [IF

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

本示例将演示DLI直接对存储在OBS中的TPC-H数据集进行查询的操作，DLI已经预先生成了100M的TPC-H-2.18的标准数据集，已将数据集上传到了OBS的tpch文件夹中，并且赋予了只读访问权限，方便用户进行查询操作。 TPC-H的测试和度量指标 TPC-H 测试分解为3 个子测试：数据装载测试、Pow

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
Flink作业常用操作 - 数据湖探索 DLI

选择需导入的作业配置文件的完整OBS路径。单击“下一步”。配置同名作业策略。单击“下一步”。勾选“配置同名替换”，如果待导入的作业名已存在，则覆盖已存在的作业配置，并且作业状态重置为草稿。不勾选“配置同名替换”，如果待导入的作业名已存在，则不导入同名作业的配置。确认“配置文件”和“同

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
错误码 - 数据湖探索 DLI
错误码 - 数据湖探索 DLI

DLI.0007 不支持该操作。 400 DLI.0008 元数据错误。 400 DLI.0009 系统限制。 400 DLI.0011 文件权限校验错误。 400 DLI.0012 资源对象不可用。 401 DLI.0013 用户认证错误。 401 DLI.0014 服务认证错误。

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

with "Provided" scope，否则本地调试运行时会加载不到pom文件中的依赖包。具体操作以IntelliJ IDEA版本2020.2为例，参考如下：在IntelliJ IDEA界面，选择调试的配置文件，单击“Edit Configurations”。在“Run/Debug

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

OBS的使用涉及以下几项费用：存储费用：静态网站文件存储在OBS中产生的存储费用。请求费用：用户访问OBS中存储的静态网站文件时产生的请求费用。流量费用：用户使用自定义域名通过公网访问OBS时产生的流量费用。实际产生的费用与存储的文件大小、用户访问所产生的请求次数和流量大小有关，请根据自己的业务进行预估。

帮助中心 > 数据湖探索 DLI > 最佳实践
ClickHouse - 数据湖探索 DLI
ClickHouse - 数据湖探索 DLI

后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据创建MRS的ClickHouse集群，集群版本选择MRS

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
配置SQL防御规则 - 数据湖探索 DLI

类别适用引擎支持的动作取值说明系统默认创建规则 SQL语句示例 dynamic_0001 Scan files number 扫描文件数的限制。 dynamic spark HetuEngine 提示拦截取值范围：1-2000000 默认值：200000 是 NA dynamic_0002

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
pyspark样例代码 - 数据湖探索 DLI

sql("select * from css_table") jdbcDF.show() 操作结果提交Spark作业将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
状态码 - 数据湖探索 DLI
状态码 - 数据湖探索 DLI

Failed 未满足前提条件，服务器未满足请求者在请求中设置的其中一个前提条件。 413 Request Entity Too Large 由于请求的实体过大，服务器无法处理，因此拒绝请求。为防止客户端的连续请求，服务器可能会关闭连接。如果只是服务器暂时无法处理，则会包含一个Retry-After的响应信息。

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
userDefined结果表 - 数据湖探索 DLI

@Override public void close() throws Exception {} } 依赖的pom配置文件内容参考如下： <dependency> <groupId>org.apache.flink</groupId> <ar

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
二进制函数和运算符 - 数据湖探索 DLI

lpad(binary, size, padbinary) → varbinary 左填充二进制以使用padbinary调整字节大小。如果size小于二进制文件的长度，则结果将被截断为size个字符。size不能为负，并且padbinary不能为空。 select lpad(x'15245F', 11

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

ms等，默认为ms。 sink.parallelism 否无 Integer 为 HBase sink operator 定义并行度。默认情况下，并行度由框架决定，和连接在一起的上游operator一样。 krb_auth_name 否无 String DLI侧创建的Kerberos类型的跨源认证名称。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
数据湖探索简介 - 数据湖探索 DLI

用户不需要管理任何服务器，即开即用。 DLI支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。

帮助中心 > 数据湖探索 DLI > 产品介绍
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

'schema-name' = 'test',--RDS Postgres数据库下的schema 'table-name' = 'cdc_order'--RDS Postgres数据库下的表名 ); create table dwsSink( order_id string

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

测试结果显示可达，则DLI队列与MySQL实例的网络已经联通。图7 测试结果如果测试结果不可达，请参考创建跨源成功但测试网络连通性失败怎么办？进行排查。排查完成后，重新进行网络连通性测试。步骤5：创建跨源认证跨源分析场景中，如果在作业中直接配置认证信息会触发密码泄露的风

 帮助中心 > 数据湖探索 DLI > 快速入门
使用DLI分析账单消费数据 - 数据湖探索 DLI

在DLI上进行消费明细分析。将1下载的消费明细数据上传到已建好的OBS桶中。在数据湖探索服务中创建表。登录DLI控制台，左侧导航栏单击“SQL编辑器”，执行引擎选择“spark”，选择执行的队列和数据库。本次演示队列和数据库选择“default”。下载的文件中包含时间用量等，按表头

 帮助中心 > 数据湖探索 DLI > 最佳实践

总条数： 443

上一页
1
...
16
17
18
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

创建表（废弃） - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

ALTER TABLE - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

错误码 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

ClickHouse - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

状态码 - 数据湖探索 DLI

userDefined结果表 - 数据湖探索 DLI

二进制函数和运算符 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线