云服务器内容精选

华为云首页用户手册

数据迁移

云搜索服务 CSS-通过备份与恢复迁移第三方Elasticsearch集群至华为云:应用场景

应用场景通过备份与恢复实现第三方Elasticsearch集群和华为云Elasticsearch集群之间的数据迁移，依赖存储仓库。常用于以下场景：变更服务提供商：如果企业当前使用的是第三方Elasticsearch服务，但出于成本、性能或其他战略考虑，希望更换服务提供商至华为云。集群整合：将分散在不同第三方Elasticsearch集群中的数据统一数据迁移到华为云Elasticsearch集群进行集中管理，以实现更高效的数据分析和查询。跨版本迁移：将低版本的第三方Elasticsearch集群数据迁移到高版本的华为云Elasticsearch集群中。技术栈统一：当企业已经在华为云上运行其他服务时，为了技术栈的统一和简化管理，可以选择将Elasticsearch集群也迁移至华为云。

云搜索服务 CSS ELasticsearch数据迁移
云搜索服务 CSS-通过备份与恢复迁移第三方Elasticsearch集群至华为云:操作步骤

操作步骤登录Elasticsearch所在的第三方友商云，创建一个支持s3协议的共享存储仓库，例如登录阿里云的进入OSS服务创建目录“patent-esbak”，或者登录腾讯云进入COS服务创建目录“patent-esbak”。在第三方Elasticsearch集群中创建快照备份仓库，用于存放Elasticsearch快照数据。例如，在Elasticsearch中创建一个备份仓库“my_backup”，关联到存储仓库OSS。 PUT _snapshot/my_backup { # 存储仓库类型。 "type": "oss", "settings": { # 步骤1中存储仓库的内网访问域名。 "endpoint": "http://oss-xxx.example.com", # 存储仓库的用户ID和密码。认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密, 确保安全；本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环境变量ak和sk。 "access_key_id": "ak", "secret_access_key": "sk", # 步骤1创建的存储仓库的bucket名称。 "bucket": "patent-esbak", # 是否打开快照文件的压缩功能。 "compress": false, # 配置此参数可以限制快照数据的分块大小。当上传的快照数据超过这个数值，数据就会被分块上传到存储仓库中。 "chunk_size": "1g", # 仓库的起始位置，默认是根目录。 "base_path": "snapshot/" } } 在第三方Elasticsearch集群中创建快照。为所有索引创建快照。例如，创建一个名为“snapshot_1”的快照。 PUT _snapshot/my_backup/snapshot_1?wait_for_completion=true 为指定索引创建快照。例如，创建一个名为“snapshot_test”的快照，该快照包含索引“patent_analyse”和“patent”。 PUT _snapshot/my_backup/snapshot_test { "indices": "patent_analyse,patent" } 在第三方Elasticsearch集群中查看集群的快照创建进度。执行如下命令，可以查看所有快照信息。 GET _snapshot/my_backup/_all 执行如下命令，可以查看指定快照“snapshot_1”的信息。 GET _snapshot/my_backup/snapshot_1 通过华为云对象存储迁移服务 OMS 将快照数据从存储仓库迁移到对象存储服务 OBS的“esbak”桶中。 OMS支持多种云服务商数据迁移到对象存储服务OBS中，具体请参见各云服务商迁移教程。在OMS创建迁移任务时，“元数据迁移方式”一定要选择“保留元数据”，否则数据迁移会有异常。在 CSS 服务的Elasticsearch集群中创建一个存储仓库关联到OBS，用于恢复第三方Elasticsearch的快照数据。例如，在集群中创建一个“my_backup_all”的存储仓库，关联上一步OBS桶“esbak”。 PUT _snapshot/my_backup_all/ { "type" : "obs", "settings" : { # OBS的内网访问域名。 "endpoint" : "obs.xxx.example.com", "region" : "xxx", # 访问OBS的用户名和密码。认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险, 建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全；本示例以ak和sk保存在环境变量中为例, 运行本示例前请先在本地环境中设置环境变量ak和sk。 "access_key": "ak", "secret_key": "sk", # OBS的桶名称，和上一步迁移目标集群的OBS桶名保持一致。 "bucket" : "esbak", "compress" : "false", "chunk_size" : "1g", # 注意“snapshot”后面没有/。 "base_path" : "snapshot", "max_restore_bytes_per_sec": "100mb", "max_snapshot_bytes_per_sec": "100mb" } } 在 CS S服务的Elasticsearch集群中通过快照恢复数据。查看所有快照信息。 GET _snapshot 通过快照恢复数据。恢复某一快照中的所有索引。例如恢复名为“snapshot_1”的快照的所有索引数据。 POST _snapshot/my_backup_all/snapshot_1/_restore?wait_for_completion=true 恢复某一快照中的部分索引。例如名为“snapshot_1”的快照中只恢复非“.”开头的索引。 POST _snapshot/my_backup/snapshot_1/_restore {"indices":"*,-.monitoring*,-.security*,-.kibana*","ignore_unavailable":"true"} 恢复某一快照中的指定索引，并重命名。例如在名为“snapshot_1”的快照中，将索引“index_1”恢复为“restored_index_1”，“index_2”恢复为“restored_index_2”。 POST /_snapshot/my_backup/snapshot_1/_restore { # 只恢复索引“index_1”和“index_2”，忽略快照中的其他索引。 "indices": "index_1,index_2" # 查找正在恢复的索引，该索引名称需要与提供的模板匹配。 "rename_pattern": "index_(.+)", # 重命名查找到的索引。 "rename_replacement": "restored_index_$1" } 查看快照恢复结果。查看所有快照的恢复结果。 GET /_recovery/ 查看指定索引的快照恢复结果。 GET {index_name}/_recovery

云搜索服务 CSS ELasticsearch数据迁移
高性能弹性文件服务 SFS TURBO-通过云专线迁移:背景说明

背景说明用户可以将本地NAS存储中的数据，通过云专线迁移至云上SFS Turbo文件系统中，进行云上业务拓展。此方案通过在云上创建一台Linux操作系统的云服务器，来连接本地NAS存储以及云上SFS Turbo文件系统的通信，并通过这台服务器将本地NAS存储中的数据迁移至云上。将云上NAS存储数据迁移至SFS Turbo文件系统中也可以参考本方案，具体说明请参考云上NAS数据迁移至高性能弹性文件服务。

高性能弹性文件服务 SFS TURBO 数据迁移
高性能弹性文件服务 SFS TURBO-通过云专线迁移:操作步骤

操作步骤登录弹性云服务器管理控制台。登录已创建好的Linux系统云服务器，用于同时访问本地NAS存储和云上SFS Turbo文件系统。输入以下挂载命令，用于访问本地NAS存储。 mount -t nfs -o vers=3,timeo=600,noresvport,nolock,tcp 本地NAS挂载地址 /mnt/src 输入以下挂载命令，用于访问云上文件系统。 mount -t nfs -o vers=3,timeo=600,noresvport,nolock,tcp 文件系统挂载地址 /mnt/dst 在Linux云服务器中执行以下命令安装rclone工具。 wget https://downloads.rclone.org/v1.53.4/rclone-v1.53.4-linux-amd64.zip --no-check-certificate unzip rclone-v1.53.4-linux-amd64.zip chmod 0755 ./rclone-*/rclone cp ./rclone-*/rclone /usr/bin/ rm -rf ./rclone-* 执行以下命令，进行数据同步。 rclone copy /mnt/src /mnt/dst -P --transfers 32 --checkers 64 --links --create-empty-src-dirs 参数说明如下，transfers和checkers数目可以根据系统规格自行配置： --transfers：传输文件的并发数目。 --checkers：扫描本地文件的并发数目。 -P：数据拷贝进度。 --links：复制源端的软链接，目的端保持为软链接的形式。 --copy-links：复制源端软链接指向的文件内容，目的端变成文件的形式，不再是软链接。 --create-empty-src-dirs：复制源端的空目录到目的端。等待数据完成同步后，可前往目标文件系统查看是否已成功迁移。

高性能弹性文件服务 SFS TURBO 数据迁移
数据仓库服务 GAUSSDB(DWS)-使用CDM迁移AnalyticDB for MySQL至GaussDB(DWS)集群:参考信息

参考信息表2 DataCheck目录说明文件或文件夹说明 DataCheck bin 保存校验工具入口脚本。 Windows版本：datacheck.bat Linux版本：datacheck.sh conf 配置文件，进行源数据库和目的数据库的连接配置和日志打印设置。 lib 保存校验工具运行所需的相关jar包。 check_input.xlsx 待校验的表信息，包括Schema名、表名、列名等。记录用户的校验级别信息和校验规则。已支持3种级别校验，包括high、middle、low，默认为low。 logs 压缩包中不包含该文件，校验工具执行后自动生成，记录工具运行过程日志。 check_input_result.xlsx 压缩包中不包含该文件，执行校验工具后会在check_input.xlsx相同路径下生成校验结果文件。

数据仓库服务 GAUSSDB(DWS) 数据迁移
数据仓库服务 GAUSSDB(DWS)-使用CDM迁移AnalyticDB for MySQL至GaussDB(DWS)集群:步骤三：数据一致性校验

步骤三：数据一致性校验迁移完成之后，可使用数据校验工具DataCheck校验源端、目标端的数据是否一致。下载软件包后，解压DataCheck-*.zip包，进入DataCheck-*目录，即可使用。目录下各文件的使用说明参见表2。配置工具包。 Windows环境下：打开conf文件夹中的dbinfo.properties文件，根据实际需要进行配置。ADB源的配置参考下图：图16 配置DataCheck 文件中的密码src.passwd和dws.passwd可使用工具，执行以下命令生成密文。 encryption.bat password 运行成功后会在本地bin目录下生成加密文件，如下图。 Linux环境下：其他步骤相同。密文生成方法与上文中Window环境下的方法类似，命令为sh encryption.sh [password]。执行数据校验。 Windows环境下：打开check.input文件，将要校验的数据库(不填默认使用conf配置文件内的内容)、源表、目标端表填入，Row Range可根据需要填写特定范围的数据查询语句。源端的库名在配置文件中配置后，check.input文件中的源端会默认填写配置文件中的库名，若check.input文件中填入其他库名，以check.input文件中的优先级为高。校验级别Check Strategy支持high、middle、low三种，若未填写，默认为low。下图为元数据对比的check_input文件。图17 check_input 在bin目录下使用命令datacheck.bat执行校验工具：查看已生成的校验结果 check_input_result.xlsx：下图为源端元数据与目标端一致的结果。下图为源端元数据与目标端不一致的结果。 Linux环境下：编辑check_input.xlsx文件并上传，参考Window环境下的第一步。使用命令sh datacheck.sh执行校验工具。查看校验结果check_input_result.xlsx（校验结果分析与Windows场景相同）。

数据仓库服务 GAUSSDB(DWS) 数据迁移
数据仓库服务 GAUSSDB(DWS)-使用CDM迁移Hologres至GaussDB(DWS)集群:参考信息

参考信息表2 DataCheck目录说明文件或文件夹说明 DataCheck bin 保存校验工具入口脚本。 Windows版本：datacheck.bat Linux版本：datacheck.sh conf 配置文件，进行源数据库和目的数据库的连接配置和日志打印设置。 lib 保存校验工具运行所需的相关jar包。 check_input.xlsx 待校验的表信息，包括Schema名、表名、列名等。记录用户的校验级别信息和校验规则。已支持3种级别校验，包括high、middle、low，默认为low。 logs 压缩包中不包含该文件，校验工具执行后自动生成，记录工具运行过程日志。 check_input_result.xlsx 压缩包中不包含该文件，执行校验工具后会在check_input.xlsx相同路径下生成校验结果文件。

数据仓库服务 GAUSSDB(DWS) 数据迁移
数据仓库服务 GAUSSDB(DWS)-使用CDM迁移Hologres至GaussDB(DWS)集群:步骤三：表数据校验

步骤三：表数据校验迁移完成之后，可使用数据校验工具DataCheck校验源端、目标端的数据是否一致。下载软件包后，解压DataCheck-*.zip包，进入DataCheck-*目录，即可使用。目录下各文件的使用说明参见表2 配置工具包。 Windows环境下：打开conf文件夹中的dbinfo.properties文件，根据实际需要进行配置。Holo源的配置参考下图：图16 配置DataCheck 文件中的密码src.passwd和dws.passwd可使用工具，执行以下命令生成密文。 encryption.bat password 运行成功后会在本地bin目录下生成加密文件，如下图。 Linux环境下：其他步骤相同。密文生成方法与上文中Window环境下的方法类似，命令为sh encryption.sh [password]。执行数据校验。 Windows环境下：打开check.input文件，将要校验的Schema、数据库、源表、目标端表填入，Row Range可根据需要填写特定范围的数据查询语句。源端的库名在配置文件中配置后，check.input文件中的源端会默认填写配置文件中的库名，若check.input文件中填入其他库名，以check.input文件中的优先级为高。校验级别Check Strategy支持high、middle、low三种，若未填写，默认为low。校验模式Check mode支持statistics，即统计值校验。下图为元数据对比的check_input文件。图17 check_input 在bin目录下使用命令datacheck.bat执行校验工具：查看已生成的校验结果 check_input_result.xlsx：下图为源端元数据与目标端一致的结果。下图为源端元数据与目标端不一致的结果。统计值校验参考下图。 Linux环境下：编辑check_input.xlsx文件并上传，参考Window环境下的第一步。使用命令sh datacheck.sh执行校验工具。查看校验结果check_input_result.xlsx（校验结果分析与Windows场景相同）。

数据仓库服务 GAUSSDB(DWS) 数据迁移
数据仓库服务 GAUSSDB(DWS)-使用CDM迁移Hologres至GaussDB(DWS)集群:步骤一：元数据迁移

步骤一：元数据迁移在Hologres中，使用以下SQL命令进行用户的角色和权限查询。 1 2 SELECT ROLNAME FROM pg_roles; SELECT user_display_name(ROLNAME) FROM pg_roles; 在 GaussDB (DWS)中，集群创建成功后，默认情况下未开启三权分立，数据库系统管理员具有与对象所有者相同的权限。默认只有对象所有者或者系统管理员可以查询、修改和销毁对象。根据Hologres的查询出的角色和权限，相应在GaussDB(DWS)中创建对应的角色和权限，并通过以下途径授权用户权限。使用GRANT将对象的权限授予其他用户。 1 2 GRANT USAGE ON SCHEMA schema TO user; GRANT SELECT ON TABLE schema.table To user; 使用户继承角色所拥有的对象权限。 1 2 CREATE ROLE role_name WITH CREATEDB PASSWORD '*******'; GRANT role_name to user; 导出源语法。源语法是客户业务的实现逻辑，从Hologres中导出源语法，再修改为适用于GaussDB(DWS)的语法，可以减少建模的工作量，提升业务迁移的效率。执行以下SQL进行全量语法导出。 1 SELECT hg_dump_script('schema_name.table_name'); 由于源语法涉及业务范围的识别，需熟悉业务的DBA进行操作，建议源语法由客户DBA提供。如果进行批量导出，可以使用UNION ALL将所有待查询表关联，语法格式如下： 1 2 3 4 SELECT hg_dump_script('schema_name.table_name') UNION ALL SELECT hg_dump_script('schema_name.table_name') … 如果执行失败，需要使用如下命令在DB中创建extension，然后再执行上述SQL。 1 CREATE EXTENSION hg_toolkit; 连接GaussDB(DWS)，执行以下SQL创建数据库，推荐使用MySQL兼容模式建库。 1 CREATE DATABASE tldg WITH ENCODING 'UTF-8' TEMPLATE template0 DBCOMPATIBILITY 'MYSQL'; 使用DSC工具对DDL语法进行转换。解压迁移前准备获取到的DSC工具包。将待转换的DDL语法文件放入DSC的input文件夹中。图2 input目录打开命令行工具，Windows环境下双击runDSC.bat。（Linux环境下运行runDSC.sh。）执行以下命令进行语法转换。 1 runDSC.bat -S Hologres 图3 DDL语法转换可以在output文件夹下查看转换结果。图4 DDL转换结果连接GaussDB(DWS)，执行上一步转换完成的DDL语句，完成建表。 DSC更多内容请参见DSC工具使用指导。

数据仓库服务 GAUSSDB(DWS) 数据迁移
数据仓库服务 GAUSSDB(DWS)-使用CDM迁移Hologres至GaussDB(DWS)集群:迁移前准备

迁移前准备已经购买了GaussDB(DWS)和 CDM 集群，参见CDM使用指南。需确保源Hologres集群、目标GaussDB(DWS)集群与CDM网络互通。本例GaussDB(DWS)和CDM创建在同一个区域、同一个网络私有云和子网下。迁移用户权限放通。源端和目标端客户端安装完成。已准备表1所列的迁移工具：DSC、DataCheck。 DataCheck运行环境满足以下要求：服务器：Linux或Windows服务器，支持64位操作系统。 JRE或JDK：系统已安装JRE 1.8。网络环境：安装、运行DataCheck工具的服务器，需要与待连接的数据库的网络互通。

数据仓库服务 GAUSSDB(DWS) 数据迁移
云数据迁移 CDM-支持的数据源（2.9.3.300）:整库迁移支持的数据源类型

整库迁移支持的数据源类型整库迁移适用于将本地数据中心或在ECS上自建的数据库，同步到云上的数据库服务或大数据服务中，适用于数据库离线迁移场景，不适用于在线实时迁移。数据集成支持整库迁移的数据源如表2所示。表2 整库迁移支持的数据源数据源分类数据源读取写入说明数据仓库数据仓库服务（DWS）支持支持 - Hadoop （仅支持本地存储，不支持存算分离场景，不支持Ranger场景，不支持ZK开启SSL场景） MRS HBase 支持支持整库迁移仅支持导出到MRS HBase。建议使用的版本： 2.1.X 1.3.X 当前暂不支持对接“Kerberos加密类型”为“aes256-sha2,aes128-sha2”的MRS集群。如需对接MRS集群，请注意“Kerberos加密类型”应为“aes256-sha1,aes128-sha1”。 MRS Hive 支持支持整库迁移仅支持导出到关系型数据库。暂不支持2.x版本，建议使用的版本： 1.2.X 3.1.X 当前暂不支持对接“Kerberos加密类型”为“aes256-sha2,aes128-sha2”的MRS集群。如需对接MRS集群，请注意“Kerberos加密类型”应为“aes256-sha1,aes128-sha1”。 FusionInsight HBase 支持不支持建议使用的版本： 2.1.X 1.3.X FusionInsight Hive 支持不支持整库迁移仅支持导出到关系型数据库。暂不支持2.x版本，建议使用的版本： 1.2.X 3.1.X Apache HBase 支持不支持建议使用的版本： 2.1.X 1.3.X Apache Hive 支持不支持整库迁移仅支持导出到关系型数据库。暂不支持2.x版本，建议使用的版本： 1.2.X 3.1.X MRS Hudi 支持支持支持本地存储、存算分离场景。暂不支持2.x版本，建议使用的版本： 1.2.X 3.1.X 当前暂不支持对接“Kerberos加密类型”为“aes256-sha2,aes128-sha2”的MRS集群。如需对接MRS集群，请注意“Kerberos加密类型”应为“aes256-sha1,aes128-sha1”。关系数据库云数据库 MySQL 支持支持不支持OLTP到OLTP迁移，此场景推荐通过数据复制服务 DRS进行迁移。云数据库 PostgreSQL 支持支持云数据库 SQL Server 支持支持 MySQL 支持不支持 PostgreSQL 支持不支持 Microsoft SQL Server 支持不支持 Oracle 支持不支持 SAP HANA 支持不支持仅支持2.00.050.00.1592305219版本。仅支持Generic Edition。不支持BW/4 FOR HANA。仅支持英文字母的数据库名、表名与列名，不支持存在空格、符号等特殊字符。仅支持日期、数字、布尔、字符（除SHORTTEXT）类型的数据类型，不支持二进制类型等其他数据类型。迁移时不支持目的端自动建表。达梦数据库 DM 支持不支持仅支持导出到DWS、Hive NoSQL 分布式缓存服务（DCS）不支持支持仅支持MRS到DCS迁移。文档数据库服务（DDS）支持支持仅支持DDS和MRS之间迁移。表格存储服务（CloudTable）支持支持 -

云数据迁移 CDM
云数据迁移 CDM-支持的数据源（2.9.3.300）:表/文件迁移支持的数据源类型

表/文件迁移支持的数据源类型表/文件迁移可以实现表或文件级别的数据迁移。表/文件迁移时支持的数据源如表1所示。表1 表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）数据仓库：数据仓库服务（DWS），数据湖探索（ DLI ），MRS ClickHouse Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）关系型数据库：云数据库 MySQL，云数据库 PostgreSQL，云数据库 SQL Server，MySQL，PostgreSQL，Microsoft SQL Server，Oracle NoSQL：表格存储服务（CloudTable）搜索：Elasticsearch，云搜索服务（CSS）不支持DWS物理机纳管模式。数据湖探索（DLI）数据仓库：数据仓库服务（DWS），数据湖探索（DLI），MRS ClickHouse Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）关系型数据库：云数据库 MySQL，云数据库 PostgreSQL，云数据库 SQL Server，MySQL，PostgreSQL，Microsoft SQL Server，Oracle NoSQL：表格存储服务（CloudTable），MongoDB 搜索：Elasticsearch，云搜索服务（CSS） MongoDB建议使用的版本：4.2。 MRS ClickHouse 数据仓库：MRS ClickHouse，数据湖探索（DLI） MRS ClickHouse建议使用的版本：21.3.4.X。当前暂不支持对接“Kerberos加密类型”为“aes256-sha2,aes128-sha2”的MRS集群。如需对接MRS集群，请注意“Kerberos加密类型”应为“aes256-sha1,aes128-sha1”。 Hadoop MRS HDFS 数据仓库：数据仓库服务（DWS），数据湖探索（DLI） Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）关系型数据库：云数据库 MySQL，云数据库 PostgreSQL，云数据库 SQL Server，MySQL，PostgreSQL，Microsoft SQL Server，Oracle NoSQL：表格存储服务（CloudTable）搜索：Elasticsearch，云搜索服务（CSS）支持本地存储，仅MRS Hive、MRS Hudi支持存算分离场景。仅MRS Hive支持Ranger场景。不支持ZK开启SSL场景。 MRS HDFS建议使用的版本： 2.8.X 3.1.X MRS HBase建议使用的版本： 2.1.X 1.3.X MRS Hive、MRS Hudi暂不支持2.x版本，建议使用的版本： 1.2.X 3.1.X 当前暂不支持对接“Kerberos加密类型”为“aes256-sha2,aes128-sha2”的MRS集群。如需对接MRS集群，请注意“Kerberos加密类型”应为“aes256-sha1,aes128-sha1”。 MRS HBase MRS Hive 数据仓库：数据仓库服务（DWS），数据湖探索（DLI），MRS Clickhouse Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）关系型数据库：云数据库 MySQL，云数据库 PostgreSQL，云数据库 SQL Server，MySQL，PostgreSQL，Microsoft SQL Server，Oracle NoSQL：表格存储服务（CloudTable）搜索：Elasticsearch，云搜索服务（CSS） MRS Hudi 数据仓库：数据仓库服务（DWS） Hadoop：MRS HBase FusionInsight HDFS 数据仓库：数据仓库服务（DWS），数据湖探索（DLI） Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS） NoSQL：表格存储服务（CloudTable）搜索：Elasticsearch，云搜索服务（CSS） FusionInsight数据源不支持作为目的端。仅支持本地存储，不支持存算分离场景。不支持Ranger场景。不支持ZK开启SSL场景。 FusionInsight HDFS建议使用的版本： 2.8.X 3.1.X FusionInsight HBase建议使用的版本： 2.1.X 1.3.X FusionInsight Hive建议使用的版本： 1.2.X 3.1.X FusionInsight HBase FusionInsight Hive Apache HBase 数据仓库：数据仓库服务（DWS），数据湖探索（DLI） Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS） NoSQL：表格存储服务（CloudTable）搜索：Elasticsearch，云搜索服务（CSS） Apache数据源不支持作为目的端。仅支持本地存储，不支持存算分离场景。不支持Ranger场景。不支持ZK开启SSL场景。 Apache HBase建议使用的版本： 2.1.X 1.3.X Apache Hive暂不支持2.x版本，建议使用的版本： 1.2.X 3.1.X Apache HDFS建议使用的版本： 2.8.X 3.1.X Apache Hive Apache HDFS 对象存储对象存储服务（OBS）数据仓库：数据仓库服务（DWS），数据湖探索（DLI） Hadoop：MRS HDFS，MRS HBase，MRS Hive NoSQL：表格存储服务（CloudTable）搜索：Elasticsearch，云搜索服务（CSS）对象存储服务之间的迁移，推荐使用对象存储迁移服务OMS。不支持二进制文件导入到数据库或NoSQL。文件系统 FTP 数据仓库：数据仓库服务（DWS），数据湖探索（DLI） Hadoop：MRS HDFS，MRS HBase，MRS Hive NoSQL：表格存储服务（CloudTable）搜索：Elasticsearch，云搜索服务（CSS）对象存储：对象存储服务（OBS）文件系统不支持作为目的端。 FTP/SFTP到搜索的迁移仅支持如CSV等文本文件，不支持二进制文件。 FTP/SFTP到OBS的迁移仅支持二进制文件。 HTTP到OBS的迁移推荐使用obsutil工具，请参见obsutil简介。 SFTP HTTP Hadoop：MRS HDFS 关系型数据库云数据库 MySQL 数据仓库：数据仓库服务（DWS），数据湖探索（DLI） Hadoop：MRS HDFS，MRS HBase，MRS Hive，MRS Hudi 对象存储：对象存储服务（OBS） NoSQL：表格存储服务（CloudTable）关系型数据库：云数据库 MySQL，云数据库 PostgreSQL，云数据库 SQL Server 搜索：Elasticsearch，云搜索服务（CSS） Microsoft SQL Server建议使用的版本：2005以上。金仓和GaussDB数据源可通过PostgreSQL连接器进行连接，支持的迁移作业的源端、目的端情况与PostgreSQL数据源一致。云数据库 SQL Server 数据仓库：数据仓库服务（DWS），数据湖探索（DLI） Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS） NoSQL：表格存储服务（CloudTable）关系型数据库：云数据库 MySQL，云数据库 PostgreSQL，云数据库 SQL Server 搜索：Elasticsearch，云搜索服务（CSS）云数据库 PostgreSQL MySQL 数据仓库：数据仓库服务（DWS），数据湖探索（DLI） Hadoop：MRS HDFS，MRS HBase，MRS Hive，MRS Hudi 对象存储：对象存储服务（OBS） NoSQL：表格存储服务（CloudTable）搜索：Elasticsearch，云搜索服务（CSS） PostgreSQL Oracle Microsoft SQL Server 数据仓库：数据仓库服务（DWS），数据湖探索（DLI） Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS） NoSQL：表格存储服务（CloudTable）搜索：Elasticsearch，云搜索服务（CSS） SAP HANA 数据仓库：数据仓库服务（DWS），数据湖探索（DLI） Hadoop：MRS Hive SAP HANA数据源存在如下约束： SAP HANA不支持作为目的端。仅支持2.00.050.00.1592305219版本。仅支持Generic Edition。不支持BW/4 FOR HANA。仅支持英文字母的数据库名、表名与列名，不支持存在空格、符号等特殊字符。仅支持日期、数字、布尔、字符（除SHORTTEXT）类型的数据类型，不支持二进制类型等其他数据类型。迁移时不支持目的端自动建表。分库数据仓库：数据湖探索（DLI） Hadoop：MRS HBase，MRS Hive 搜索：Elasticsearch，云搜索服务（CSS）对象存储：对象存储服务（OBS）分库数据源不支持作为目的端。神通（ST） Hadoop：MRS Hive，MRS Hudi - NoSQL 分布式缓存服务（DCS） Hadoop：MRS HDFS，MRS HBase，MRS Hive 除了表格存储服务（CloudTable）外，其他NoSQL数据源不支持作为目的端。 Redis到DCS的迁移，可以通过其他方式进行，请参见自建Redis迁移至DCS。 Redis 文档数据库服务（DDS） MongoDB 表格存储服务（CloudTable HBase）数据仓库：数据仓库服务（DWS），数据湖探索（DLI） Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）关系型数据库：云数据库 MySQL，云数据库 PostgreSQL，云数据库 SQL Server，MySQL，PostgreSQL，Microsoft SQL Server，Oracle NoSQL：表格存储服务（CloudTable）搜索：Elasticsearch，云搜索服务（CSS） Cassandra 数据仓库：数据仓库服务（DWS），数据湖探索（DLI） Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS） NoSQL：表格存储服务（CloudTable）搜索：Elasticsearch，云搜索服务（CSS）消息系统数据接入服务（DIS）搜索：云搜索服务（CSS）消息系统不支持作为目的端。 Apache Kafka DMS Kafka MRS Kafka 数据仓库：数据仓库服务（DWS），数据湖探索（DLI） Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）关系型数据库：云数据库 MySQL，云数据库 PostgreSQL，云数据库 SQL Server NoSQL：表格存储服务（CloudTable）搜索：Elasticsearch，云搜索服务（CSS） MRS Kafka不支持作为目的端。仅支持本地存储，不支持存算分离场景。不支持Ranger场景。不支持ZK开启SSL场景。当前暂不支持对接“Kerberos加密类型”为“aes256-sha2,aes128-sha2”的MRS集群。如需对接MRS集群，请注意“Kerberos加密类型”应为“aes256-sha1,aes128-sha1”。搜索 Elasticsearch 数据仓库：数据仓库服务（DWS），数据湖探索（DLI） Hadoop：MRS HDFS，MRS HBase，MRS Hive 对象存储：对象存储服务（OBS）关系型数据库：云数据库 MySQL，云数据库 PostgreSQL，云数据库 SQL Server NoSQL：表格存储服务（CloudTable）搜索：Elasticsearch，云搜索服务（CSS） Elasticsearch仅支持非安全模式。云搜索服务（CSS）导入数据到CSS推荐使用Logstash，请参见使用Logstash导入数据到Elasticsearch。上表中非云服务的数据源，例如MySQL，既可以支持用户本地数据中心自建的MySQL，也可以是用户在ECS上自建的MySQL，还可以是第三方云的MySQL服务。

云数据迁移 CDM
云数据迁移 CDM-Kafka连接参数说明:Apache Kafka

Apache Kafka Apache Kafka连接适用于用户在本地数据中心或ECS上自建的第三方Kafka，其中本地数据中心的Kafka需通过专线连接。连接Apache Hadoop上的Kafka数据源时，相关参数如表2所示。表2 Apache Kafka连接参数参数名说明取值样例名称连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 kafka_link Kafka broker Kafka broker的IP地址和端口。 192.168.1.1:9092 单击“显示高级属性”，然后单击“添加”，您可以添加客户端的配置属性。所添加的每个属性需配置属性名称和值。对于不再需要的属性，可单击属性后的“删除”按钮进行删除。

云数据迁移 CDM
云数据迁移 CDM-Kafka连接参数说明:MRS Kafka

MRS Kafka 连接MRS上的Kafka数据源时，相关参数如表1所示。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。表1 MRS Kafka连接参数参数名说明取值样例名称连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 kafka_link Manager IP MRS Manager的浮动IP地址，可以单击输入框后的“选择”来选定已创建的MRS集群，CDM会自动填充下面的鉴权参数。说明：当前 DataArts Studio 不支持对接“Kerberos加密类型”为“aes256-sha2,aes128-sha2”的MRS集群。如需对接MRS集群，请注意“Kerberos加密类型”应为“aes256-sha1,aes128-sha1”。 127.0.0.1 用户名需要配置MRS Manager的用户名和密码。如果要创建MRS安全集群的数据连接，不能使用admin用户。因为admin用户是默认的管理页面用户，这个用户无法作为安全集群的认证用户来使用。您可以创建一个新的MRS用户，然后在创建MRS数据连接时，“用户名”和“密码”填写为新建的MRS用户及其密码。说明：如果CDM集群为2.9.0版本及之后版本，且MRS集群为3.1.0及之后版本，则所创建的用户至少需具备Manager_viewer的角色权限才能在CDM创建连接；如果需要对MRS组件的库、表、列进行操作，还需要参考MRS文档添加对应组件的库、表、列操作权限。如果CDM集群为2.9.0之前的版本，或MRS集群为3.1.0之前的版本，则所创建的用户需要具备Manager_administrator或System_administrator权限，才能在CDM创建连接。仅具备Manager_tenant或Manager_auditor权限，无法创建连接。 - 密码访问MRS Manager的用户密码。 - 认证类型访问MRS的认证类型： SIMPLE：非安全模式选择Simple鉴权。 KERBEROS：安全模式选择Kerberos鉴权。是单击“显示高级属性”，然后单击“添加”，您可以添加客户端的配置属性。所添加的每个属性需配置属性名称和值。对于不再需要的属性，可单击属性后的“删除”按钮进行删除。

云数据迁移 CDM
云数据迁移 CDM-PostgreSQL/SQLServer连接参数说明

PostgreSQL/SQLServer连接参数说明连接PostgreSQL/SQLServer时，相关参数如表1所示，金仓和GaussDB数据源可通过PostgreSQL连接器进行连接，支持的迁移作业的源端、目的端情况与PostgreSQL数据源一致。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。表1 PostgreSQL/SQLServer连接参数参数名说明取值样例名称连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 sql_link 数据库服务器配置为要连接的数据库的IP地址或域名。单击输入框后的“选择”，可获取用户的实例列表。 192.168.0.1 端口配置为要连接的数据库的端口。不同的数据库端口不同，请根据具体情况配置。例如： SQLServer默认端口：1433 PostgreSQL默认端口：5432 数据库名称配置为要连接的数据库名称。 dbname 用户名待连接数据库的用户。该数据库用户需要有数据表的读写权限，以及对元数据的读取权限。 cdm 密码用户名密码。 - 使用Agent Agent功能待下线，无需配置。 - Agent Agent功能待下线，无需配置。 - 驱动类名根据上传驱动选择对应驱动类名。当前支持postgresql和kingbase8两种驱动类名。 - 引用符号可选参数，连接引用表名或列名时的分隔符号，参考对应数据库的产品文档进行配置。 " 驱动版本不同类型的关系数据库，需要适配不同的驱动，更多详情请参见如何获取驱动。 - 单次请求行数可选参数，单击“显示高级属性”后显示。指定每次请求获取的行数，根据数据源端和作业数据规模的大小配置该参数。如果配置过大或过小，可能影响作业的时长。 1000 单次提交行数可选参数，单击“显示高级属性”后显示。指定每次批量提交的行数，根据数据目的端和作业数据规模的大小配置该参数。如果配置过大或过小，可能影响作业的时长。 10000 SSL加密可选参数，控制是否通过SSL加密方式连接数据库。是连接属性可选参数，单击“添加”可增加多个指定数据源的JDBC连接器的属性，参考对应数据库的JDBC连接器说明文档进行配置。常见配置举例如下： connectTimeout=60与socketTimeout=300：迁移数据量较大、或通过查询语句检索全表时，会由于连接超时导致迁移失败。此时可自定义连接超时时间与socket超时时间（单位s），避免超时导致失败。 useCursorFetch=false：CDM作业默认打开了JDBC连接器与关系型数据库通信使用二进制协议开关，即useCursorFetch=true。部分第三方可能存在兼容问题导致迁移时间转换出错，可以关闭此开关。 trustServerCertificate=true：在创建安全连接的时候可能会报PKIX错误，建议设置为true。 sslmode=require 连接私密属性可选参数，单击“显示高级属性”后显示。自定义私密连接属性。 sk=09fUgD5WOF1L6f 父主题：配置连接参数

云数据迁移 CDM