华为云用户手册

云数据迁移 CDM-日志提示解析日期格式失败时怎么处理？:解决方案

解决方案编辑作业，进入作业的字段映射步骤，在源端的时间格式字段后面，选择新建转换器，如图3所示。图3 新建转换器转换器类型选择“表达式转换”，目前表达式转换支持字符串和日期类型的函数，语法和Java的字符串和时间格式函数非常相似，可以查看表达式转换了解如何编写表达式。本例中源时间格式是“yyyy/MM/dd HH:mm:ss”，要将其转换成“yyyy-MM-dd HH:mm:ss.SSS Z”，需要经过如下几步：添加时区信息“+0800”到原始日期字符串的尾部，对应的表达式为：value+" +0800"。使用原始日期格式来解析字符串，将字符串解析为一个日期对象。可以使用DateUtils.parseDate函数来解析，语法是：DateUtils.parseDate(String value, String format)。将日期对象格式化成目标格式的字符串，可以使用DateUtils.format函数来格式化，语法是DateUtils.format(Date date, String format)。因此本例中串起来完整的表达式是：DateUtils.format(DateUtils.parseDate(value+" +0800","yyyy/MM/dd HH:mm:ss Z"),"yyyy-MM-dd HH:mm:ss.SSS Z")，如图4所示。图4 配置表达式保存转换器配置，再保存并运行作业，可解决云搜索服务的解析日期格式失败问题。

云数据迁移 CDM 故障处理类
云数据迁移 CDM-日志提示解析日期格式失败时怎么处理？:原因分析

原因分析云搜索服务对于时间类型有一个特殊处理：如果存储的时间数据不带时区信息，在Kibana可视化的时候，Kibana会认为该时间为GMT标准时间。在各个地区会产生日志显示时间与本地时区时间不一致的现象，例如，在东八区某地，日志显示时间比本地时区时间少8个小时。因此在 CDM 迁移数据到云搜索服务的时候，如果是通过CDM自动创建的索引和类型（例如图2中，目的端的“date_test”和“test1”在云搜索服务中不存在时，CDM会在云搜索服务中自动创建该索引和类型），则CDM默认会将时间类型字段的格式设置为“yyyy-MM-dd HH:mm:ss.SSS Z”的标准格式，例如“2018-01-08 08:08:08.666 +0800”。图2 作业配置此时，从其他数据源导入数据到云搜索服务时，如果源端数据中的日期格式不完全满足标准格式，例如“2018/01/05 15:15:46”，则CDM作业会执行失败，日志提示无法解析日期格式。需要通过CDM配置字段转换器，将日期字段的格式转换为云搜索服务的目的端格式。

云数据迁移 CDM 故障处理类
云数据迁移 CDM-配置OBS源端参数

配置OBS源端参数作业中源连接为OBS连接时，源端作业参数如表1所示。高级属性里的参数为可选参数，默认隐藏，单击界面上的“显示高级属性”后显示。表1 源端为OBS时的作业参数参数类型参数名说明取值样例基本参数桶名待迁移数据所在的桶名。 BUCKET_2 源目录或文件 “列表文件”选择为“否”时，才有该参数。待迁移数据的目录或单个文件路径。文件路径支持输入多个文件（最多50个），默认以“|”分隔，也可以自定义文件分隔符，具体请参见文件列表迁移。待迁移数据的目录，将迁移目录下的所有文件（包括所有嵌套子目录及其子文件）。该参数支持配置为时间宏变量，且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合，可以实现定期同步新增数据，详细说明请参见使用时间宏变量完成增量同步。说明：如果配置了时间宏变量，通过 DataArts Studio 数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 FROM/example.csv 文件格式指CDM以哪种格式解析数据，可选择以下格式： CS V格式：以CSV格式解析源文件，用于迁移文件到数据表的场景。二进制格式：选择“二进制格式”时不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。 JSON格式：以JSON格式解析源文件，一般都是用于迁移文件到数据表的场景。 CSV格式列表文件当“文件格式”选择为“二进制格式”时，才有该参数。打开列表文件功能时，支持读取OBS桶中文件（如txt文件）的内容作为待迁移文件的列表。该文件中的内容应为待迁移文件的绝对路径（不支持目录），例如直接写为如下内容： /052101/DAY20211110.data /052101/DAY20211111.data 是列表文件源连接当“列表文件”选择为“是”时，才有该参数。可选择列表文件所在的OBS连接。 OBS_test_link 列表文件OBS桶当“列表文件”选择为“是”时，才有该参数。该参数表示列表文件所在的OBS桶名。 01 列表文件或目录当“列表文件”选择为“是”时，才有该参数。该参数表示列表文件所在的OBS桶中的绝对路径或目录。此处建议选择为文件的绝对路径。当选择为目录时，也支持迁移子目录中的文件，但如果目录下文件量过大，可能会导致集群内存不足。 /0521/Lists.txt JSON类型当“文件格式”选择为“JSON格式”时，才有该参数。JSON文件中存储的JSON对象的类型，可以选择“JSON对象”或“JSON数组”。 JSON对象记录节点当“文件格式”选择为“JSON格式”并且“JSON类型”为“JSON对象”时，才有该参数。对该JSON节点下的数据进行解析，如果该节点对应的数据为JSON数组，那么系统会以同一模式从该数组中提取数据。多层嵌套的JSON节点以字符“.”分割。 data.list 高级属性换行符文件中的换行符，默认自动识别“\n”、“\r”或“\r\n”。当“文件格式”选择为“CSV格式”时，才有该参数。 \n 字段分隔符文件中的字段分隔符，使用Tab键作为分隔符请输入“\t”。当“文件格式”选择为“CSV格式”时，才有该参数。 , 使用包围符选择“是”时，包围符内的字段分隔符会被视为字符串值的一部分，目前CDM默认的包围符为："。否使用转义符选择“是”时，CSV数据行中的\作为转义符使用。选择“否”时，CSV中的\作为数据不会进行转义。CSV只支持\作为转义符。是使用正则表达式分隔字段选择是否使用正则表达式分隔字段，当选择“是”时，“字段分隔符”参数无效。当“文件格式”选择为“CSV格式”时，才有该参数。是正则表达式分隔字段的正则表达式，正则表达式写法请参考正则表达式分隔半结构化文本。 ^(\d.*\d) (\w*) \[(.*)\] ([\w\.]*) (\w.*).* 前N行为标题行 “文件格式”选择“CSV格式”时才有该参数。在迁移CSV文件到表时，CDM默认是全部写入，如果该参数选择“是”，CDM会将CSV文件的前N行数据作为标题行，不写入目的端的表。否标题行数 “前N行为标题行”选择“是”时才有该参数。抽取数据时将被跳过的标题行数。说明：标题行数不为空，取值为1-99之间的整数。 1 解析首行为列名 “前N行为标题行”选择“是”时才有该参数。选择是否将标题的首行解析为列名，在配置字段映射时会在原字段中显示该列名。说明：标题行数大于1时，当前仅支持解析标题的首行作为列名。列名不支持“&”字符，否则会导致作业迁移失败，需修改CSV文件“&”字符即可正常迁移。是编码类型文件编码类型，例如：“UTF-8”或“GBK”。只有文本文件可以设置编码类型，当“文件格式”选择为“二进制格式”时，该参数值无效。 GBK 压缩格式选择对应压缩格式的源文件：无：表示传输所有格式的文件。 GZIP：表示只传输GZIP格式的文件。 ZIP：表示只传输ZIP格式的文件。 TAR.GZ：表示只传输TAR.GZ格式的文件。无压缩文件后缀压缩格式非无时，显示该参数。该参数需要解压缩的文件后缀名。当一批文件中以该值为后缀时，才会执行解压缩操作，否则保持原样传输。当输入*或为空时，所有文件都会被解压。 * 启动作业标识文件选择是否开启作业标识文件的功能。当源端路径下存在启动作业的标识文件时才启动作业，否则会挂起等待一段时间，等待时长在下方“等待时间”中配置。否标识文件名选择开启作业标识文件的功能时，需要指定启动作业的标识文件名。指定文件后，只有在源端路径下存在该文件的情况下才会运行任务。该文件本身不会被迁移。 ok.txt 等待时间选择开启作业标识文件的功能时，如果源路径下不存在启动作业的标识文件，作业挂机等待的时长，当超时后任务会失败。等待时间设置为0时，当源端路径下不存在标识文件，任务会立即失败。单位：秒。 10 文件分隔符 “源目录或文件”参数中如果输入的是多个文件路径，CDM使用这里配置的文件分隔符来区分各个文件，默认为|。 | 过滤类型满足过滤条件的路径或文件会被传输，该参数有“无”、“通配符”和“正则表达式”三种选择。具体使用方法可参见文件增量迁移。通配符目录过滤器 “过滤类型”选择“通配符”、“正则表达式”时，用通配符过滤目录，符合过滤器规则的目录，允许进行迁移。支持配置多个路径，中间使用“,”分隔。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 *input 文件过滤器 “过滤类型”选择“通配符”、“正则表达式”时，用通配符过滤目录下的文件，符合过滤器规则的文件，允许进行迁移。支持配置多个文件，中间使用“,”分隔。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 *.csv,*.txt 时间过滤选择“是”时，可以根据文件的修改时间，选择性的传输文件。是起始时间 “过滤类型”选择“时间过滤器”时，可以指定一个时间值，当文件的修改时间大于等于该时间才会被传输，输入的时间格式需为“yyyy-MM-dd HH:mm:ss”。该参数支持配置为时间宏变量，例如${timestamp(dateformat(yyyy-MM-dd HH:mm:ss,-90,DAY))}表示：只迁移最近90天内的文件。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 2019-06-01 00:00:00 终止时间 “过滤类型”选择“时间过滤器”时，可以指定一个时间值，当文件的修改时间小于该时间才会被传输，输入的时间格式需为“yyyy-MM-dd HH:mm:ss”。该参数支持配置为时间宏变量，例如${timestamp(dateformat(yyyy-MM-dd HH:mm:ss))}表示：只迁移修改时间为当前时间以前的文件。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 2019-07-01 00:00:00 忽略不存在原路径/文件如果将其设为是，那么作业在源路径不存在的情况下也能成功执行。否 MD5文件名后缀 “文件格式”选择“二进制格式”时，该参数才显示。校验CDM抽取的文件，是否与源文件一致，详细请参见MD5校验文件一致性。 .md5 迁移文件或对象时支持文件级增量迁移（通过配置跳过重复文件实现），但不支持断点续传。例如要迁移3个文件，第2个文件迁移到一半时由于网络原因失败，再次启动迁移任务时，会跳过第1个文件，从第2个文件开始重新传，但不能从第2个文件失败的位置重新传。文件迁移时，单个任务支持千万数量的文件，如果待迁移目录下文件过多，建议拆分到不同目录并创建多个任务。父主题：配置CDM作业源端参数

云数据迁移 CDM
云数据迁移 CDM-配置DIS源端参数

配置DIS源端参数消息体中的数据是一条类似CSV格式的记录，可以支持多种分隔符。不支持二进制格式或其他格式的消息内容解析。作业中源连接为DIS连接时，源端作业参数如所表1示。表1 DIS作为源端时的作业参数参数类型参数说明取值样例基本参数 DIS通道 DIS的通道名。 dis 是否持久运行用户自定义是否永久运行。设置为长久运行的任务，如果DIS系统发生中断，任务也会失败结束。是 DIS分区ID DIS分区ID，该参数支持输入多个分区ID，使用英文逗号（,）分隔。 0,1,2 偏移量参数设置从DIS拉取数据时的初始偏移量：最新：最大偏移量，即拉取最新的数据。上次停止处：从上次停止处继续读取。最早：最小偏移量，即拉取最早的数据。最新 APP名字配置用户数据消费程序的唯一标识符，不存在时会自动创建。 cdm 数据格式解析数据时使用的格式：二进制格式：适用于文件迁移场景，不解析数据内容原样传输。 CSV格式：以CSV格式解析源数据。 JSON格式：以JSON格式解析源数据。二进制格式字段分隔符数据格式为“CSV格式”时呈现此参数。默认为逗号，使用Tab键作为分隔符请输入“\t”。 , 记录分隔符数据格式为“CSV格式”或“JSON格式”时呈现此参数。用于配置每条记录之间的分割符。 , 高级属性最大消息数/poll 可选参数，每次向DIS请求数据限制最大请求记录数。 100 父主题：配置CDM作业源端参数

云数据迁移 CDM
云数据迁移 CDM-支持的数据类型:达梦数据库迁移时支持的数据类型

达梦数据库迁移时支持的数据类型源端为达梦数据库，目的端为Hive、DWS时，支持的数据类型如下：表12 达梦数据库作为源端时支持的数据类型类别类型简要释义存储格式示例 Hive DWS 字符 CHAR 用于存储指定定长字符串。 ‘a’或‘aaaaa’ CHAR CHAR CHARACTER 与 CHAR 相同。 ‘a’或‘aaaaa’ CHAR CHAR VARCHAR 用于存储指定变长字符串. ‘a’或‘aaaaa’ VARCHAR VARCHAR VARCHAR2 与 VARCHAR 相同。 ‘a’或‘aaaaa’ VARCHAR VARCHAR 数值 NUMERIC 用于存储零、正负定点数。 52.36 DECIMAL NUMERIC DECIMAL 与 NUMERIC 相似。 52.36 DECIMAL NUMERIC DEC 与 DECIMAL 相同。 52.36 DECIMAL NUMERIC INTEGER 用于存储有符号整数，精度为10，标度为0。 5236 INT INTEGER INT 与 INTEGER 相同。 5236 INT INTEGER BIGINT 用于存储有符号整数，精度为19，标度为0。 5236 BIGINT BIGINT TINYINT 用于存储有符号整数，精度为3，标度为0。 100 TINYINT SMALLINT SMALLINT 用于存储有符号整数，精度为5，标度为0。 9999 SMALLINT SMALLINT BYTE 与 TINYINT 相似，精度为3，标度为0。 100 TINYINT SMALLINT BINARY 用于存储定长二进制数据。 0x2A3B4058 BINARY（NULL） BYTEA（NULL） VARBINARY 用于存储可变长二进制数据。 0x2A3B4058 BINARY（NULL） BYTEA（NULL） FLOAT 用于存储带二进制精度的浮点数。 52.36 FLOAT FLOAT8 DOUBLE 与FLOAT类似。 52.36 DOUBLE FLOAT8 REAL 用于存储带二进制精度的浮点数，但它不能由用户指定使用的精度。 52.3 FLOAT FLOAT4 DOUBLE PRECISION 用于存储指明双精度的浮点数。 52.3 DOUBLE FLOAT8 位串 BIT 用于存储整数数据 1、0 或 NULL。 1、0 或 NULL TINYINT（1 0 NULL） BOOLEAN（true false NULL）日期时间 DATE 用于存储年、月、日信息。 1999-10-01'、'1999/10/01'或'1999.10.01' DATE TIMESTAMP TIME 用于存储时、分、秒信息。 '09:10:21'或'9:10:21' 不支持（String） TIME TIMESTAMP 用于存储年、月、日、时、分、秒信息。 2002-12-12 09:10:21'，'2002-12-12 9:10:21' '2002/12/12 09:10:21' 或'2002.12.12 09:10:21' TIMESTAMP TIMESTAMP TIME WITH TIME ZONE 用于存储一个带时区的 TIME 值，其定义是在 TIME 类型的后面加上时区信息。 '09:10:21 +8:00'， '09:10:21+8:00'或'9:10:21+8:00' 不支持（String） TIME WITH TIME ZONE TIMESTAMP WITH TIME ZONE 用于存储一个带时区的 TIMESTAMP 值，其定义是TIMESTAMP类型的后面加上时区信息。 2002-12-12 09:10:21 +8:00'，'2002-12-12 9:10:21 +8:00' '2002/12/12 09:10:21 +8:00'或'2002.12.12 09:10:21 +8:00' TIMESTAMP TIMESTAMP WITH TIME ZONE TIMESTAMP WITH LOCAL TIME ZONE 用于存储一个本地时区的 TIMESTAMP 值，能够将标准时区类型 TIMESTAMP WITH TIME ZONE 类型转化为本地时区类型。 2002-12-12 09:10:21 +8:00'，'2002-12-12 9:10:21 +8:00' '2002/12/12 09:10:21 +8:00'或'2002.12.12 09:10:21 +8:00' 不支持（String）不支持（TEXT） DATETIME WITH TIME ZONE 同TIMESTAMP WITH TIME ZONE。 2002-12-12 09:10:21 +8:00'，'2002-12-12 9:10:21 +8:00' '2002/12/12 09:10:21 +8:00'或'2002.12.12 09:10:21 +8:00' TIMESTAMP TIMESTAMP WITH TIME ZONE INTERVAL YEAR 描述一个若干年的间隔，引导精度规定了年的取值范围。 INTERVAL '0015' YEAR 不支持（String）不支持（VARCHAR） INTERVAL YEAR TO MONTH 描述一个若干年若干月的间隔，引导精度规定了年的取值范围。 INTERVAL '0015-08' YEAR TO MONTH 不支持（String）不支持（VARCHAR） INTERVAL MONTH 描述一个若干月的间隔，引导精度规定了月的取值范围。 INTERVAL '0015' MONTH 不支持（String）不支持（VARCHAR） INTERVAL DAY 描述一个若干日的间隔，引导精度规定了日的取值范围。 INTERVAL '150' DAY 不支持（String）不支持（VARCHAR） INTERVAL DAY TO HOUR 描述一个若干日若干小时的间隔，引导精度规定了日的取值范围。 INTERVAL '9 23' DAY TO HOUR 不支持（String）不支持（VARCHAR） INTERVAL DAY TO MINUTE 描述一个若干日若干小时若干分钟的间隔，引导精度规定了日的取值范围。 INTERVAL '09 23:12' DAY TO MINUTE 不支持（String）不支持（VARCHAR） INTERVAL DAY TO SECOND 描述一个若干日若干小时若干分钟若干秒的间隔，引导精度规定了日的取值范围。 INTERVAL '09 23:12:01.1' DAY TO SECOND 不支持（String）不支持（VARCHAR） INTERVAL HOUR 描述一个若干小时的间隔，引导精度规定了小时的取值范围。 INTERVAL '150' HOUR 不支持（String）不支持（VARCHAR） INTERVAL HOUR TO MINUTE 描述一个若干小时若干分钟的间隔，引导精度规定了小时的取值范围。 INTERVAL '23:12' HOUR TO MINUTE 不支持（String）不支持（VARCHAR） INTERVAL HOUR TO SECOND 描述一个若干小时若干分钟若干秒的间隔，引导精度规定了小时的取值范围。 INTERVAL '23:12:01.1' HOUR TO SECOND 不支持（String）不支持（VARCHAR） INTERVAL MINUTE 描述一个若干分钟的间隔，引导精度规定了分钟的取值范围。 INTERVAL '150' MINUTE 不支持（String）不支持（VARCHAR） INTERVAL MINUTE TO SECOND 描述一个若干分钟若干秒的间隔，引导精度规定了分钟的取值范围。 INTERVAL '12:01.1' MINUTE TO SECOND 不支持（String）不支持（VARCHAR） INTERVAL SECOND 描述一个若干秒的间隔，引导精度规定了秒整数部分的取值范围。 INTERVAL '51.1' SECOND 不支持（String）不支持（VARCHAR）多媒体 IMAGE IMAGE 用于指明多媒体信息中的图像类型。图像由不定长的像素点阵组成，长度最大为 2G-1 字节。该类型除了存储图像数据之外，还可用于存储任何其它二进制数据。 0x2A3B4058 （二进制数据）不支持不支持 LONGVARBINARY 与IMAGE相同。 0x2A3B4059 （二进制数据）不支持不支持 TEXT 用于存储长字符串类型，其字符串的长度最大为 2G-1，存储长的文本串。 0x5236（二进制数据）不支持不支持 LONGVARCHAR 与 TEXT 相似。 0x5236（二进制数据）不支持不支持 BLOB 用于存储变长的二进制大对象，长度最大为2G-1字节。 0x5236（二进制数据）不支持不支持 CLOB 用于存储变长的二进制大对象，长度最大为2G-1字节。 0x5236（二进制数据）不支持不支持 BFILE 用于指明存储在操作系统中的二进制文件，文件存储在操作系统而非数据库中，仅能进行只读访问。 - 不支持不支持

云数据迁移 CDM 支持的数据源
云数据迁移 CDM-支持的数据类型:Doris数据库迁移时支持的数据类型

Doris数据库迁移时支持的数据类型源端为Doris数据库时，支持的数据类型如下：表11 Doris作为源端时支持的数据类型类别类型简要释义字符串 CHAR（M）范围：char[（length）]，定长字符串，长度length范围是1~255，默认为1。 VARCHAR（M）范围：char（length），变长字符串，长度length范围是1~65535。数值 DECIMAL（M，D）非压缩浮点数不能是无符号的。在解包小数，每个小数对应于一个字节。定义显示长度（M）和小数（D）的数量是必需的。 NUMERIC是DECIMAL的同义词。数值类型 TINYINT 长度：长度为1个字节的有符号整型。范围：[-128， 127]。 SMALLINT 长度：长度为2个字节的有符号整型。范围：[-32768， 32767]。 INT 长度：长度为4个字节的有符号整型。范围：[-2147483648， 2147483647]。 BIGINT 长度：长度为8个字节的有符号整型。范围：[-9223372036854775808， 9223372036854775807]。 LARGEINT 长度：长度为16个字节的有符号整型。范围：[-2^127， 2^127-1]。 FLOAT 长度：长度为4字节的浮点类型。范围：-3.40E+38 ~ +3.40E+38。 DOUBLE 长度：长度为8字节的浮点类型。范围：-1.79E+308 ~ +1.79E+308。 DECIMAL[M， D] 保证精度的小数类型。M代表一共有多少个有效数字，D代表小数点后最多有多少数字。M的范围是[1，27]，D的范围是[1，9]，另外，M必须要大于等于D的取值。默认取值为decimal[10，0]。 precision: 1 ~ 27。 scale: 0 ~ 9。日期类型 DATE 范围：['1000-01-01'， '9999-12-31']。默认的打印形式是'YYYY-MM-DD'。 DATETIME 范围：['1000-01-01 00:00:00'， '9999-12-31 00:00:00']。默认的打印形式是’YYYY-MM-DD HH:MM:SS’。特殊类型 HLL HLL（HyperLogLog）类型是一个二进制类型。HLL 类型只能用于聚合类型的表（Aggregation Table），并且必须指定聚合类型为 HLL_UNION。 HLL 类型主要用于非精确快速去重场景下，对数据进行预聚合。 HLL列只能通过配套的 hll_union_agg、hll_cardinality、hll_hash 进行查询或使用。 BITMAP BITMAP 类型是一个二进制类型。BITMAP 类型只能用于聚合类型的表（Aggregation Table），并且必须指定聚合类型为 BITMAP_UNION。 BITMAP 类型主要用于精确去重场景下，对数据进行预聚合。同时也可以用于如用户画像场景存放用户ID等。 BITMAP 列只能通过配套的 BITMAP 函数进行查询和使用。

云数据迁移 CDM 支持的数据源
云数据迁移 CDM-支持的数据类型:Elasticsearch/云搜索服务（CSS）数据库迁移时支持的数据类型

Elasticsearch/云搜索服务（ CSS ）数据库迁移时支持的数据类型源端为Elasticsearch/云搜索服务（CSS）数据库时，支持的数据类型如下：表10 Elasticsearch/云搜索服务（CSS）数据库作为源端时支持的数据类型类别类型简要释义存储格式示例 MySQL 字符 keyword 用于存储字符串。 “keyword” String text 用于存储长字符串类型，其字符串的长度最大为 2G-1，存储长的文本串。 “long string” TEXT string 用于存储长字符串类型，其字符串的长度最大为 2G-1，存储长的文本串。 “a string” String 整数 short 用于存储16位有符号整数，取值范围为-32768至32767。 32765 smallInt integer 用于存储32位有符号整数，取值范围为-231至231-1。 3276566 int long 用于存储64位有符号整数，取值范围为-263至263-1。 3276566666 BIGINT 数值 double 64位双精度IEEE 754浮点类型。 21.333 double float 32位单精度IEEE 754浮点类型。 21.333 double 布尔类型 boolean 存储在1个字节中，可以取值为 1、0 或 NULL。 1 Boolean 对象 object 扁平化存储对象的字符串。 {"users.name":["John"，"Smith"]， users.age":[26，28]， "users.gender":[1，2]} TEXT 嵌套 nested 嵌套存储对象的字符串。 {"users.name" : "John" ， "users.age" : 26， "users.gender" : 1} { "users.name" : "Smith"， "users.age" : 28， "users.gender" : 2} TEXT 日期 date 日期格式的字符串。 “2018-01-13”或“2018-01-13 12:10:30” DATE或timeStamp 特殊 ip Ip地址格式的字符串。 “192.168.127.100” String 数组 string_array 全部是字符串的数组。 [“str”，“str”] TEXT short_array 全部是16位整数的数组。 [1，1，1] TEXT integer_array 全部是32位整数的数组。 [1，1，1] TEXT long_array 全部是64位整数的数组。 [1，1，1] TEXT float_array 全部是32位浮点数的数组。 [1.0，1.0，1.0] TEXT double_array 全部是64位浮点数的数组。 [1.0，1.0，1.0] TEXT 范围 completion 自动补全的字符串。 “string” TEXT

云数据迁移 CDM 支持的数据源
云数据迁移 CDM-支持的数据类型:SAP HANA数据库迁移时支持的数据类型

SAP HANA数据库迁移时支持的数据类型源端为SAP HANA数据库时，支持的数据类型如下：表8 SAP HANA数据库作为源端时支持的数据类型类别类型简要释义字符 VARCHAR 用于存储指定定长字符串。 NVARCHAR 包含unicode格式数据的变长字符串。 TEXT 用于存储长字符串类型，其字符串的长度最大为 2G-1，存储长的文本串。数值 BIGINT 用于存储有符号整数，精度为19，标度为0。 TINYINT 用于存储有符号整数，精度为3，标度为0。 SMALLINT SMALLINT类型的数据占用了两个字节的存储空间，其中一个二进制位表示整数值的正负号，其它15个二进制位表示长度和大小，可以表示-2的15次方~2的15次方-1范围内的所有整数。 REAL 可以存储正的或者负的十进制数值。 DECIMAL 带固定精度和小数位数的数值数据类型。 FLOAT 用于存储带二进制精度的浮点数。 DOUBLE 用于存储指明双精度的浮点数。日期时间 DATE 用于存储年、月、日信息。 TIME 用于存储时、分、秒信息。 TIMESTAMP 用于存储年、月、日、时、分、秒信息。多媒体 CLOB 用于存储变长的二进制大对象，长度最大为2G-1字节。 NCLOB 这种类型能够存储最多4GB的数据。当字符集发生转换时，这种类型会受到影响。布尔类型 BOOLEAN 存储在1个字节中，可以取值为 1、0 或 NULL。

云数据迁移 CDM 支持的数据源
云数据迁移 CDM-支持的数据类型:DLI数据库迁移时支持的数据类型

DLI 数据库迁移时支持的数据类型源端为DLI数据库时，支持的数据类型如下：表9 DLI数据库作为源端时支持的数据类型类别类型简要释义字符 CHAR 用于存储指定定长字符串。 VARCHAR 与CHAR相同。 STRING 用于存储长字符串类型，其字符串的长度最大为 2G-1，存储长的文本串。数值 BIGINT 用于存储有符号整数，精度为19，标度为0。 TINYINT 用于存储有符号整数，精度为3，标度为0。 SMALLINT SMALLINT类型的数据占用了两个字节的存储空间，其中一个二进制位表示整数值的正负号，其它15个二进制位表示长度和大小，可以表示-2的15次方~2的15次方-1范围内的所有整数。 INT 用于存储有符号整数，精度为10，标度为0。 DECIMAL 带固定精度和小数位数的数值数据类型。 FLOAT 用于存储带二进制精度的浮点数。 DOUBLE 用于存储指明双精度的浮点数。日期时间 DATE 用于存储年、月、日信息。 TIMESTAMP 用于存储年、月、日、时、分、秒信息。布尔类型 BOOLEAN 存储在1个字节中，可以取值为 1、0 或 NULL。

云数据迁移 CDM 支持的数据源
云数据迁移 CDM-支持的数据类型:DWS数据库迁移时支持的数据类型

DWS数据库迁移时支持的数据类型源端为DWS数据库时，支持的数据类型如下：表6 DWS数据库作为源端时支持的数据类型类别类型简要释义字符 char 定长字符串，存储右空格填充到指定的长度。 varchar 变长字符串，不会用空格将字段或变量填充至最大长度。数值 double 用于存储指明双精度的浮点数。 decimal（p，s）精度p表示为值存储的有效位数，刻度s表示可以在小数点后存储的位数。p最大位数是1000。 numeric 用于存储零、正负定点数。 real 与double相同。 int int存储在4个字节中，其中一个二进制位表示符号位，其它31个二进制位表示长度和大小，可以表示-2的31次方~2的31次方-1范围内的所有整数。 bigint bigint存储在8个字节中，其中一个二进制位表示符号位，其它63个二进制位表示长度和大小，可以表示-2的63次方~2的63次方-1范围内的所有整数。 smallint smallint类型的数据占用了两个字节的存储空间，其中一个二进制位表示整数值的正负号，其它15个二进制位表示长度和大小，可以表示-2的15次方~2的15次方-1范围内的所有整数。 tinyint tinyint类型的数据占用了一个字节的存储空间，可以表示0~255范围内的所有整数。日期时间 date 存储日期数据。 timestamp 存储日期和时间数据，无时区。 time 只用于一日内时间，无时区。位串类型 bit 定长位串，例如： b'000101'。布尔类型 boolean 存储在1个字节中，可以取值为 1、0 或 NULL。文本类型 text 变长文本，无长度限制。

云数据迁移 CDM 支持的数据源
云数据迁移 CDM-支持的数据类型:神通（ST）数据库迁移时支持的数据类型

神通（ST）数据库迁移时支持的数据类型源端为神通（ST）数据库，目的端为 MRS Hive、MRS Hudi时，支持的数据类型如下：表7 神通（ST）数据库作为源端时支持的数据类型类别类型简要释义存储格式示例 MRS Hive MRS Hudi 字符 VARCHAR 用于存储指定定长字符串。 ‘a’或‘aaaaa’ VARCHAR（765） STRING BPCHAR 用于存储指定变长字符串。 ‘a’或‘aaaaa’ VARCHAR（765） STRING 数值 NUMERIC 用于存储零、正负定点数。 52.36 DECIMAL（10，0） DECIMAL（18，0） INT 用于存储零、正负定点数。 5236 INT INT BIGINT 用于存储有符号整数，精度为19，标度为0。 5236 BIGINT BIGINT TINYINT 用于存储有符号整数，精度为3，标度为0。 100 SMALLINT INT BINARY 用于存储定长二进制数据。 0x2A3B4058 不支持 FLOAT VARBINARY 用于存储可变长二进制数据。 0x2A3B4058 不支持 BINARY FLOAT 用于存储带二进制精度的浮点数。 52.36 FLOAT FLOAT DOUBLE 用于存储指明双精度的浮点数。 52.3 DOUBLE DOUBLE 日期时间 DATE 用于存储年、月、日信息。 '1999-10-01'、'1999/10/01'或'1999.10.01' DATE DATE TIME 用于存储时、分、秒信息。 '09:10:21'或'9:10:21' STRING STRING TIMESTAMP 用于存储年、月、日、时、分、秒信息。 '2002-12-12 09:10:21'、'2002-12-12 9:10:21'、 '2002/12/12 09:10:21' 或'2002.12.12 09:10:21' TIMESTAMP TIMESTAMP 多媒体 CLOB 用于存储变长的二进制大对象，长度最大为2G-1字节。 0x5236（二进制数据） STRING STRING BLOB 用于存储变长的二进制大对象，长度最大为2G-1字节。 0x5236（二进制数据）不支持 BINARY 布尔类型 BOOLEAN 存储在1个字节中，可以取值为 1、0 或 NULL。 1 BOOLEAN BOOLEAN

云数据迁移 CDM 支持的数据源
云数据迁移 CDM-支持的数据类型:PostgreSQL数据库迁移时支持的数据类型

PostgreSQL数据库迁移时支持的数据类型源端为PostgreSQL数据库，目的端为Hive、DWS、DLI时，支持的数据类型如下：表5 PostgreSQL数据库作为源端时支持的数据类型类别类型简要释义 Hive DWS DLI 字符 char 定长字符串，存储右空格填充到指定的长度。 CHAR CHAR 不支持（String） varchar 变长字符串，不会用空格将字段或变量填充至最大长度。 CARCHAR CARCHAR 不支持（String）数值 smallint 拓展名 int2，存储在2个字节中，它允许的范围是从-32768到32767。 SMALLINT SMALLINT SMALLINT int 拓展名 int4，存储在4个字节中，它允许的范围是从-2147483648到2147483647。 INTEGER INT INT bigint 拓展名 int8，存储在8个字节中，允许范围为-9223372036854775808到9223372036854775807。 BIGINT BIGINT BIGINT decimal（p，s）精度p表示为值存储的有效位数，刻度s表示可以在小数点后存储的位数。p最大位数是1000。 DECIMAL（P，S） DECIMAL（P，S） DECIMAL（P，S） float 4字节或8字节存储。float（n）：n取值在1-24内，精度有效位数为6 位数，长度4 个字节，是单精度，n取值在25-53内，精度有效位数为15 位数，长度8 字节，是双精度。 FLOAT/DOUBLE FLOAT/DOUBLE FLOAT/DOUBLE smallserial 序列数据类型，以smallint格式存储。 SMALLINT SMALLINT SMALLINT serial 序列数据类型，以int格式存储。 INTEGER INT INT bigserial 序列数据类型，以bigint格式存储。 BIGINT BIGINT BIGINT 日期时间 date 存储日期数据。 DATE DATE DATE timestamp 存储日期和时间数据，无时区。 TIMESTAMP TIMESTAMP 不支持（String） timestamptz 存储日期和时间数据，有时区。 TIMESTAMP TIMESTAMPZ 不支持（String） time 只用于一日内时间，无时区。不支持（String） TIME 不支持（String） timez 只用于一日内时间，有时区。不支持（String） TIMEZ 不支持（String） interval 时间间隔。不支持（String）不支持（String）不支持（String）位串类型 bit 定长位串，例如： b'000101'。不支持（String）不支持（String）不支持（String） varbit 可变长位串，例如： b'101'。不支持（String）不支持（String）不支持（String）货币类型 money 存储在8个字节中，它允许的范围是从-922337203685477.5808到922337203685477.5807。 DOUBLE MONEY DECIMAL（P，S）布尔类型 boolean 存储在1个字节中，可以取值为 1、0 或 NULL。 BOOLEAN BOOLEAN BOOLEAN 文本类型 text 变长文本，无长度限制。不支持（String）不支持（String）不支持（String）

云数据迁移 CDM 支持的数据源
云数据迁移 CDM-支持的数据类型:SQL Server数据库迁移时支持的数据类型

SQL Server数据库迁移时支持的数据类型源端为SQL Server数据库，目的端为Hive、DWS、Oracle时，支持的数据类型如下：表4 SQL Server数据库作为源端时支持的数据类型类别类型简要释义 Hive DWS Oracle 字符串数据类型 char 定长字符串，会用空格填充来达到最大长度。 CHAR CHAR CHAR nchar 包含unicode格式数据的定长字符串。 CHAR CHAR CHAR varchar 可变长度的字符串是以长度为1到255之间字符数（高版本的MySQL超过255）; 例如： VARCHAR（25）；创建VARCHAR类型字段时，必须定义长度。 VARCHAR VARCHAR VARCHAR nvarchar 与varchar类似，存储可变长度Unicode字符数据。 VARCHAR VARCHAR VARCHAR 数值数据类型 int int存储在4个字节中，其中一个二进制位表示符号位，其它31个二进制位表示长度和大小，可以表示-2的31次方~2的31次方-1范围内的所有整数。 INT INTEGER INT bigint bigint存储在8个字节中，其中一个二进制位表示符号位，其它63个二进制位表示长度和大小，可以表示-2的63次方~2的63次方-1范围内的所有整数。 BIGINT BIGINT NUMBER smallint smallint类型的数据占用了两个字节的存储空间，其中一个二进制位表示整数值的正负号，其它15个二进制位表示长度和大小，可以表示-2的15次方~2的15次方-1范围内的所有整数。 SMALLINT SMALLINT NUMBER tinyint tinyint类型的数据占用了一个字节的存储空间，可以表示0~255范围内的所有整数。 TINYINT TINYINT NUMBER real 可以存储正的或者负的十进制数值。 DOUBLE FLOAT4 NUMBER float 其中为用于存储float数值尾数的位数（以科学计数法表示），因此可以确定精度和存储大小。 FLOAT FLOAT8 binary_float decimal 带固定精度和小数位数的数值数据类型。 DECIMAL NUMERIC NUMBER numeric 用于存储零、正负定点数。 DECIMAL NUMERIC NUMBER 日期时间数据类型 date 存储用字符串表示的日期数据。 DATE TIMESTAMP DATE time 以字符串形式记录一天的某个时间。不支持（String） TIME 不支持 datetime 用于存储时间和日期数据。 TIMESTAMP TIMESTAMP 不支持 datetime2 datetime的扩展类型，其数据范围更大，默认的最小精度最高，并具有可选的用户定义的精度。 TIMESTAMP TIMESTAMP 不支持 smalldatetime smalldatetime类型与datetime类型相似，只是其存储范围是从1900年1月1日到2079年6月6日，当日期时间精度较小时，可以使用smalldatetime，该类型数据占用4个字节的存储空间。 TIMESTAMP TIMESTAMP 不支持 datetimeoffset 用于定义一个采用24小时制与日期相组合并可识别时区的时间。不支持（String） TIMESTAMP 不支持多媒体数据类型（二进制） text 用于存储文本数据。不支持（String）不支持（String）不支持 netxt 与text类型作用相同，为长度可变的非Unicode数据。不支持（String）不支持（String）不支持 image 长度可变的二进制数据，用于存储照片、目录图片或者图画。不支持（String）不支持（String）不支持 binary 长度为n个字节的固定长度二进制数据，其中n是从1~8000的值。不支持（String）不支持（String）不支持 varbinary 可变长度二进制数据。不支持（String）不支持（String）不支持货币数据类型 money 用于存储货币值。不支持（String）不支持（String）不支持 smallmoney 与money类型相似，输入数据时在前面加上一个货币符号，如美元为$或其它定义的货币符号。不支持（String）不支持（String）不支持位数据类型 bit 位数据类型，只取0或1为值，长度1字节。bit值经常当作逻辑值用于判断true（1）或false（0），输入非0值时系统将其替换为1。不支持不支持不支持其他数据类型 rowversion 每个数据都有一个计数器，当对数据库中包含rowversion列的表执行插入或者更新操作时，该计数器数值就会增加。不支持不支持不支持 uniqueidentifier 16字节的GUID（Globally Unique Identifier，全球唯一标识符），是Sql Server根据网络适配器地址和主机CPU时钟产生的唯一号码，其中，每个为都是0~9或a~f范围内的十六进制数字。不支持不支持不支持 cursor 游标数据类型。不支持不支持不支持 sql_variant 用于存储除文本，图形数据和timestamp数据外的其它任何合法的Sql Server数据，可以方便Sql Server的开发工作。不支持不支持不支持 table 用于存储对表或视图处理后的结果集。不支持不支持不支持 xml 存储xml数据的数据类型。可以在列中或者xml类型的变量中存储xml实例。存储的xml数据类型表示实例大小不能超过2GB。不支持不支持不支持

云数据迁移 CDM 支持的数据源
云数据迁移 CDM-支持的数据类型:Oracle数据库迁移时支持的数据类型

Oracle数据库迁移时支持的数据类型源端为Oracle数据库，目的端为Hive、DWS时，支持的数据类型如下：表3 Oracle数据库作为源端时支持的数据类型类别类型简要释义 Hive DWS 字符串 char 定长字符串，会用空格填充来达到最大长度。 CHAR CHAR nchar 包含unicode格式数据的定长字符串。 CHAR CHAR varchar2 是VARCHAR的同义词。这是一个变长字符串，与CHAR类型不同，它不会用空格将字段或变量填充至最大长度。 VARCHAR VARCHAR nvarchar2 包含unicode格式数据的变长字符串。 VARCHAR VARCHAR 数值 number 能存储精度最多高达38位的数字。 DECIMAL NUMERIC binary_float 2位单精度浮点数。 FLOAT FLOAT8 binary_double 64位双精度浮点数。 DOUBLE FLOAT8 long 能存储最多2GB的字符数据。不支持不支持日期时间 date 7字节的定宽日期/时间数据类型，其中包含7个属性：世纪、世纪中的哪一年、月份、月中的哪一天、小时、分钟、秒。 DATE TIMESTAMP timestamp 7字节或11字节的定宽日期/时间数据类型，它包含小数秒。 TIMESTAMP TIMESTAMP timestamp with time zone 3字节的timestamp，提供了时区支持。 TIMESTAMP TIME WITH TIME ZONE timestamp with local time zone 7字节或11字节的定宽日期/时间数据类型，在数据的插入和读取时会发生时区转换。 TIMESTAMP 不支持（TEXT） interval year to month 5字节的定宽数据类型，用于存储一个时段。不支持不支持（TEXT） interval day to second 11字节的定宽数据类型，用于存储一个时段。将时段存储为天/小时/分钟/秒数，还可以有9位小数秒。不支持不支持（TEXT）多媒体（二进制） raw 一种变长二进制数据类型，采用这种数据类型存储的数据不会发生字符集转换。不支持不支持 long raw 能存储多达2GB的二进制信息。不支持不支持 blob 能够存储最多4GB的数据。不支持不支持 clob 在Oracle 10g及以后的版本中允许存储最多（4GB）×（数据库块大小）字节的数据。CLOB包含要进行字符集转换的信息。这种数据类型很适合存储纯文本信息。 String 不支持 nclob 这种类型能够存储最多4GB的数据。当字符集发生转换时，这种类型会受到影响。不支持不支持 bfile 可以在数据库列中存储一个oracle目录对象和一个文件名，用户可以通过它来读取这个文件。不支持不支持其他类型 rowid 实际上是数据库表中行的地址，它有10字节长。不支持不支持 urowid 是一个通用的rowid，没有固定的rowid的表。不支持不支持

云数据迁移 CDM 支持的数据源
云数据迁移 CDM-支持的数据类型:MySQL数据库迁移时支持的数据类型

MySQL数据库迁移时支持的数据类型源端为MySQL数据库，目的端为Hive、DWS时，支持的数据类型如下：表2 开源MySQL数据库作为源端时支持的数据类型类别类型简要释义存储格式示例 Hive DWS 字符串 CHAR（M）固定长度的字符串是以长度为1到255之间个字符长度（例如：CHAR（5）），存储右空格填充到指定的长度。限定长度不是必需的，它会默认为1。 ‘a’或‘aaaaa’ CHAR CHAR VARCHAR（M）可变长度的字符串是以长度为1到255之间字符数（高版本的MySQL超过255）; 例如： VARCHAR（25）. 创建VARCHAR类型字段时，必须定义长度。 ‘a’或‘aaaaa’ VARCHAR VARCHAR 数值 DECIMAL（M，D）非压缩浮点数不能是无符号的。在解包小数，每个小数对应于一个字节。定义显示长度（M）和小数（D）的数量是必需的。 NUMERIC是DECIMAL的同义词。 52.36 DECIMAL D为0时对应BIGINT D不为0时对应NUMBERIC NUMBERIC 与 DECIMAL 相同。 - DECIMAL NUMBERIC INTEGER 一个正常大小的整数，可以带符号。如果是有符号的，它允许的范围是从-2147483648到2147483647。如果是无符号，允许的范围是从0到4294967295。可以指定多达11位的宽度。 5236 INT INTEGER INTEGER UNSIGNED INTEGER 的无符号形式。 - BIGINT INTEGER INT 与INTEGER相同。 5236 INT INTEGER INT UNSIGNED 与INTEGER UNSIGNED相同。 - BIGINT INTEGER BIGINT 一个大的整数，可以带符号。如果有符号，允许范围为-9223372036854775808到9223372036854775807。如果无符号，允许的范围是从0到18446744073709551615. 可以指定最多20位的宽度。 5236 BIGINT BIGINT BIGINT UNSIGNED BIGINT的无符号形式。 - BIGINT BIGINT MEDIUMINT 一个中等大小的整数，可以带符号。如果有符号，允许范围为-8388608至8388607。如果无符号，允许的范围是从0到16777215，可以指定最多9位的宽度。 -128，127 INT INTEGER MEDIUMINT UNSIGNED MEDIUMINT的无符号形式。 - BIGINT INTEGER TINYINT 一个非常小的整数，可以带符号。如果是有符号，它允许的范围是从-128到127。如果是无符号，允许的范围是从0到255，可以指定多达4位数的宽度。 100 TINYINT SMALLINT TINYINT UNSIGNED TINYINT的无符号形式。 - TINYINT SMALLINT BOOL MySQL的bool实际上就是tinyint（1）。 -128、127 SMALLINT BYTEA SMALLINT 一个小的整数，可以带符号。如果有符号，允许范围为-32768至32767。如果无符号，允许的范围是从0到65535，可以指定最多5位的宽度。 9999 SMALLINT SMALLINT SMALLINT UNSIGNED SMALLINT的无符号形式。 - INT SMALLINT REAL 同DOUBLE。 - DOUBLE - FLOAT（M，D）不能使用无符号的浮点数字。可以定义显示长度（M）和小数位数（D）。这不是必需的，并且默认为10，2。其中2是小数的位数，10是数字（包括小数）的总数。小数精度可以到24个浮点。 52.36 FLOAT FLOAT4 DOUBLE（M，D）不能使用无符号的双精度浮点数。可以定义显示长度（M）和小数位数（D）。这不是必需的，默认为16，4，其中4是小数的位数。小数精度可以达到53位的DOUBLE。 REAL是DOUBLE同义词。 52.36 DOUBLE FLOAT8 DOUBLE PRECISION 与DOUBLE相似。 52.3 DOUBLE FLOAT8 位 BIT（M）存储位值的BIT类型。BIT（M）可以存储多达M位的值，M的范围在1到64之间。 B'1111100' B'1100' TINYINT BYTEA 日期时间 DATE 以YYYY-MM-DD格式的日期，在1000-01-01和9999-12-31之间。例如，1973年12月30日将被存储为1973-12-30。 1999-10-01 DATE TIMESTAMP TIME 用于存储时、分、秒信息。 '09:10:21'或'9:10:21' 不支持（String） TIME DATETIME 日期和时间组合以YYYY-MM-DD HH:MM:SS格式，在1000-01-01 00:00:00 到9999-12-31 23:59:59之间。例如，1973年12月30日下午3:30，会被存储为1973-12-30 15:30:00。 '1973-12-30 15:30:00' TIMESTAMP TIMESTAMP TIMESTAMP 1970年1月1日午夜之间的时间戳，到2037的某个时候。这看起来像前面的DATETIME格式，无需只是数字之间的连字符; 1973年12月30日下午3点30分将被存储为19731230153000（YYYYMMDDHHMMSS）。 19731230153000 TIMESTAMP TIMESTAMP YEAR（M）以2位或4位数字格式来存储年份。如果长度指定为2（例如YEAR（2）），年份就可以为1970至2069（70~69）。如果长度指定为4，年份范围是1901-2155，默认长度为4。 2000 不支持（String）不支持多媒体（二进制） BINARY（M）字节数为M，允许长度为0-M的变长二进制字符串，字节数为值得长度加1。 0x2A3B4058 （二进制数据）不支持 BYTEA VARBINARY（M）字节数为M，允许长度为0-M的定长二进制字符串。 0x2A3B4059 （二进制数据）不支持 BYTEA TEXT 字段的最大长度是65535个字符。 TEXT是“二进制大对象”，并用来存储大的二进制数据，如图像或其他类型的文件。 0x5236（二进制数据）不支持不支持 TINYTEXT 0-255字节短文本二进制字符串。 - - 不支持 MEDIUMTEXT 0-167772154字节中等长度文本二进制字符串。 - - 不支持 LONGTEXT 0-4294967295字节极大长度文本二进制字符串。 - - 不支持 BLOB 字段的最大长度是65535个字符。 BLOB是“二进制大对象”，并用来存储大的二进制数据，如图像或其他类型的文件。BLOB大小写敏感。 0x5236（二进制数据）不支持不支持 TINYBLOB 0-255字节短文本二进制字符串。 - 不支持不支持 MEDIUMBLOB 0-167772154字节中等长度文本二进制字符串。 - 不支持不支持 LONGBLOB 0-4294967295字节极大长度文本二进制字符串。 0x5236（二进制数据）不支持不支持特殊类型 SET SET是一个字符串对象，可以有零或多个值，其值来自表创建时规定的允许的一列值。指定包括多个SET成员的SET列值时各成员之间用逗号（‘，’）间隔开。这样SET成员值本身不能包含逗号。 - - 不支持 JSON - - 不支持不支持（TEXT） ENUM 当定义一个ENUM，要创建它的值的列表，这些是必须用于选择的项（也可以是NULL）。例如，如果想要字段包含“A”或“B”或“C”，那么可以定义为ENUM为 ENUM（“A”，“B”，“C”）也只有这些值（或NULL）才能用来填充这个字段。 - 不支持不支持

云数据迁移 CDM 支持的数据源
云数据迁移 CDM-配置FTP/SFTP源端参数

配置FTP/SFTP源端参数作业中源连接为FTP/SFTP连接时，源端作业参数如表1所示。高级属性里的参数为可选参数，默认隐藏，单击界面上的“显示高级属性”后显示。表1 FTP/SFTP作为源端时的作业参数参数类型参数名说明取值样例基本参数源目录或文件待迁移数据的目录或单个文件路径。文件路径支持输入多个文件（最多50个），默认以“|”分隔，也可以自定义文件分隔符，具体请参见文件列表迁移。待迁移数据的目录，将迁移目录下的所有文件（包括所有嵌套子目录及其子文件）。该参数支持配置为时间宏变量，且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合，可以实现定期同步新增数据，详细说明请参见使用时间宏变量完成增量同步。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 /ftp/a.csv|/ftp/b.txt 文件格式指CDM以哪种格式解析数据，可选择以下格式： CSV格式：以CSV格式解析源文件，用于迁移文件到数据表的场景。二进制格式：选择“二进制格式”时不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。 JSON格式：以JSON格式解析源文件，一般都是用于迁移文件到数据表的场景。说明：当目的端为OBS数据源时，仅支持配置二进制格式。 CSV格式 JSON类型当“文件格式”选择为“JSON格式”时，才有该参数。JSON文件中存储的JSON对象的类型，可以选择“JSON对象”或“JSON数组”。 JSON对象记录节点当“文件格式”选择为“JSON格式”并且“JSON类型”为“JSON对象”时，才有该参数。对该JSON节点下的数据进行解析，如果该节点对应的数据为JSON数组，那么系统会以同一模式从该数组中提取数据。多层嵌套的JSON节点以字符“.”分割。 data.list 高级属性使用rfc4180解析器当“文件格式”选择为“CSV格式”时，才有该参数。是否使用rfc4180解析器解析CSV文件。否换行符文件中的换行符，默认自动识别“\n”、“\r”或“\r\n”。当“文件格式”选择为“CSV格式”时，才有该参数。 \n 字段分隔符文件中的字段分隔符，使用Tab键作为分隔符请输入“\t”。当“文件格式”选择为“CSV格式”时，才有该参数。 , 使用包围符选择“是”时，包围符内的字段分隔符会被视为字符串值的一部分，目前CDM默认的包围符为："。否使用转义符选择“是”时，CSV数据行中的\作为转义符使用。选择“否”时，CSV中的\作为数据不会进行转义。CSV只支持\作为转义符。是使用正则表达式分隔字段选择是否使用正则表达式分隔字段，当选择“是”时，“字段分隔符”参数无效。当“文件格式”选择为“CSV格式”时，才有该参数。是正则表达式当“使用正则表达式分隔字段”选择为“是”时，才有该参数。分隔字段的正则表达式，正则表达式写法请参考正则表达式分隔半结构化文本。 ^(\d.*\d) (\w*) \[(.*)\] ([\w\.]*) (\w.*).* 首行为标题行 “文件格式”选择“CSV格式”时才有该参数。在迁移CSV文件到表时，CDM默认是全部写入，如果该参数选择“是”，CDM会将CSV文件的前N行数据作为标题行，不写入目的端的表。是编码类型文件编码类型，例如：“UTF-8”或“GBK”。只有文本文件可以设置编码类型，当“文件格式”选择为“二进制格式”时，该参数值无效。 UTF-8 压缩格式选择对应压缩格式的源文件：无：表示传输所有格式的文件。 GZIP：表示只传输GZIP格式的文件。 ZIP：表示只传输ZIP格式的文件。 TAR.GZ：表示只传输TAR.GZ格式的文件。无压缩文件后缀压缩格式非无时，显示该参数。该参数需要解压缩的文件后缀名。当一批文件中以该值为后缀时，才会执行解压缩操作，否则保持原样传输。当输入*或为空时，所有文件都会被解压。 * 启动作业标识文件选择是否开启作业标识文件的功能。当源端路径下存在启动作业的标识文件时才启动作业，否则会挂起等待一段时间，等待时长在下方“等待时间”中配置。是文件分隔符 “源目录或文件”参数中如果输入的是多个文件路径，CDM使用这里配置的文件分隔符来区分各个文件，默认为|。 | 标识文件名选择开启作业标识文件的功能时，需要指定启动作业的标识文件名。指定文件后，只有在源端路径下存在该文件的情况下才会运行任务。该文件本身不会被迁移。 ok.txt 等待时间选择开启作业标识文件的功能时，如果源路径下不存在启动作业的标识文件，作业挂机等待的时长，当超时后任务会失败。等待时间设置为0时，当源端路径下不存在标识文件，任务会立即失败。单位：秒。 10 过滤类型满足过滤条件的路径或文件会被传输，该参数有“无”、“通配符”和“正则表达式”三种选择。具体使用方法可参见文件增量迁移。无目录过滤器 “过滤类型”选择“通配符”和“正则表达式”时，符合过滤器规则的目录，允许进行迁移。支持配置多个路径，中间使用“,”分隔。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 *input,*out 文件过滤器 “过滤类型”选择“通配符”和“正则表达式”时，符合过滤器规则的文件，允许进行迁移。支持配置多个文件，中间使用“,”分隔。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 *.csv 时间过滤选择“是”时，可以根据文件的修改时间，选择性的传输文件。是起始时间 “时间过滤”选择“是”时，可以指定一个时间值，当文件的修改时间大于等于该时间才会被传输，输入的时间格式需为“yyyy-MM-dd HH:mm:ss”。该参数支持配置为时间宏变量，例如${timestamp(dateformat(yyyy-MM-dd HH:mm:ss,-90,DAY))}表示：只迁移最近90天内的文件。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 2019-07-01 00:00:00 终止时间 “时间过滤”选择“是”时，可以指定一个时间值，当文件的修改时间小于该时间才会被传输，输入的时间格式需为“yyyy-MM-dd HH:mm:ss”。该参数支持配置为时间宏变量，例如${timestamp(dateformat(yyyy-MM-dd HH:mm:ss))}表示：只迁移修改时间为当前时间以前的文件。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 2019-07-30 00:00:00 忽略不存在原路径/文件如果将其设为“是”，那么作业在源路径不存在的情况下也能成功执行。否标识文件类型选择开启作业标识文件的功能时，该参数才显示。 MARK_DONE：只有在源端路径下存在标识文件的情况下才会执行迁移任务。 MARK_DOING：只有在源端路径下不存在标识文件的情况下才会执行迁移任务。 MARK_DOING 是否跳过空行 “文件格式”选择“CSV格式”时，该参数才显示。如果某行数据为空，则跳过此行。否 null值 “文件格式”选择“二进制格式”时，该参数才显示。由于文本文件中无法用字符串定义null值，此配置项定义将何种字符串标识为null。否 MD5文件名后缀 “文件格式”选择“二进制格式”时，该参数才显示。校验CDM抽取的文件，是否与源文件一致，详细请参见MD5校验文件一致性。 .md5 父主题：配置CDM作业源端参数

云数据迁移 CDM 配置CDM作业源端参数
云数据迁移 CDM-文件格式介绍:文件格式问题解决方法

文件格式问题解决方法数据库的数据导出到CSV文件，由于数据中含有分隔符逗号，造成导出的CSV文件中数据混乱。 CDM提供了以下几种解决方法：指定字段分隔符使用数据库中不存在的字符，或者是极少见的不可打印字符来作为字段分隔符。例如可以在目的端指定“字段分隔符”为“%01”，这样导出的字段分隔符就是“\u0001”，详情可见表1。使用包围符在目的端作业参数中开启“使用包围符”，这样数据库中如果字段包含了字段分隔符，在导出到CSV文件的时候，CDM会使用包围符将该字段括起来，使之作为一个字段的值写入CSV文件。数据库的数据包含换行符场景：使用CDM先将MySQL中的某张表（表的某个字段值中包含了换行符\n）导出到CSV格式的文件中，然后再使用CDM将导出的CSV文件导入到MRS HBase，发现导出的CSV文件中出现了数据被截断的情况。解决方法：指定换行符。在使用CDM将MySQL的表数据导出到CSV文件时，指定目的端的换行符为“%01”（确保这个值不会出现在字段值中），这样导出的CSV文件中换行符就是“%01”。然后再使用CDM将CSV文件导入到MRS HBase时，指定源端的换行符为“%01”，这样就避免了数据被截断的问题。

云数据迁移 CDM 关键操作指导
云数据迁移 CDM-文件格式介绍:二进制格式

二进制格式如果想要在文件系统间按原样复制文件，则可以选择二进制格式。二进制格式传输文件到文件的速率高、性能稳定，且不需要在作业第二步进行字段匹配。文件传输的目录结构 CDM的文件传输，支持单文件，也支持一次传输目录下所有的文件。传输到目的端后，目录结构会保持原样。增量迁移文件使用CDM进行二进制传输文件时，目的端有一个参数“重复文件处理方式”，可以用作文件的增量迁移，具体请参见文件增量迁移。增量迁移文件的时候，选择“重复文件处理方式”为“跳过重复文件”，这样如果源端有新增的文件，或者是迁移过程中出现了失败，只需要再次运行任务，已经迁移过的文件就不会再次迁移。写入到临时文件二进制迁移文件时候，可以在目的端指定是否写入到临时文件。如果指定了该参数，在文件复制过程中，会将文件先写入到一个临时文件中，迁移成功后，再进行rename或move操作，在目的端恢复文件。生成文件MD5值对每个传输的文件都生成一个MD5值，并将该值记录在一个新文件中，新文件以“.md5”作为后缀，并且可以指定MD5值生成的目录。

云数据迁移 CDM 关键操作指导
云数据迁移 CDM-文件格式介绍:文件格式的公共参数

文件格式的公共参数启动作业标识文件这个主要用于自动化场景中，CDM配置了定时任务，周期去读取源端文件，但此时源端的文件正在生成中，CDM此时读取会造成重复写入或者是读取失败。所以，可以在源端作业参数中指定启动作业标识文件为“ok.txt”，在源端生成文件成功后，再在文件目录下生成“ok.txt”，这样CDM就能读取到完整的文件。另外，可以设置超时时间，在超时时间内，CDM会周期去查询标识文件是否存在，超时后标识文件还不存在的话，则作业任务失败。启动作业标识文件本身不会被迁移。作业成功标识文件文件系统为目的端的时候，当任务成功时，在目的端的目录下，生成一个空的文件，标识文件名由用户来指定。一般和“启动作业标识文件”搭配使用。这里需要注意的是，不要和传输的文件混淆，例如传输文件为“finish.txt”，但如果作业成功标识文件也设置为“finish.txt”，这样会造成这两个文件相互覆盖。过滤器使用CDM迁移文件的时候，可以使用过滤器来过滤文件。支持通过通配符或时间过滤器来过滤文件。选择通配符时，CDM只迁移满足过滤条件的目录或文件。选择时间过滤器时，只有文件的修改时间晚于输入的时间才会被传输。例如用户的“/table/”目录下存储了很多数据表的目录，并且按天进行了划分DRIVING_BEHAVIOR_20180101～DRIVING_BEHAVIOR_20180630，保存了DRIVING_BEHAVIOR从1月到6月的所有数据。如果只想迁移DRIVING_BEHAVIOR的3月份的表数据，那么需要在作业第一步指定源目录为“/table”，过滤类型选择“通配符”，然后指定“路径过滤器”为“DRIVING_BEHAVIOR_201803*”。

云数据迁移 CDM 关键操作指导
云数据迁移 CDM-文件格式介绍:JSON格式

JSON格式这里主要介绍JSON文件格式的以下内容： CDM支持解析的JSON类型记录节点从JSON文件复制数据 CDM支持解析的JSON类型：JSON对象、JSON数组。 JSON对象：JSON文件包含单个对象，或者以行分隔/串连的多个对象。单一对象JSON { "took" : 190, "timed_out" : false, "total" : 1000001, "max_score" : 1.0 } 行分隔的JSON对象 {"took" : 188, "timed_out" : false, "total" : 1000003, "max_score" : 1.0 } {"took" : 189, "timed_out" : false, "total" : 1000004, "max_score" : 1.0 } 串连的JSON对象 { "took": 190, "timed_out": false, "total": 1000001, "max_score": 1.0 } { "took": 191, "timed_out": false, "total": 1000002, "max_score": 1.0 } JSON数组：JSON文件是包含多个JSON对象的数组。 [{ "took" : 190, "timed_out" : false, "total" : 1000001, "max_score" : 1.0 }, { "took" : 191, "timed_out" : false, "total" : 1000001, "max_score" : 1.0 }] 记录节点记录数据的根节点。该节点对应的数据为JSON数组，CDM会以同一模式从该数组中提取数据。多层嵌套的JSON节点以字符“.”分割。从JSON文件复制数据示例一从行分隔/串连的多个对象中提取数据。JSON文件包含了多个JSON对象，例如： { "took": 190, "timed_out": false, "total": 1000001, "max_score": 1.0 } { "took": 191, "timed_out": false, "total": 1000002, "max_score": 1.0 } { "took": 192, "timed_out": false, "total": 1000003, "max_score": 1.0 } 如果您想要从该JSON对象中提取数据，使用以下格式写入到数据库，只需要在作业第一步指定文件格式为“JSON格式”，指定JSON类型为“JSON对象”，然后在作业第二步进行字段匹配即可。表2 示例 took timedOut total maxScore 190 false 1000001 1.0 191 false 1000002 1.0 192 false 1000003 1.0 示例二从记录节点中提取数据。JSON文件包含了单个的JSON对象，但是其中有效的数据在一个数据节点下，例如： { "took": 190, "timed_out": false, "hits": { "total": 1000001, "max_score": 1.0, "hits": [{ "_id": "650612", "_source": { "name": "tom", "books": ["book1","book2","book3"] } }, { "_id": "650616", "_source": { "name": "tom", "books": ["book1","book2","book3"] } }, { "_id": "650618", "_source": { "name": "tom", "books": ["book1","book2","book3"] } }] } } 如果想以如下格式写入到数据库，则需要在作业第一步指定文件格式为“JSON格式”，指定JSON类型为“JSON对象”，并且指定记录节点为“hits.hits”，然后在作业第二步进行字段匹配。表3 示例 ID SourceName SourceBooks 650612 tom ["book1","book2","book3"] 650616 tom ["book1","book2","book3"] 650618 tom ["book1","book2","book3"] 示例三从JSON数组中提取数据。JSON文件是包含了多个JSON对象的JSON数组，例如： [{ "took" : 190, "timed_out" : false, "total" : 1000001, "max_score" : 1.0 }, { "took" : 191, "timed_out" : false, "total" : 1000002, "max_score" : 1.0 }] 如果想以如下格式写入到数据库，需要在作业第一步指定文件格式为“JSON格式”，指定JSON类型为“JSON数组”，然后在作业第二步进行字段匹配。表4 示例 took timedOut total maxScore 190 false 1000001 1.0 191 false 1000002 1.0 示例四在解析JSON文件的时候搭配转换器。在示例二前提下，想要把hits.max_score字段附加到所有记录中，即以如下格式写入到数据库中：表5 示例 ID SourceName SourceBooks MaxScore 650612 tom ["book1","book2","book3"] 1.0 650616 tom ["book1","book2","book3"] 1.0 650618 tom ["book1","book2","book3"] 1.0 则需要在作业第一步指定文件格式为“JSON格式”，指定JSON类型为“JSON对象”，并且指定记录节点为“hits.hits”，然后在作业第二步添加转换器，操作步骤如下：单击添加字段，新增一个字段。图2 添加字段在添加的新字段后面，单击添加字段转换器。图3 添加字段转换器创建“表达式转换”的转换器，表达式输入“1.0”，然后保存。图4 配置字段转换器

云数据迁移 CDM 关键操作指导
HAYDN解决方案工厂-资源管理:手工清单资源开通

手工清单资源开通用例设计完成后，资源开通人责任人可进行资源开通。在新建需求时指定，如需变更，可编辑需求。手工清单资源开通不是真正的购买和部署云服务，而是手动购买云服务后，在资源管理这里做好记录的流程节点。进入对应空间内的资源管理主页，点击对应需求名称右侧的“资源开通”按钮，进入资源开通页。图6 资源开通主页确认开通验证所需云服务资源信息。补充开通的应用系统或技术栈信息。图7 资源开通详情页在提交处理处选择【通过】或【转他人处理】即可。通过：表示资源开通完成。转他人处理：该资源开通事项转给其他空间成员处理。

HAYDN解决方案工厂验证中心
HAYDN解决方案工厂-资源管理:申请测试券

申请测试券测试券用于支付购买云服务资源。当测试需求审核通过后，点击“验证中心-资源管理”，点击“申请测试券”按钮跳转到卖家中心申请测试券。图1 资源管理到卖家中心后，点击“测试券申请”按钮。图2 卖家中心输入测试券方案名称，选择“联营商品上架”，点击“选择适用商品”，选择“联营认证”栏正在进行联营认证的商品。图3 卖家中心等待卖家中心的运营审核员审核通过。审核通过后，会受到来自卖家中心的通知邮件。图4 邮箱同时在资源管理处可以看到对应的资源状态为“已发券”。图5 资源管理

HAYDN解决方案工厂验证中心
HAYDN解决方案工厂-资源管理:自动部署（CAM）

自动部署（CAM）自动部署架构设计完成后，后续创建验证需求关联该一键部署架构，在应用部署的环节点击资源开通-一键部署可实现该基础设施和应用的一键部署。如何进行自动化部署架构设计请参考自动部署。进入空间中，在左侧导航栏选择【验证中心】-【资源管理】，在待开通资源的需求后面点击【资源开通】。选择完成了自动化架构设计的资源清单，点击【一键部署】。图8 一键开通资源在下方的自动化部署设计窗口点击【进入设计】。点击右上角的部署实例按钮，将会弹出资源确定弹窗，确定资源费用后即可开始自动部署资源。图9 开始安装等待资源自动部署完成即可。

HAYDN解决方案工厂验证中心
HAYDN解决方案工厂-资源管理:自动部署（RFS）

自动部署（ RFS ）设计中心RFS自动部署架构设计完成后，后续创建验证需求关联该自动部署架构，在资源开通阶段可以实现自动购买和部署云服务资源。如何进行自动化部署架构设计请参考5.2.1.2-自动部署-RFS自动部署。自动部署是直接一次性购买架构中的云服务并且部署。进入空间中，在左侧导航栏选择【验证中心】-【资源管理】，在待开通资源的需求后面点击【资源开通】。进入到云服务资源开通界面，点击【创建资源栈】。图10 创建资源栈选择模板步骤无需操作，已固定了默认模板，即为设计设计中心在开通资源前的最新保存的模板，点击【下一步】。图11 选择模板配置参数，完成后点击【下一步】。编辑描述：对该资源栈的描述，创建成功后，该描述会同步到RFS资源栈列表中。（非必填）设置服务密码：设置对应云服务的登录密码，也可以部署后登录服务再设置。（非必填）图12 配置参数资源栈设置，完成后点击【下一步】 IAM 权限委托：可以选择账号已有委托权限部署资源（非必填，如果不选择则是使用开通人账号权限进行部署）。回滚设置：开启回滚，操作失败时，会自动回滚至系统所保存的上一个成功的资源状态，例如部署资源时，某一个资源部署失败，则回滚到上一步，即所有资源都回滚到部署前。删除保护：开启删除保护后，必须要拥有对应IAM权限的用户才可以删除该资源栈，否则不能删除。图13 资源栈设置配置确认，可以选择创建执行计划或者直接部署资源栈图14 配置确认创建执行计划：即创建资源栈，但不部署，后续可以随时点击部署、删除、同步，同步即为刷新状态。图15 资源栈列表直接部署资源栈：即马上购买资源并部署，点击同步按钮可以刷新部署状态。图16 资源栈列表提交资源开通，自动部署资源成功后，填写应用信息、技术栈信息—点击【提交】按钮，资源开通完成。图17 提交资源开通

HAYDN解决方案工厂验证中心
安全云脑 SECMASTER-产品功能:赠送规格说明

赠送规格说明安全云脑增值包中的安全分析、安全编排功能在不同的版本有不同的赠送配额，具体说明如下：表13 赠送规格说明功能标准版专业版安全分析安全数据采集 120 MB/天/配额 120 MB/天/配额安全数据保留 120 MB/天/配额 120 MB/天/配额安全数据导出 120 MB/天/配额 120 MB/天/配额平台安全数据 40 MB/天/配额 40 MB/天/配额安全建模分析 × 120 MB/天/配额威胁管理预制威胁模型 × 计算模型数据120 MB/天/配额；预置模型200个预制响应剧本 × 预置剧本30个安全编排安全编排 × 操作7000次

安全云脑 SECMASTER
安全云脑 SECMASTER-产品功能:安全编排

安全编排安全编排支持剧本管理、流程管理、数据类管理（安全实体对象）和资产连接管理等。同时，可以自定义剧本和流程等。通过安全编排可以对安全响应剧本进行拖拽式的灵活编排，动态适配您的业务需求。也可以对安全运营的对象、交互的页面进行灵活扩展和定义。表9 安全编排功能介绍功能模块功能描述基础版标准版专业版运营对象集中对数据类、数据类类型、分类映射等运营对象进行管理。 × √ √ 剧本编排支持对剧本、流程、资产连接、实例的全生命周期管理。说明：需额外购买增值包中的安全编排功能。其中，安全分析、内置剧本、安全编排含有赠送配额，具体说明请参见赠送规格说明。 × √ √ 页面布局提供安全可视化低代码开发平台，基于此平台可自定义安全分析报告、告警管理、事件管理、漏洞管理、基线管理、威胁情报指标库管理等页面布局。 × √ √ 插件管理支持将安全编排流程中使用的插件进行统一管理。 × × √

安全云脑 SECMASTER
安全云脑 SECMASTER-产品功能:工作空间管理

工作空间管理工作空间属于安全云脑顶层工作台，单个工作空间可绑定普通项目、企业项目和Region，可支撑不同场景下的工作空间运营模式。表2 工作空间功能说明功能模块功能描述基础版标准版专业版工作空间空间管理：安全云脑顶层工作台，单个工作空间可绑定项目和Region，可支撑不同场景下的工作空间运营模式。空间托管：跨账号安全运营，可实现工作空间委托集中安全运营查看统一资产风险、告警和事件等。 √ √ √

安全云脑 SECMASTER
安全云脑 SECMASTER-产品功能:安全态势

安全态势支持通过安全态势即时查看大屏、定期订阅安全运营报告，了解安全运营核心关注指标。表5 安全态势功能介绍功能模块功能描述基础版标准版专业版态势总览安全评分：根据安全云脑的分析检测能力，评估整体资产安全健康得分，可快速了解未处理风险对资产的整体威胁状况。评估得分越低，即风险值越大，则整体资产安全隐患越大。安全监控：集中呈现未处理的威胁告警、漏洞和合规检查的风险数目，支持快速查看威胁告警、漏洞和合规风险详情。安全趋势：呈现最近7天整体资产安全健康得分的趋势图。 √ √ √ 安全大屏利用AI技术将海量云安全数据的分析并分类，通过安全大屏将数据可视化展示，集中呈现云上实时动态，云上关键风险一目了然，掌握云上安全态势更简单，更直观，更高效。说明：安全大屏功能需要在标准版/专业版基础上单独购买。安全大屏还联动Astro大屏应用（Astro Canvas，简称AstroCanvas），支持指标自定义接入，页面零代码开发，数据分钟级接入。 × √ √ 安全报告通过创建分析报告，定时以邮件形式向指定的收件人发送安全报告，及时掌握资产的安全状况数据。 × × √ 任务中心集中呈现当前需要进行处理的任务。 × √ √

安全云脑 SECMASTER
安全云脑 SECMASTER-产品功能:威胁运营

威胁运营威胁运营提供丰富的威胁检测模型，帮助您从海量的安全日志中，发现威胁、生成告警；同时，提供丰富的安全响应剧本，帮助您对告警进行自动研判、处置，并对安全防线和安全配置自动加固。表8 威胁运营功能介绍功能模块功能描述基础版标准版专业版事件管理集中呈现事件详情，支持人工转事件、自动化转事件。 × √ √ 告警管理通过集成云服务告警，包含HSS、WAF、DDoS等，集中呈现并管理告警信息。 × √ √ 情报管理支持基于告警和事件自定义规则提取指标。 × × √ 智能建模支持利用模型对管道中的日志数据进行扫描，如果检测到有满足模型中设置触发条件的内容时，系统将产生告警提示。 × √ √ 安全分析查询与分析检索分析：支持数据的快捷检索分析，支持安全调查场景安全数据的快速筛留、筛除等操作，快速定位关键数据。筛选统计：支持数据字段快速分析统计，并基于分析结果进行数据的快速筛选；时序数据支持默认时间分区统计，快速识别数据量的变化趋势，支持基于时间分区的快速筛选；支持分析、统计、排序等丰富统计分析函数，支撑快速构建安全分析模型。可视化：支持数据可视化分析，直观反映业务结构性和趋势性特征，并基于此构建自定义分析报告和分析指标。数据投递：支持将数据实时投递至其他管道或其他华为云产品中，便于您存储数据或联合其它系统消费数据。数据监控：支持数据流量端到端的监控管理。数据消费：提供数据消费和生产的流式通信接口，提供数据管道集成SDK，支持租户利用SDK进行系统集成，支持客户自定义数据的生产和消费。提供Logstash开源采集软件插件，支持利用开源生态进行数据消费和生产。说明：需额外购买增值包中的安全分析功能。其中，安全分析、内置剧本、安全编排含有赠送配额，具体说明请参见赠送规格说明。 × √ √ 安全舆情安全舆情监测可以持续挖掘和感知互联网安全态势变化，及时发现和挖掘与您有关的安全事件、安全漏洞、社会影响、品牌舆情、热搜分析等，还可以将监测形成分析报告，协助您掌握舆情动态，并对潜在的各类舆情风险点进行监测和综合研判。说明：仅部分region支持使用安全舆情监测功能，具体开放region请参见功能总览。其他region如需使用该功能，需先提交工单申请开通使用权限。 √ √ √

安全云脑 SECMASTER
安全云脑 SECMASTER-产品功能:安全治理

安全治理安全治理为您提供安全治理模板与合规策略扫描服务，将安全遵从包内的法规标准条款转化成检查项。表3 安全治理功能说明功能模块功能描述基础版标准版专业版安全治理提供安全遵从包华为开放的安全治理模板，包含法规标准条款原文、扫描策略、自评估检查项以及华为专家的改进建议，覆盖PCI DSS、ISO27701、ISO27001、隐私等法规标准。用户可以订阅、取消订阅安全遵从包，查看合规评估与治理结果。合规策略扫描 Policy as Code，将安全遵从包内的法规标准条款代码化，周期性、自动化扫描云上资产的合规情况，可视化看板呈现风险，提供华为专家改进建议。自评估检查项将安全遵从包内的法规标准条款转化成检查项，租户可根据检查项完成自身业务的合规评估，查看历史评估结果，进行证据上传和下载，根据华为专家改进建议进行治理。合规结果可视可视化呈现合规评估结果与安全治理情况，包括租户订阅的法规、标准条款遵从概况，各安全遵从包状态，各策略扫描概况。说明：使用安全治理功能前，需先提交工单申请开通使用权限。 × × √

安全云脑 SECMASTER

共100000条

undefined

意见反馈

0/200

提交取消

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

华为云用户手册

7*24

备案

专业服务

退订

建议反馈

售前咨询热线