2025 年 Teradata 面试热门 50 问及答案
本文将为初级和有经验的候选人提供 Teradata 面试问题及答案,帮助他们找到理想的工作。
Teradata 面试问题及答案(初级)
1) 您如何定义 Teradata?请给出其主要特征。
Teradata 基本上是一种 RDMS,用于驱动公司的 Datamart、Datawarehouse、OLAP、OLTP 以及 DSS 设备。Teradata 的一些主要特征如下。
- 能够运行在单节点和多节点上。
- 并行性已内置于系统中。
- 与 ANSI 标准高度兼容。
- 倾向于像服务器一样运行。
- 它是一个开放系统,主要为 UNIX MR-RAS、Suse Linux ETC、WIN2K 等执行。
2) Teradata 有哪些新开发的功能?
Teradata 的一些新开发功能包括:
- 自动时间序列分析
- 压缩功能的扩展,允许数据灵活压缩,数据量是先前版本的 20 倍。
- 客户相关的创新,例如 tetradata viewpoint。
3) 重点介绍一些 Teradata 的重要组件。
Teradata 的一些重要组件包括:
- Bynet
- 访问模块处理器 (AMP)
- 解析引擎 (PE)
- 虚拟磁盘 (vDisk)
- 虚拟存储系统 (VSS)
4) 请说明在 UNIX 环境中运行 Teradata 作业的程序。
您只需按照以下方式在 UNIX 中执行即可。
$Sh > BTEQ < [脚本路径] > [日志文件路径]
或
$Sh > BTEQ < [脚本路径] TEE [日志文件路径]
5) 在 Teradata 中,我们如何生成序列?
在 Teradata 中,我们通过使用标识列来生成序列。
6) 在显示时,Teradata 如何生成序列?
您只需使用 CSUM。
7) 一个表会受到一种负载,并且每小时都会如此。早晨的流量相对较低,而晚上的流量非常高。根据这种情况,最建议使用的工具是什么?该工具应该如何加载?
在这种情况下,最推荐的工具是 Tpump。通过增加或减少数据包大小,可以轻松处理流量。
8) 如果 Fast Load 脚本失败,并且您只能访问错误表,那么您将如何重新启动?
在这种情况下,基本上有两种重新启动的方法。
- 运行旧文件 – 确保不要完全删除错误表。而是尝试修复脚本或文件中的错误,然后再次执行。
- 运行新文件 – 在此过程中,脚本仅使用开始加载和结束语句执行。这将有助于删除目标表上的锁定,并可能从快速日志表中删除给定记录。完成后,您可以再次运行整个脚本。
9) 请列举一些属于 Teradata 的 ETL 工具。
在 Teradata 中常用的 ETL 工具 包括 DataStage、Informatica、SSIS 等。
10) 请重点介绍一些 ETL 工具相对于 TD 的优势。
ETL 工具相对于 TD 的一些优势包括:
- 可以操作多个异构目标和源。
- 由于完整的 GUI 支持,使用 ETL 工具可以更轻松地进行调试。
- ETL 工具的组件可以轻松重用,因此,如果主服务器有更新,则连接到服务器的所有相应应用程序都会自动更新。
- 可以使用 ETL 工具轻松完成反透视和透视操作。
11) Teradata 中的缓存是什么意思?
缓存被认为是使用 Teradata 的一个额外优势,因为它主要与保持相同顺序且不频繁更改的源一起工作。有时,缓存通常会在应用程序之间共享。
12) 我们如何检查当前使用的 Teradata 版本?
只需输入命令 .SHOW VERSION.
13) 请给出多重加载支持 NUSI 而非 USI 的合理理由。
NUSI 中的索引子表行与数据行在同一 Amp 上。因此,每个 Amp 都被单独且并行地操作。
14) MLOAD 客户端系统在执行后如何重新启动?
必须手动提交脚本,以便它可以轻松地从最后一个检查点加载数据。
15) MLOAD Teradata 服务器在执行后如何重新启动?
该过程基本上是从最后一个已知检查点开始执行的,一旦数据在 MLOAD 脚本执行后完成,服务器就会重新启动。
16) 什么是节点?
节点基本上是指硬件和软件组件的集合。通常,服务器被称为节点。
17) 假设有一个包含 100 条记录的文件,我们需要跳过前 20 条和后 20 条记录。代码片段是什么?
我们需要使用 BTEQ 工具来完成此任务。脚本中将使用 Skip 20 和 Repeat 60。
18) 解释 PDE。
PDE 基本上代表并行数据扩展。PDE 基本上是操作系统之上的软件接口层,它允许数据库在并行环境中运行。
19) 什么是 TPD?
TPD 基本上代表受信任的并行数据库,它基本上在 PDE 下工作。Teradata 是一种主要在 PDE 下工作的数据库。这就是为什么 Teradata 通常被称为受信任的并行数据库或纯粹的并行数据库。
20) 什么是通道驱动程序?
通道驱动程序是一种软件,它充当 PE 和运行在连接到客户端的通道上的所有应用程序之间的通信媒介。
Teradata 面试问题及答案(有经验者)
21) 什么是 Teradata 网关?
与通道驱动程序一样,Teradata 网关充当解析引擎和连接到网络客户端的应用程序之间的通信媒介。每个节点只分配一个网关。
22) 什么是虚拟磁盘?
虚拟磁盘基本上是由一系列物理磁盘的圆柱体组成的。有时它被称为磁盘阵列。
23) 解释 Amp 的含义?
Amp 基本上代表访问模块处理器,它是一个虚拟工作的处理器,基本上用于管理数据库的单个部分。数据库的这一特定部分不能被任何其他 Amp 共享。因此,这种架构通常被称为共享无架构。
24) Amp 包含什么?它执行哪些操作?
Amp 基本上包含一个数据库管理器子系统,并且能够执行下面提到的操作。
- 执行 DML
- 执行 DDL
- 实现聚合和连接。
- 释放和应用锁等。
25) 什么是解析引擎?
PE 基本上是一种 Vproc。其主要功能是接收 SQL 请求并以 SQL 形式提供响应。它包含一系列软件组件,用于将 SQL 分解为多个步骤,然后将这些步骤发送到 AMP。
26) 什么是解析?
解析是一个过程,涉及对计算机语言或自然语言的字符串符号进行分析。
27) 解析器的功能是什么?
解析器:
- 检查语义错误
- 检查语法错误
- 检查对象是否存在
28) 什么是调度程序?
调度程序接收一系列请求,然后将它们存储在队列中。在整个过程中,使用相同的队列来提供多个响应集。
29) PE 在特定时间最多能处理多少个会话?
PE 在特定时间最多可以处理 120 个会话。
30) 解释 BYNET。
BYNET 基本上充当组件之间的通信媒介。它主要负责发送消息,并负责执行合并和排序操作。
31) 什么是 Clique?
Clique 基本上是一组节点,它们由公共磁盘驱动器共享。Clique 的存在非常重要,因为它有助于避免节点故障。
32) 当节点发生故障时会发生什么?
当节点性能下降时,所有相应的 Vproc 会立即从故障节点迁移到新节点,以从公共驱动器恢复所有数据。
33) 列出 Teradata 中可用的所有锁类型。
Teradata 中基本上有四种锁类型。它们是:
- 读锁
- 访问锁
- 排他锁
- 写锁
34) 在 Teradata 中,锁在哪种特定级别上应用?
- 表级别 – 表中的所有行都会被锁定。
- 数据库级别锁 – 数据库中的所有对象都会被锁定。
- 行哈希级别锁 – 只有与特定行对应的那些行才会被锁定。
35) 在主索引中,有多少个 AMP 处于活动状态?
主索引中只有一个 AMP 处于活动状态。
36) 在 Teradata 中,UPSERT 命令的意义是什么?
UPSERT 基本上代表更新后插入。此选项仅在 Teradata 中可用。
37) 重点介绍 PPI(分区主索引)的优势。
PPI 主要用于基于范围或基于类别的imerick 存储。对于范围查询,无需进行全表扫描,因为它直接移动到后续分区,从而跳过所有其他分区。
38) 请给出 SMALLINT、BYTEINT 和 INTEGER 的大小。
SMALLINT – 2 字节 – 16 位 -> -32768 到 32767
BYTEINT – 1 字节 – 8 位 -> -128 到 127
INTEGER – 4 字节 – 32 位 -> -2,147,483,648 到 2,147,483,647
39) 什么是最低成本计划?
最低成本计划基本上在最短路径上以更少的时间执行。
40) 请重点介绍 Teradata 中数据库和用户之间的区别。
- 数据库基本上是被动的,而用户是主动的。
- 数据库主要存储所有数据库对象,而用户可以存储任何对象,无论是宏、表、视图等。
- 数据库没有密码,而用户必须输入密码。
Teradata 面试问题及答案(10年经验)
41) 请重点介绍主键和主索引之间的区别。
- 主索引是必需的,而主键是可选的。
- 主索引有 64 个表/列的限制,而主键没有限制。
- 主索引允许重复值和空值,而主键不允许。
- 主索引是物理机制,而主键是纯粹的逻辑机制。
42) 解释临时空间是如何使用的。
Teradata 中的临时空间基本上用于运行查询。在 Teradata 的可用总空间中,20% 的空间基本上分配给临时空间。
43) 请重点说明性能调优的必要性。
Teradata 中的性能调优基本上是为了识别所有瓶颈并解决它们。
44) 请评论瓶颈是错误还是不是。
从技术上讲,瓶颈不是错误,但它肯定会导致系统出现一定的延迟。
45) 如何识别瓶颈?
识别瓶颈基本上有四种方法。它们是:
- Teradata Visual Explain
- Explain 请求修饰符
- Teradata Manager
- 性能监视器
46) 什么是最高成本计划?
根据最高成本计划,执行过程所需的时间更长,并且它会走最长的可用路径。
47) 请列出置信度下的所有模式。
低、无、高和连接是置信度下的四种模式。
48) 请说出多重加载实用程序包含的五个阶段。
初步阶段、DML 阶段、数据采集阶段、应用程序阶段和结束阶段。
49) 请重点介绍 TPUMP 实用程序的限制。
TPUMP 实用程序的限制如下:
- 不能使用 SELECT 语句。
- 不能连接数据文件。
- 不支持聚合和指数运算符。
- 不支持算术函数。
50) 在 BTEQ 中,会话模式参数是如何设置的?
.set session transaction BTET -> Teradata 事务模式
.set session transaction ANSI -> ANSI 模式
这些命令只有在登录会话之前输入才有效。
这些面试问题也将有助于您的口试