Informatica面试Top 50问题及答案 (2025)

本文为初学者和有经验的候选人准备了 Informatica 面试问题和答案,助您找到梦想的工作。

 

Informatica 面试问题和答案(初学者)

1. 您对企业数据仓库的理解是什么?

当组织数据在单个访问点创建时,就称为企业数据仓库。数据可以通过单个源存储提供全局视图。可以对同一源进行定期分析。它能提供更好的结果,但所需时间较长。

👉 免费 PDF 下载:Informatica 面试问题与答案 >>


2. 数据库、数据仓库和数据市场之间有什么区别?

数据库包含一组有意义的相关数据,通常比 数据仓库 小。而数据仓库包含各种数据,并且数据仅根据客户需求提取。另一方面,数据市场也是一组数据,旨在满足不同领域的需求。例如,一个组织有适用于其不同部门的数据块,如销售、财务、市场营销等。


3. 什么是域?

当所有相关关系和节点都被单个组织点覆盖时,就称为域。通过它,可以改进数据管理。


4. 存储库服务器和 PowerHouse 之间有什么区别?

存储库服务器控制整个存储库,包括表、图表和各种过程等。其主要功能是确保存储库的完整性和一致性。而 PowerHouse 服务器则负责服务器数据库存储库的各个因素之间的各种过程的实现。


5. Informatica 中可以创建多少个存储库?

Informatica 中可以创建任意数量的 存储库,但最终取决于端口数量。


6. 对会话进行分区有什么好处?

对会话进行分区意味着会话内的独立执行序列。其主要目的是提高服务器的运行效率。其他转换,包括提取和其他单个分区的输出,都以并行方式执行。


7. 加载过程完成后如何创建索引?

要实现加载过程后的索引创建,可以使用会话级别的命令任务。可以将创建索引的脚本与会话的工作流或会话后执行序列关联起来。此外,在转换级别,加载过程后无法控制这种类型的索引创建。


8. 解释会话。解释如何使用批处理来组合执行?

需要执行的一组指令,用于将数据从源转换为目标,称为会话。可以使用会话管理器或 pmcmd 命令执行会话。批处理执行可用于以串行或并行方式组合会话执行。批处理可以包含以并行或串行方式进行的各个会话。


9. 一个批处理可以包含多少个会话?

可以包含任意数量的会话,但如果批处理中的会话数量较少,则迁移会更容易。


10. 解释映射参数和映射变量的区别?

当值在会话执行期间发生变化时,称为映射变量。会话完成后,Informatica 服务器会存储变量的最终值,并在会话重新启动时重复使用。此外,那些在会话执行期间不发生变化的值称为映射参数。映射过程解释了映射参数及其用法。在会话开始之前,会为这些参数分配值。


11. 什么是复杂映射?

复杂映射的特点如下:

  • 复杂的需求
  • 大量转换
  • 复杂的业务逻辑

Informatica 面试问题和答案(有经验者)

12. 在不连接会话的情况下,如何判断映射是否正确?

可以通过调试选项在不连接会话的情况下找出映射是否正确。


13. 是否可以将一个映射中创建的映射参数或变量用于任何其他可重用转换?

可以,因为可重用转换不包含任何映射或映射。它们可以用于任何映射。


14. 解释聚合器缓存文件的用途?

聚合器转换 在每次运行时按指令块处理。它将临时值存储在本地缓冲区内存中。如果需要额外的内存,聚合器会提供额外的缓存文件来存储转换值。


15. 简要描述查找转换?

查找转换可以访问基于 RDBMS 的数据集。服务器通过使用查找表来查找特定表数据或数据库,从而加快访问速度。通过匹配转换过程中提供的所有查找端口的查找条件,可以获得结论性数据。


16. 什么是角色扮演维度?

在同一数据库域中用于扮演不同角色的维度称为角色扮演维度。


17. 在不使用 SQL 或其他转换的情况下,如何访问存储库报告?

答:存储库报告由元数据报告工具生成。它是一个 Web 应用程序,因此无需 SQL 或其他转换。


18. 存储库中存储的元数据类型有哪些?

元数据类型包括源定义、目标定义、映射、映射器、转换。


19. 解释代码页兼容性?

当数据从一个代码页移动到另一个代码页,前提是两个代码页具有相同的字符集,那么数据就不会丢失。源代码页的所有字符集都必须在目标代码页中可用。此外,如果源代码页的所有字符都不在目标代码页中,那么它将是一个子集,在转换期间由于两个代码页不兼容而肯定会发生数据丢失。


20. 如何同时验证存储库中的所有映射?

不能同时验证所有 映射,因为每次只能验证一个映射。


Informatica 面试问题和答案(2 年和 3 年经验)

21. 简要解释聚合器转换?

它允许进行聚合计算,如总和、平均值等。它与表达式转换不同,在表达式转换中,可以在组中进行计算。


22. 描述表达式转换?

在此类转换中,可以在将值写入目标之前计算单行值。它可用于执行非聚合计算。在输出结果进入目标表之前,也可以测试条件语句。


23. 您对筛选转换的理解是什么?

它是映射中过滤行的媒介。数据需要通过筛选转换进行转换,然后应用筛选条件。筛选转换包含所有输入/输出端口,只有满足条件的行才能通过该筛选器。


24. 什么是 Joiner 转换?

Joiner 转换合并了位于不同位置的两个相关异构源,而 Source Qualifier 转换可以合并来自同一源的数据。


25. 什么是查找转换?

它用于通过映射在关系表中查找数据。查找定义可以从任何关系数据库导入,该关系数据库具有连接客户端和服务器的倾向。可以在映射中使用多个查找转换。


26. 如何使用 Union 转换?

答:它是一种多输入组转换,可用于合并来自不同源的数据。它的工作方式类似于 SQL 中的 UNION ALL 语句,用于合并两个 SELECT 语句的结果集。


27. 您对增量聚合的理解是什么?

每当为聚合映射创建会话时,都会启用增量聚合选项。Power Center 通过映射和历史缓存数据执行增量聚合,以增量方式执行新的聚合计算。


28. 连接查找和非连接查找之间有什么区别?

当输入直接从管道中的其他转换获取时,称为连接查找。而非连接查找不直接从其他转换获取输入,但可以在任何转换中使用,并且可以使用 LKP 表达式像函数一样调用。因此,可以说非连接查找可以在映射中调用多次。


29. 什么是映射器?

使用映射器设计器创建的可回收对象称为映射器。它允许在多个映射中重用转换逻辑,并且它还包含一组转换。


30. 简要定义可重用转换?

可重用转换在映射中使用多次。它与使用该转换的其他映射不同,因为它存储为元数据。当对可重用转换进行任何更改时,映射中的转换都会失效。


31. 更新策略是什么意思,它有哪些不同的选项?

Informatica 按行处理。由于它是默认标记的,因此每个行都会插入到目标表中。当行需要基于某些顺序进行更新或插入时,则使用更新策略。此外,必须在更新策略中为已处理的行指定条件,以将其标记为更新或插入。


32. 导致 Informatica 服务器拒绝文件的场景是什么?

当它在更新策略转换中遇到 DD_Reject 时就会发生这种情况。此外,它还会中断行中的数据库约束字段。


33. 什么是代理键?

代理键是自然主键的替代项。它是表中每行的唯一标识。它非常有益,因为自然主键可能会发生变化,这最终会使更新更加困难。它们始终以数字或整数的形式使用。


34. 实现会话分区需要哪些先决任务?

为了执行会话分区,需要将会话配置为分区源数据,然后在多 CPU 上安装 Informatica 服务器机器。


35. Informatica 服务器在会话运行时会创建哪些文件?

在会话运行时,创建的文件包括错误日志、坏文件、工作流日志和会话日志。


Informatica 面试问题和答案(5 年以上经验)

36. 简要定义会话任务?

它是一组指令,用于指导 Power Center 服务器如何以及何时将数据从源传输到目标。


37. 命令任务是什么意思?

此特定任务允许在工作流期间在 Unix 或 Windows 的 DOS 中运行一个或多个 shell 命令。


38. 什么是独立命令任务?

此任务可以在工作流中的任何位置用于运行 shell 命令。


39. 什么是会话前和会话后 shell 命令?

命令任务可以称为会话任务的会话前或会话后 shell 命令。可以将其作为会话前命令、会话成功后命令或会话失败后命令来运行。


40. 什么是预定义事件?

它是一个文件监视事件。它等待特定文件到达特定位置。


41. 如何定义用户定义的事件?

用户定义的事件可以描述为工作流中的任务流。可以创建事件,然后在需要时触发它们。


42. 什么是工作流?

答:工作流是一组指令,它告知服务器如何执行任务。


43. 工作流管理器中有哪些不同的工具?

工作流管理器中的工具包括:

  • 任务设计器
  • 工作流组件设计器
  • 工作流设计器

44. 除了工作流管理器 pmcmd 之外,还有哪些用于调度目的的工具?

除了工作流管理器之外,用于调度目的的工具还可以是第三方工具,如“CONTROL M”。


45. 什么是 OLAP(在线分析处理)?

一种进行多维分析的方法。


46. OLAP 有哪些不同类型?举例说明?

ROLAP 示例:BO,MOLAP 示例:Cognos,HOLAP,DOLAP


47. 您对工作流组件的理解是什么?

当工作流任务被分组到一个集合中时,就称为工作流组件。工作流任务包括计时器、决策、命令、事件等待、邮件、会话、链接、赋值、控制等。


48. 目标设计器的用途是什么?

目标定义是在目标设计器的帮助下创建的。


49. 在 Informatica 中可以在哪里找到吞吐量选项?

吞吐量选项可以在 Informatica 的工作流监视器 中找到。在工作流监视器中,右键单击会话,然后单击“获取运行属性”,在“源/目标统计信息”下可以找到吞吐量选项。


50. 什么是目标加载顺序?

答:目标加载顺序是根据映射中的源限定符指定的。如果多个源限定符链接到不同的目标,则可以指定 Informatica 服务器将数据加载到目标的顺序。


这些面试问题也将有助于您的口试