Informatica中的源分析器 | 如何创建源和目标
在 ETL/数据仓库中,您会遇到不同的源和目标。
Informatica 中的源定义
Informatica 中的源定义是一个从中提取记录的实体,然后您将这些记录存储在临时表(暂存表)或 Informatica 转换缓存中。根据映射设计文档/业务需求,您会对这些数据记录进行更改(转换数据),然后将转换后的数据加载到另一个表结构中,称为目标表。
在每个 Informatica 映射中,始终会有一个源和一个目标。要在 Informatica 中管理不同的源和目标,您必须使用源分析器和目标设计器。这些工具集成在 Powercenter Designer 工具中,并可以直接从那里启动。
Informatica 中的源分析器
Informatica 中的源分析器是一个允许您创建和修改源定义的工具。借助源分析器,您可以创建或导入 Informatica 中的各种源,例如平面文件、关系数据库、Excel 工作表、XML 定义等。
类似地,使用目标设计器,您可以创建或导入各种目标。Informatica 提供了一个功能,可以从头开始通过设计其结构来创建源/目标,或者您可以导入定义来创建源/目标。当您从数据库导入源时,将导入以下元数据:
- 源(表)名称
- 数据库位置
- 列名
- 列数据类型
- 限制
您还可以定义表中的键关系,这仅适用于 Informatica 级别,并存储在存储库中。
在 Informatica 中创建/导入的源或目标可以在不同的映射中重复使用任意次数。每个映射必须至少有一个可加载的目标。否则,映射将无效。
注意 – 当我们在源分析器/目标设计器中创建源/目标时,结构仅在 Informatica 中创建。在数据库级别,不会创建任何对象。因此,您必须创建与您在 Informatica 中创建的结构相同的数据库对象。
您可以使用源分析器导入以下类型的源:
- 关系表(数据库表)、视图和同义词
- 平面文件
- Cobol 文件
- XML 文件
性能提示 – 要提高关系源表的性能,请在源数据库表上使用索引。在目标表上,禁用或删除约束和索引以提高性能。
如何在 Informatica 中打开源分析器
以下是打开 Informatica 源分析器的分步过程:
步骤 1) 打开 Informatica PowerCenter Designer 工具
步骤 2) 在下一个屏幕中
成功登录后,用户的文件夹将列在存储库名称下
注意 –
- 如果登录不成功,请检查用户是否具有连接到存储库的权限
- 如果在存储库名称下未显示任何文件夹,请检查是否已创建文件夹。
- 如果最近创建了文件夹,请断开与存储库的连接然后重新连接。
步骤 3) 在下一步中
- 右键单击文件夹
- 选择“打开”选项
当文件夹打开时,该文件夹的子文件夹将被列出。
步骤 4) 单击“源分析器”菜单,如图所示。
如何在源分析器中导入源表
以下是在 Informatica 源分析器中导入源表的步骤:
步骤 1) 转到“源”选项
在源分析器中
步骤 2) 创建 ODBC 连接
我们现在将创建 ODBC 连接(如果您已有 ODBC 连接,请转到步骤 3)
- 单击 ODBC 数据源旁边的按钮。
- 在下一页上,选择“用户 DSN”选项卡,然后单击“添加”按钮。
DSN(数据源名称)基本上是一种数据结构,它包含特定详细信息(数据库类型、位置、用户信息等)的信息。ODBC 驱动程序需要此信息,以便它可以连接到该数据库。
- 当您单击“添加”按钮时,您将看到各种数据库(Oracle、SQL Server、Sybase、Microsoft Access、Excel 等)的驱动程序列表。您选择的驱动程序取决于您要连接的数据库。选择数据源的驱动程序。在此 guru99 中,您将使用 Oracle 数据库表。选择 Oracle Wire Protocol 驱动程序。
-
在下一页上,选择“常规”选项卡并输入数据库详细信息。然后单击“测试连接”。
注意 – 数据库详细信息取决于您的安装,取决于您在数据库安装期间选择的主机名、端口和 SID。您可以通过打开位于 Oracle 安装文件夹中的 tnsnames.ora 文件来获取这些详细信息。
- 为测试连接窗口和 ODBC 驱动程序设置窗口选择“确定”。创建的 ODBC 数据源将被添加到用户数据源。现在我们已经设置了 ODBC 数据源。
步骤 3) 创建模式表
在 guru99 中,您将使用 Oracle 的 Scott/Tiger 模式表。如果您数据库中没有这些表,请使用此脚本创建它们。
步骤 4) 输入数据库详细信息
在导入表窗口中
- 选择 Oracle 数据库的 ODBC 数据源。
- 输入数据库用户名
- 输入数据库密码
- 单击“连接/重新连接”按钮。这将显示数据库用户的表。
- 展开“表”文件夹下的树,然后选择 EMP 表
- 选择“确定”按钮。
步骤 5) 验证并保存导入的表
表将被导入到 Informatica 源分析器中。使用“Ctrl+S”键将更改保存到存储库。
类似地,您可以在源分析器中导入任何其他数据库表。
如何在 Informatica 目标设计器中导入目标
以下是在 Informatica 目标设计器中导入目标的流程:
在本教程中,您将创建目标表 emp_target,其结构与源 EMP 表相同。要导入目标表,目标表必须存在于数据库中。要创建目标表,请使用以下脚本。Informatica 中可用的目标类型包括关系型、XML 和平面文件。
注意 – 在本教程中,源表和目标表都在同一个数据库模式(guru99)中。但是,您也可以在不同的模式中创建目标。
步骤 1) 在 Informatica Designer 中,单击目标设计器图标启动目标设计器。
步骤 2) 在下一步中
- 从主菜单选择“目标”选项
- 选择“从数据库导入”选项
步骤 3) 在导入表窗口中。
- 选择 Oracle 数据库的 ODBC 数据源。
- 输入数据库用户名
- 输入数据库密码
- 单击“连接/重新连接”按钮。这将显示数据库用户的表。
- 展开“表”文件夹下的树,然后选择 EMP_TARGET 表。
- 选择“确定”按钮
这将把目标导入 Informatica Powercenter 的目标设计器中。使用“ctrl+s”键保存更改。
在本教程中,您已经导入了源和目标。现在,您可以创建您的第一个映射了。
如何在 Informatica 中创建文件夹
以下是如何在 Informatica 中创建文件夹的步骤:
Informatica 文件夹是逻辑容器,用于存放您在 Informatica Designer/Workflow Manager 中创建的对象(映射、映射组件、源、目标等)。
创建文件夹
步骤 1) 打开存储库管理器
注意 – 如果 Informatica Designer 已打开,则可以通过工具箱中的快捷方式打开存储库管理器。
这将会在一个单独的窗口中打开 Informatica Repository Manager。
步骤 2) 按照以下步骤操作
- 单击“文件夹”菜单
- 选择“创建”选项
步骤 3) 在下一步中
- 输入所需的文件夹名称
- 选择“确定”
这将创建一个新文件夹,并显示消息“文件夹已成功创建。”
新创建的文件夹将列在相应的存储库下。
本教程到此结束。下次再见!