Extensor paralelo datastage (datastage px)

Definição - O que significa DataStage Parallel Extender (DataStage PX)?

DataStage Parallel Extender (DataStage PX) é uma ferramenta de integração de dados IBM. É uma entre as muitas ferramentas de extração, transformação e carregamento (ETL) amplamente utilizadas no setor de armazenamento de dados. Essa ferramenta pode coletar informações de fontes heterogêneas, realizar transformações de acordo com as necessidades do negócio e carregar os dados nos respectivos data warehouses.

O DataStage PX também pode ser chamado de DataStage Enterprise Edition.

Definirtec explica DataStage Parallel Extender (DataStage PX)

O DataStage Parallel Extender possui uma arquitetura paralela para processar dados. Os dois principais tipos de paralelismo implementados no DataStage PX são pipeline e paralelismo de partição. A capacidade de processar dados em paralelo acelera o processamento de dados em grande medida.

O DataStage Parallel Extender incorpora uma variedade de estágios por meio dos quais os dados de origem são processados ​​e reforçados nos bancos de dados de destino. Eles são definidos em termos de terabytes. Além dos estágios, o DataStage PX usa contêineres para reutilizar os componentes e sequências do trabalho para executar e agendar vários trabalhos ao mesmo tempo.

Os estágios comumente usados ​​no DataStage Parallel Extender incluem:

  • transformador
  • Agregador
  • Conjunto de dados
  • Copiar
  • Mudança aplicável
  • modificar
  • filtros
  • Regista-te em
  • ir
  • Olho para cima