O que é ETL?
O processo de ETL, da sigla “Extração, Transformação e Carga” (“Extract, Transform and Load” em inglês), surgiu como uma estratégia para otimizar a análise dos bancos de dados. O ETL é muito comum no contexto do Data Warehouse (DW) e Business Intelligence (BI), já que consegue integrar os dados e facilitar sua inserção em ferramentas ou ambientes integrados.
Como a própria sigla já diz, o processo é dividido em três etapas:
- Extração
Na primeira fase, os dados são coletados e conduzidos para a staging area, ou seja, para uma área de transição. Depois disso, eles são organizados e convertidos para um formato único.
Essa primeira etapa tem o objetivo de homogeneizar as informações extraídas, o que permite que os dados sejam manipulados nas próximas fases.
- Transformação
Depois da coleta e formatação, os dados estão prontos para a etapa de transformação. Aqui, os dados são corrigidos e tratados para atender aos padrões de limpeza, padronização e qualidade.
É a hora de eliminar inconsistências para que as informações estejam de acordo com as regras do negócio.
- Carga
Depois de todos os tratamentos necessários, os dados são enviados para o ambiente de armazenamento escolhido, que pode ser um Data Warehouse ou um Data Mart. O carregamento não precisa ser realizado em um único ambiente, já que os dados podem ser depositados em diferentes aplicações ou na nuvem.
Por fim, as informações vão poder ser acessadas de forma organizada e acessível, podendo servir de insumo para o processo de mineração de dados.