Conheça os fundamentos de Data Warehouse.

data-warehouse

O que é o Data Warehouse:

O Data Warehouse é a tecnologia fundamental quando se trata de Business Intelligence (BI). Trata da organização do Banco de Dados.

Ralph Kimball define o (DW) como:"Uma cópia de dados transacionais, especificamente estruturados para consulta e análise".

É tão útil aos processos de BI pois oferece facilidade de operar com dados integrados, na obtenção de informações qualificada, além da rapidez para realizar consultas e variedade na geração de resultados.

Conceitos:

É tão útil aos processos de BI pois oferece facilidade de operar com dados integrados, na obtenção de informações qualificada, além da rapidez para realizar consultas e variedade na geração de resultados.​

Data Warehouse é um grande banco de dados que possui a responsabilidade de reunir em um único repositório, dados diversos de fontes diferentes mas necessários para a análise que podem ser úteis quando cruzadas e variam de acordo com o setor negócio por exemplo.

O que faz o DW especial é o seu processo de conversão ocorre na fase chamada de ETL (Extraction, Transformation e Load), quando os dados são trabalhados em uma área temporária, o stage, facilitando processo de integração da base, e finalmente carrega no DW.

Funcionamento do Fluxo:

O inicio é a extração dos dados das origens.Com arquivos em diversos formatos (TXT, XLS, PDF etc), além de formatos peculiares de sistemas particulares (ERP, CRM).

Em seguida o processo de (Extrair, Trasnformar e Salvar) o ETL. O processo para a condução dos dados até o armazenamento definitivo no DW. Aqui todas as tarefas de extração, tratamento e limpeza dos dados. Esses dados são trabalhados em uma área temporária o Stage, somente depois são inseridos no DW.

No Data Warehouse então são armazenadas as informações decisivas e de valor para a gestão.

Ainda temos o Data Mart é uma estrutura "micro" do DW, com informações em geral direcionadas a departamentos. São subconjuntos de informações do DW que podem ser identificados por assuntos ou departamentos por exemplo.

O processamento e Analise das informações são realizadas por ferramentas, que são citadas como "OLAP", do inglês On-line Analytical Processing, geralmente são ferramentas com capacidade de análise em múltiplas perspectivas.

Por fim a Mineração de Dados, que são as ferramentas com capacidade de descoberta de conhecimento relevante no DW. Elas encontram correlações e padrões dentro dos dados armazenados no DW.