Metadados
Os metadados são definidos como dados dos dados, informações das informações. Dada a complexidade das informações de um Datawarehouse, a documentação dos sistemas e das bases de dados tornou-se de vital importância. Este tipo de registo já era tido como muito importante desde o surgimento das primeiras bases de dados. Com o Datawarehouse, tornou-se fundamental; em grandes projectos, se não houver uma documentação eficiente, o mais certo é mais ninguém conseguir manter o sistema.
Num projecto de Datawarehouse, deve-se gerar documentação sobre o levantamento de dados, da base de dados, relatórios a serem gerados, origem dos dados que alimentam o Datawarehouse, processos de extracção, tratamento e rotinas de carga dos dados, além de, possivelmente, regras de negócio da empresa e todas as suas mudanças.
Segundo Inmon, os metadados englobam o Datawarehouse e mantém as informações sobre o que está onde. O autor ainda define quais as informações que os metadados devem manter:
- A estrutura dos dados segundo a visão do programador;
- A estrutura dos dados segundo a visão dos analista de SAD;
- A fonte de dados que alimenta o Datawarehouse;
- A transformação sofrida pelos dados no momento da sua migração para o Datawarehouse;
- O modelo de dados;
- O relacionamento entre o modelo de dados e o Datawarehouse;
- O histórico das extracções de dados;
- Os dados referentes aos relatórios que são gerados pelas ferramentas OLAP, assim como os que são gerados nas camadas semânticas.
Os metadados podem surgir de vários locais durante o decorrer dos projectos. Desde o material que tem origem nas reuniões com os utilizadores até à documentação dos sistemas operacionais. Aliás, as reuniões tornam-se, muitas vezes, uma fonte preciosa de informações, pois muitos dados levantados não estão (e não estariam) documentados em nenhum outro local. Nesta fase, deve-se definir, inclusive, as regras para validação dos dados após carregamento no Datawarehouse.
Como pudemos ver, o volume de metadados gerados é muito grande. Existem hoje algumas ferramentas que fazem única e exclusivamente a gestão dos metadados. Elas têm algumas características peculiares. Essas ferramentas conseguem mapear as informações em todas as etapas de desenvolvimento dos projectos, desde a conceptual até à de visualização dos dados em ferramentas OLAP/EIS.
Uma regra de boa implementação de um projecto de Datawarehouse diz que devemos sempre ter muita atenção aos metadados, pois são eles que servirão de guia por entre as brumas das tabelas, relatórios e dados quando estivermos perdidos.
















