Master Data Management: A qualidade dos meta dados
16:31Como mencionado anteriormente, os metadados são dados que são usados para descrever os atributos dos dados de conteúdo (dados do utilizador). Isso inclui os nomes de campo, bem como faixas de valores ou formatos de dados especificados. Num sentido mais amplo, esta categoria também inclui informações que fazem declarações sobre os modelos de dados, por exemplo, a vinculação de tabelas numa base de dados. Os exemplos seguintes fornecem um panorama dos possíveis problemas na área de metadados.
- Se um grande número de diferentes fontes de dados estão envolvidas, muitas vezes é perceptível que os campos têm os mesmos nomes, mas que contêm dados ou informações diferentes. No caso oposto, fontes de dados diferentes têm o mesmo conteúdo de dados e informações, mas o nome do campo varia. A figura ilustra isso.
Os nomes de campo diferentes das duas fontes de dados referem-se aos mesmos dados. Os metadados da morada na fonte de dados 2 é ambígua e permite uma grande margem de interpretações. O mesmo se aplica aos dados de telefone na primeira fonte de dados.
- A complexidade dos metadados e o significado do conteúdo do campo é ilustrado através do exemplo do campo "status do cliente"
Significado no sistema 1:Os clientes são aqueles que receberam o material publicitário.
Significado no sistema 2:Os clientes são aqueles que se inscreveram no site da empresa.
Significado no sistema 3:Os clientes são aqueles que pagaram uma factura.
- É importante que exista acordo sobre os formatos de dados .
Datas podem ser exibidos numa variedade de formatos:
Sistema 1: 2010/06/11
Sistema 2: 10-06-11
Sistema 3: 11 de junho de 2010
Sistema 4: 2010/11/06
Há duas possibilidades de interpretação, no caso do formato do sistema 2: 10 de junho 2011 ou 11 de junho, 2010.
A execução de um Data profiling é recomendado, a fim de obter uma visão global dos dados, especialmente dos metadados dos sistemas de origem. Os metadados são identificados num processo de engenharia inversa com base no conteúdo dos dados. O software de profiling fornece uma visão geral dos metadados num tempo muito curto e usa um "drill-down", função que fornece uma visão geral dos dados em si. O número de campos, o seu nome, tipo de conteúdo, faixa de valor, a potencial chave primária e muito mais podem ser facilmente visualizados e analisados. Idealmente, mais dependências entre as tabelas da fonte de dados também podem ser identificados por meio de associação e análise de dependência. Finalmente, os problemas dos dados recorrentes ou o preenchimento dos campos de dados nos sistemas de origem pode ser investigado no profiling. Os problemas aqui identificados, muitas vezes não pode ser sanada com a limpeza automática com o premir de um botão, mas exigem customização dos processos no seu lugar. Depois que a estrutura de todas as fontes de dados, que devem preencher o sistema de gestão da masterdata tenha sido determinado, um Master Meta Data Model deve ser escolhido. Este modelo descreve os dados no sistema MDM. Um acordo sobre o significado dos nomes de campo e o conteúdo do campo já foi atingido em toda a empresa. A criação de uma Master Meta Data Model é importante para a qualidade dos dados, pois especifica quais campos das fontes de dados preenchem os campos no sistema MDM e que informação contêm os campos.
0 comentários