Master Data Management: O Ciclo de vida da qualidade dos dados

Um dos desafios é a actividade contínua do sistema MDM. Os dados nunca estão disponíveis de forma isolada ou parados. Em vez disso todos os ...

Um dos desafios é a actividade contínua do sistema MDM. Os dados nunca estão disponíveis de forma isolada ou parados. Em vez disso todos os dados são ligados entre si e continuamente em movimento.

No que respeita à qualidade dos dados, a limpeza periódica dos dados do cliente só é possível de forma muito limitada. Cada actualização, não importa se é uma medida para a optimização da qualidade dos dados em todos os dados ou preocupações com a entrada de registos de dados adicionais (por exemplo, após a aquisição dos dados do cliente ou ainda após a fusão das duas empresas), é, inevitavelmente, realizada com o sistema em operação.

Por conseguinte, é tanto mais importante que todos os registos de dados inseridos no sistema de Data Management atendam a um padrão de qualidade antes de serem inseridos.

O CICLO DE VIDA DE QUALIDADE DE DADOS DA UNISERV pode ser assim ilustrado:
1º passo: Os dados relevantes nos diversos sistemas de origem devem ser identificados antes de tudo. Essas fontes de dados podem ser analisadas por meio de ferramentas de profiling, que a Uniserv também dispõe.
Problemas a nível de metadados e nos dados em si podem assim ser identificados e iniciar-se medidas para saná-los.

2º passo: Numa etapa posterior, a limpeza (inicial), ocorre em função do conhecimento adquirido na área da caracterização. Todos os dados de conteúdo são antes de tudo validados aqui para correcção.
No caso dos dados do endereço, isso significa que os endereços são validados, corrigidos e completados, se necessário. Outro componente da limpeza inicial pode ser uma pesquisa de duplicados, ou na formação de grupos de idênticos ou pelo menos similares nas mesmas fontes de dados adicionais ou em grupos.
Consolidação dos registos de dados com informações adicionais (externas) também é possível. Vários parâmetros podem ser utilizados para o registo de grupos de dados ou para ligar diferentes fontes de dados. Mesclando os registos de diferentes fontes de dados (por exemplo, dados de clientes com informações do sistema ERP) também pode ser realizado por meio de chaves inequívocas (identificadores).

3º passo: A qualidade dos registos de dados é validado na interface durante a entrada de dados numa verificação em tempo real (também conhecido como Firewall de Qualidade de Dados). A exatidão e integridade dos dados de endereço é verificado em primeiro lugar. Em mais um passo, também é verificado se o sistema já contém um registo de dados com o mesmo conteúdo. O alto desempenho dessas validações é muito importante para a verificação em tempo real. Se demorar muito tempo, são deixadas de lado. Há um perigo que o MDM seja «contaminado» por dados não-validados.

4º passo: A validação permanente da qualidade dos dados num sistema MDM é recomendada, mesmo com o maior esforço possível. As regras de negócio especificadas nos processos de negócio podem ser mantidas sob vigilância através de monitorização em tempo real. Se os valores limite especificados anteriormente nos Key Performance Indicators (KPIs) são ultrapassados, as medidas podem ser implementadas em tempo útil, a fim de garantir uma qualidade elevada e permanente dos dados.

5º passo: Especialmente quando grandes volumes de dados são repetidamente adicionados aos dados existentes, medidas de limpeza periódica com os seguintes objetivos são recomendadas:
- Para detectar erros que tenham entrado no sistema, apesar da Firewall de qualidade de dados - ou porque nem todas as regras foram mapeadas ou os avisos que essas regras foram violadas por meio de intervenções do utilizador (por exemplo, um suspeito de duplicado, com uma probabilidade baixa).
- Os dados são sujeitos a um processo de envelhecimento, particularmente no caso dos sistemas do cliente MDM. Locais de destino são mesclados nas reorganizações do governo local, os códigos postais mudaram, as ruas são renomeadas ou indivíduos mudam de casa. (Isso geralmente ocorre sem que a pessoa ou a empresa seja informanda.) Como resultado, a taxa de erro de registros incorrectos no seu sistema MDM normalmente aumenta em 1-2 por cento ao mês. Isto pode ser evitado por meio desta etapa.

O MDM deve ser examinado com cuidado, os dados são afectados. Também é importante que os laços existentes entre os registos de dados de diferentes fontes de dados ou tabelas não sejam postos em causa com as medidas de limpeza periódica. Nesta sequência, as etapas individuais do Ciclo de Vida da qualidade dos dados criam uma base sólida como um todo para trazer a qualidade dos dados de uma empresa num nível elevado e mantê-lo no longo prazo. No entanto, os sistemas de gestão de dados são sistemas vivos. O conceito de «ciclo» (isto é recorrente), deve ser sempre considerada, especialmente no contexto de mudanças e alterações de regras de negócios e o aumento ou modificação das exigências feitas sobre os dados.

You Might Also Like

0 comentários

Flickr Images