Auditoria de Qualidade de Dados: Qualidade de dados, o que está por detrás?

Será que a qualidade dos dados da empresa cumpre as exigências dos consumidores de dados? A fim de implementar medidas adequadas para melh...

Será que a qualidade dos dados da empresa cumpre as exigências dos consumidores de dados?

A fim de implementar medidas adequadas para melhorar a qualidade dos dados, deve ser assegurado que as acções (a) cumpram as exigências dos consumidores de dados e (b) aumentem a eficiência da empresa. A Auditoria de Qualidade de Dados é usada para determinar o status quo da qualidade dos dados.

Não é apenas nos dados em si que está o foco, mas, mais importante, nas exigências dos utilizadores em relação aos dados que são considerados. O processo de criação dos dados e da informação é examinado.

O Data Quality Audit tem uma estrutura modular, e cada módulo tem sua própria área de foco. Conceitos possíveis para a optimização da qualidade dos dados podem ser preparados em conjunto com os departamentos especializados.

De seguida vou apresentar o primeiro de 5 posts relacionados.

- A qualidade dos dados - o que está por detrás?
- "Single View of Customer" versus "Single View of Data"
- A qualidade da master data da empresa
- O status quo da qualidade dos dados da empresa: O Uniserv Data Quality Audit pode ajudar
- Olhando para o futuro

A qualidade dos dados - o que está por detrás?

Terra, trabalho e capital são os chamados de factores de produção convencional numa economia clássica. No entanto, o "conhecimento" ou "informação" é cada vez mais referido como um dos factores de produção importantes. (Bauer Wikipedia, e Günzel 2009). Neste contexto, a grande importância da informação proveniente dos dados se torna aparente.

Outra linha de pensamento diz respeito à produção de informações directamente para o fabrico de qualquer produto desejado (Ballou et al. 1998). Estas considerações foram precedidas pelo conceito de Total Quality Management (TQM). Este concentra-se na máxima satisfação dos requisitos para um produto e refere-se a todos os processos e departamentos envolvidos na produção e, portanto, a empresa inteira (Wikipedia).

A correlação entre a qualidade dos dados e os produtos pode ser expressa de forma muito simples: se a "informação" é considerada como um produto, determinados requisitos dos utilizadores deste produto também podem ser definidos e com especificações dos processos de produção.

No entanto, como devem os requisitos de informação e conhecimento serem definidos? Como pode ser verificado que as normas especificadas no processo de produção são cumpridas?

Se a produção de um carro é visualizada, presume-se que o produto final tem quatro rodas e as portas e janelas abertas, na realidade. O motor encaixa-se no corpo e as normas de segurança cumprem os requisitos. Todas estas e mais especificações foram repetidamente verificadas durante o processo de produção real e, portanto, correspondem aos requisitos previamente especificados do condutor posterior do carro. Se ocorrerem defeitos durante a produção, ela é imediatamente interrompida e processos de detecção de falhas e correcção são iniciados.

A produção de informação não deve ser diferente.

O exemplo a seguir ajuda a proporcionar um melhor entendimento dos TERMOS DE DADOS DE QUALIDADE DA INFORMAÇÃO E CONHECIMENTO:
- 0100010 01001101 01010111 => DADOS
- Char (66) char (77) char (87) => INFORMAÇÕES?
- BMW -> Três letras! => INFORMAÇÕES?
- BMW -> Binary Moving Window => INFORMAÇÕES?
- BMW -> Beer with Water => INFORMAÇÕES?
- BMW -> Motorenwerke Bayrische => INFORMAÇÕES?
- Bayerische Motorenwerke => Conhecimento!

Torna-se claro que os dados estão no início da cadeia. A informação é gerada a partir dos dados. Mas a informação de fundo é obrigada a fornecer o significado destas informações e que essas informações possam ser colocadas no contexto certo. No final, as conclusões correctas só podem ser estabelecidas e novos conhecimentos gerados, se os dados e informações no início desta cadeia estiverem correctos.

Para começar, o termo "qualidade" está em causa. Derivado da norma standard EN ISO 9000:2005, o grau de qualidade em que um produto (bem ou serviço) está em conformidade com os requisitos já existentes (Wikipedia). Isto significa que a qualidade pode ser boa ou má se atende aos requisitos do utilizador ou não.

Nos seus estudos, Wang e Strong (1996) pediu aos consumidores de dados para definir as propriedades de dados de boa qualidade. A Associação Alemã para a Informação e Qualidade dos Dados (DGIQ) retomou essa ideia e descritas as categorias e as dimensões da qualidade dos dados numa maneira fácil de entender (Rohweder et al. 2008).

Segundo este estudo, a qualidade dos dados pode ser dividida em quatro categorias e 15 dimensões.

Visão geral das categorias e dimensões da qualidade dos dados (após Rohweder et al. 2008)

Se cada uma das dimensões aqui referidas é considerada "boa", a qualidade dos dados pode ser considerada como ideal. Muitas das medidas citadas não podem ser avaliadas pelo sistema como indicadores de desempenho simples, uma vez que os consumidores dos respectivos dados sempre têm que decidir se a qualidade dos dados é boa.

Larry English (1999), outras abordagens de base, mas faz uma distinção fundamental entre a qualidade do conteúdo dos dados (correção dos dados) e a qualidade pragmática dos dados (apresentação dos dados).

É inerente a ambas as abordagens básicas que o foco de atenção é sobre o consumidor de dados que recebe os dados, de modo que ele possa exercer as suas funções de forma satisfatória. Ou, para expressá-lo nas palavras de Wang e Strong (1996), a qualidade dos dados é definida como "dados que estão aptos para o uso pelos consumidores de dados".

You Might Also Like

0 comentários

Flickr Images