­

Parece que agora que os dados são mais requeridos a falta de qualidade e de ferramentas de controle de qualidade dos mesmos está a vir ao de...

Parece que agora que os dados são mais requeridos a falta de qualidade e de ferramentas de controle de qualidade dos mesmos está a vir ao de cima. Aqui fica mais um exemplo da falta de qualidade, neste caso num banco. Provavelmente, o que aconteceu foi que o Steve Smith se inscreveu numa campanha e como não estava...

Read More

Ao ler uma noticia lembrei-me do post inicial onde falava num problema de qualidade de dados na Dinamarca. O assunto continua em cima da m...

<
Ao ler uma noticia lembrei-me do post inicial onde falava num problema de qualidade de dados na Dinamarca. O assunto continua em cima da mesa porque muitas pessoas não sabem o que fazer, nem fazem ideia qual é o seu problema. Sabem que existe, sabem que têm de o resolver, mas como... não se faz a mínima ideia....

Read More

Para terminar vamos desenvolver um pouco o output e como obter esse output. O resultado final, dependendo do fim pretendido, pode ter vári...

<
Para terminar vamos desenvolver um pouco o output e como obter esse output. O resultado final, dependendo do fim pretendido, pode ter várias "formas". Pode ser apenas um ficheiro com os registos duplicados e respectivos masters, pode ser um ficheiro apenas com os limpos ou um ficheiro apenas com os duplicados. O que o software faz é a...

Read More

No fine tuning da deduplicação temos de ter em consideração o inicio, para encontrarmos o meio de alcançarmos o fim pretendido. Ou seja, tem...

<
No fine tuning da deduplicação temos de ter em consideração o inicio, para encontrarmos o meio de alcançarmos o fim pretendido. Ou seja, temos de saber de onde vamos e para onde vamos. Tipicamente existem 3 tipos de deduplicação a Standard, Overkill e Underkill. Se falarmos de uma deduplicação normal, a deduplicação standard, depois vamos afinar conforme os...

Read More

Flickr Images