Ao ler um post "humorístico" do Jim Harris, demonstra quanto é verdadeiro a utilização do placebo no tratamento dos dados. Acresc...

Desta vez vou colocar alguns números provenientes da falta de qualidade dos dados. Para ser mais simples vou dividir em dois grandes gru...

Muitas vezes é colocada a questão "Como posso medir a qualidade dos dados?" Logo à partida a qualidade de dados não pode ser med...

Quanto à normalização é um processo que requer cuidados específicos, especialmente se estivermos a tratar registos sensíveis. Quando digo se...

Para que se possa ter uma boa qualidade de dados é necessário em muitos casos fazer uma limpeza regular a esses dados. Se por um lado existe...

Uma das grandes dificuldades das empresas é a integração de dados por haver diferentes integrações de dados, especificas para cada uma das e...

Nos dias que correm a qualidade dos dados está cada vez mais presente, porque quando as coisas correm bem, não se olha muito para o que corr...

Depois de um interregno demasiado prolongado devido a falta de tempo, vou tentar voltar à cadencia anterior de colocação de posts, começando...

Ainda antes de libertar os novos posts, que estão a ser ultimados depois deste interregno, por manifesta falta de tempo, vou partilhar o lin...

Parece que agora que os dados são mais requeridos a falta de qualidade e de ferramentas de controle de qualidade dos mesmos está a vir ao de...

Ao ler uma noticia lembrei-me do post inicial onde falava num problema de qualidade de dados na Dinamarca. O assunto continua em cima da m...

Para terminar vamos desenvolver um pouco o output e como obter esse output. O resultado final, dependendo do fim pretendido, pode ter vári...

No fine tuning da deduplicação temos de ter em consideração o inicio, para encontrarmos o meio de alcançarmos o fim pretendido. Ou seja, tem...

Neste post vou descrever os diferentes tipos de listas que são possíveis de deduplicar. Tal como tinha dito no post inicial existem as lis...

Vou finalmente iniciar pelos tipos de deduplicacão. O mais habitual é a deduplicacão por indivíduo. Para a execução destas deduplicacões s...

Desta vez vou iniciar uma série de post's relativos à deduplicação (foi este o termo que "aprendi" a usar e que uso com mais f...

Segundo um estudo Holandês numa Base de Dados com mais de um milhão de registos, descobriram a existência de um local (Gravenhage), escrito ...

Tal como terminei o ultimo post vou continuar neste com uma noticia recente e que nos pode ajudar a mostrar um pouco a dificuldade que há na...

Se há momentos em que a qualidade dos dados está em destaque, certamente são estes momentos que vivemos, em que os custos são escrutinados a...

É sem dúvida um dos grandes temas do momento e como tal vamos falar um pouco da qualidade de dados na nuvem. É possível? Existem casos de su...

Flickr Images