CRM: Limpeza inicial dos dados
16:12Voltamos depois do post de ontem onde se falou um pouco mais da ferramenta Batch, ao CRM com a limpeza inicial dos dados. Relembro apenas que o DQBT é uma ferramenta essencial para esta limpeza dos dados.
Primeiro que tudo, a limpeza inicial dos dados é de primordial importância. A este respeito, a base de dados inteira é verificada e limpa numa execução em batch. O número de diferentes fontes de dados ou dos países a que pertencem são irrelevantes aqui.
Procedimento típico para que esta limpeza inicial:
- Os dados são convertidos para um formato padronizado.
Exemplo: formato padronizado para os números de telefone.
++351 211571495
00351-21-1571495 => 00351 211 571 495
+351 (21) 1571495
- O conteúdo das diferentes fontes de dados é atribuído aos campos padrão.
Exemplo: O nome da pessoa de contacto está em campos com nomes diferentes em cada fonte de dados.
Nome: Godinho, Osvaldo
PNome: Osvaldo Apelido: Godinho
Contacto: Osvaldo Godinho
- As componentes do nome são analisadas.
Linhas de nome muito complexas que sejam compostas por vários indivíduos ou incluir o nome da empresa com o departamento e contacto serão analisados. A análise verifica se os dados se referem a dados de pessoas ou dados da empresa. Todos os elementos da linha do nome são também atribuídos aos campos especiais, de modo a que, por exemplo análises de títulos académicos ou formas jurídicas de empresa possam ser realizadas.
Exemplo: DataLab, Lda
-> Nome da Empresa: DataLab
Datalab, Lda
-> Forma Legal: Lda.
- A validação dos endereços é realizada.
A validação dos endereços é feita independentemente sejam endereços nacionais e/ou internacionais. A este respeito, o código postal, localidade, rua e número de porta são verificados. Se possível, componentes do endereçoem falta são corrigidas e/ou adicionadas.
Ruas oficialmente renomeadas e lugares são actualizados automaticamente. Apartados e validação de códigos postais em batch de clientes também estão disponíveis para alguns países.
Exemplo:
R Podre Local 16 => Rua do Poder Local, 16
1675 Pontihna => 1675-634 Pontinha
- Os endereços são convertidos para formatos específicos.
Em certos países, por exemplo, França, o endereço deve ser formatado de acordo com as especificações das autoridades postais nacionais, a fim de ser capaz de tirar partido das medidas de optimização de taxa de franquia, para as opções de entrega mais barata possível.
Exemplo de um endereço de França:
- Os endereços são reforçados com informações adicionais.
Os endereços podem ser melhorados com informações relevantes, conforme necessário. Isso pode ser coordenadas geográficas, mas outros códigos por sector ou visualização, informações definidas pelo utilizador podem ser também anexados aos dados.
Por exemplo:
Rua do Poder Local, 16 => X: -00920163
1675-364 Pontinha => Y: +03876310
- São identificados os duplicados.
Duplicados potenciais são identificados de acordo com algoritmos de busca personalizados individualmente.
Regras de negócio adequadas podem ser aplicadas na pesquisa, de modo que a sua posterior eliminação pode ser executada automaticamente até certo ponto. Os duplicados são também avaliados, com o grau de "certeza", ou seja, o grau de probabilidade pode ser definido. Escusado será dizer que estão disponíveis esquemas padronizados de correspondência, que podem ser aplicados aos dados de pessoas ou dados de empresas. Também é possível incorporar novos campos em campos livres em busca de duplicados.
Por exemplo:
Osvaldo Godinho O Godinho
Rua do Poder Local, 16 = R Podre Local, 61
1675-157 Pontinha 1675-157 Pontihna
A comparação destes dois registos proporciona um elevado grau de semelhança, embora o nome, rua, numero de porta e localidade sejam diferente.
No entanto, a diferença neste exemplo e com o algoritmo seleccionado correspondente não for tão grande, que os registos de dados são identificados como um único bloco.
- É constituído o "Registo de Ouro".
A formação de um "Registo de Ouro" é fundamental, especialmente quando os dados vêm de uma variedade de fontes que tenham mais conteúdos relevantes associados, além da informação do endereço. Como resultado, existe a possibilidade de transferir todas as informações dos duplicados para o "Registo de Ouro". Mesmo que os dados duplicados não tenham de ser eliminados, a sua marcação é possível, de modo que as informações contidas num duplicado possam ser exibidas para o utilizador no sistema de CRM. Exemplo: O duplicado tem um campo adicional com coordenadas que devem ser anexada ao "Registo de Ouro". Se o duplicado é excluído da base de dados, o "Registo de Ouro" também inclui esta informação.
Osvaldo Godinho O Godinho
Rua do Poder Local, 16 = R Podre Local, 16
1675-157 Pontinha 1675-157 Pontihna
X: -00920163 <- X: -00920163
Y: +03876310 <- Y: +03876310
0 comentários