terça-feira, 6 de novembro de 2012

SOM e GTM

Atualmente são comuns os contextos onde a quantidade de dados disponível é gigantesca. Nestas situações, são necessárias técnicas adequadas para recuperação da informação, entre elas a mineração de dados (data mining).

Segundo Fayad, a descoberta ou extração de conhecimento em bases de dados (knowledeg discovery in databases) é um processo iterativo e interativo, não trivial, de identificação de padrões novos, potencialmente úteis e compreensíveis nos dados disponíveis.


Mas a mineração de dados, como mostra a figura acima, representa apenas a fase de análise de dados que já foram recuperados e transformados em um formato que possibilite sua manipulação adequada.

Os mapas auto-organizáveis (Self Organizing Maps - SOM) e o mapeamento topográfico gerativo (Generative Topographic Mapping - GTM) são técnicas importantes da recuperação de informação, particularmente úteis quando se pretende sua posterior visualização. Zuchini faz uma ótima apresentação destas técnicas em seu artigo "Modelos Computacionais Adaptativos para Recuperação de Informação".

4 comentários:

  1. Professor, esse técnica de recuperação e analise de informação, o Data Mining ou mineração de dados, é a mesma usada para análise de informações em um sistema de business intelligence ou business analytics?

    ResponderExcluir
    Respostas
    1. Sim Lucas, o data mining pode ser usado em sistemas de BI ou Analytics como estratégia inicial para descoberta de padrões, relações ou ocorrências nos dados. A partir disso o Analytics procura estender a análise para tentar prever situações futuras (o que as vezes é chamado de forecasting).

      Note que o uso de data mining não é obrigatório, pois existem técnicas estatícas para análise de dados, assim como estratégias baseadas em inteligência artificial (SOM e GTM).

      Excluir
    2. Mas o data mining também é usado no SOM? Pelo que eu entendi, ambos criam clusters para a descoberta de padrões, relações ou ocorrência nos dados, certo?

      Excluir
  2. Uma nova forma de modelo de variável latente, que nós chamamos o algoritmo GTM (para Generative Mapa Topográfico ), que permite gerais não-lineares transformações do espaço latente de espaço de dados, e que é treinado usando o algoritmo EM (expectativa de maximização) . Por isso, supera as limitações do SOM, introduzindo não desvantagens significativas. Foi o que compreendi lendo um resumo do livro "GTM: Uma alternativa de princípios para o Mapa Auto-Organização"

    ResponderExcluir