Cos'è DSSbuilder?

Questo tool è stato realizzato con lo scopo di fornire uno strumento di facile ed immediato utilizzo a coloro i quali sono coinvolti nel settore della semantica distribuzionale.


La semantica è quella branca della linguistica che che si occupa dello studio del significato delle parole. Alla base della semantica distribuzionale risiede l'ipotesi che parole che ricorrono in contesti simili tendono a possedere simili significati. L’idea generale è quindi quella che esiste una correlazione tra la similarità distribuzionale e la similarità semantica tra due o più espressioni linguistiche.


Attraverso l'impiego del sito è possibile, previo il caricamento di un corpus di testo e di un elenco di parole target, costruire lo spazio semantico distribuzionale generato dalle risorse caricate.


Lo strumento fa uso di alcuni script scritti nel linguaggio di programmazione PERL per:

  • estrarre le co-occorrenze oggetto dell'indagine;
  • calcolare la Local Mutual Information delle co-occorrenze estratte per attribuirvi il peso statistico appropriato;
  • generare una matrice parola-contesto;
  • misurare la distanza semantica delle co-occorrenze attraverso il calcolo del coseno dell'angolo formato dai vettori riga e colonna della matrice.





   








   

Finestra di contesto:


Web-application per la costruzione di spazi semantici distribuzionali

Realizzato da Francesco Asaro sotto la supervisione del prof. Alessandro Lenci.
Corso di studi in Informatica Umanistica.
A.A. 2011/2012