Questo progetto di tesi è stato realizzato per valutare la possibile applicazione al lessico italiano degli schemi di annotazione semantica attualmente in uso per lo studio della linguistica inglese.
Per portare a termine l’analisi semantica di parte dei predicati utilizzati correntemente nella lingua italiana, e poterne quindi analizzare criticamente i risultati, si è scelto di utilizzare come riferimento lo schema di annotazione proprio della Proposition Bank. Il set di frasi da cui sono stati estratti i verbi, presentati nelle seguenti pagine HTML, provengono da un corpus annotato per l’ISST-CoNLL Shared Task, ovvero un sub-corpus estratto dall’ “Italian Syntactic-Semantic Treebank” (ISST).
L’ISST rappresenta un corpus della lingua italiana sviluppato tra il 1999 ed il 2001 e risulta costituito da 305.547 word-tokens, che rispecchiano l’uso contemporaneo del linguaggio. Tutte le farsi contenute nel progetto sono state, infatti, ricavate da articoli di quotidiani.