La pagina "seria" di Lorenzo Masetti



Tesi e progetti per gli esami di informatica


La legge di Zipf

Questo progetto prevede di contare le parole in un testo per verificare la legge di Zipf: se ordino tutte le parole di un testo in ordine decrescente di frequenza e assegno ad ogni parola un rango definito come la posizione che ogni parola assume nella lista ordinata, allora il prodotto rango * frequenza è più o meno costante. La letteratura ridotta ad un'iperbole!

Ho letto che anche il linguaggio dei delfini segue la legge di Zipf. Alcuni scienziati hanno studiato i diversi tipi di suoni che i delfini emettono per comunicare (molto spesso non sono suoni isolati, ma appaiono in un certo contesto), li hanno ordinati per frequenza e hanno verificato che rispettano la legge di Zipf. Questo potrebbe voler dire che i delfini hanno un linguaggio articolato come quello umano, con tanto di sintassi!

Download

Relazione formato ps.gz 80K
xfreq Programma java per contare le frequenze in un file di testo (formato .jar) 25K

Il programma permette di contare le parole in un testo e di ordinarle rispetto alla frequenza. Per farlo partire usare il comando

java -jar xfreq.jar

(ma forse basta cliccarci sopra). Se volete fare delle prove con qualche libro italiano potete scaricare interi libri dal sito liberliber.