GATTO is a lexicographic software created and developed by Domenico Iorio-Fili at the Centro Studi Opera of Italian Dictionary of CNR. This software was born as a tool aimed to the building, managing and interrogation of the corpus of texts that is the base of Historical Dictionary of Italian Language, on the point to be published at OVI.
GATTO gestisce quindi, oltre a basi testuali di altri gruppi di studiosi, il corpus testuale dell'OVI, corpus attualmente costituito da circa 420.000 forme e 75.000 lemmi distribuiti in 1780 testi, per un totale di oltre 20 milioni di occorrenze.
Più in generale GATTO permette di effettuare ricerche lessicografiche su un generico archivio testuale a condizione che i testi, opportunamente codificati, siano disponibili su file unitamente ai relativi dati bibliografici.
Ogni testo che si vuole analizzare deve essere corredato da opportune codifiche che indichino i numeri di pagina, le ripartizioni del testo, i brani in versi, le parti da escludere dalle ricerche e via dicendo. Per realizzare un file di questo tipo è sufficiente disporre di un programma di videoscrittura adeguato operante in ambiente Windows.
GATTO gestisce corpus e non singoli testi (si può però costruire un corpus formato da un singolo testo). Un corpus può essere modificato in seguito mediante aggiunta od eliminazione di testi. Le ricerche lessicografiche possono essere estese all'intero corpus oppure limitate di volta in volta ad uno o più sottoinsiemi dei testi componenti. È inoltre possibile, disponendone, utilizzare alternativamente corpus diversi.
Il programma è corredato di una Guida in linea sensibile al contesto in grado di fornire assistenza circa l'operazione di volta in volta in corso di svolgimento e di un manuale disponibile nei formati Word97, RTF o PDF.
Funzioni base di GATTO
ricerche lessicografiche
lemmatizzazione dei testi
gestione generale dei dati
A tali funzioni corrispondono all'interno del programma quattro ambienti: ambiente Ricerche, ambiente Lemmatizzazione per singolo testo, ambiente Lemmatizzazione sul corpus, ambiente Gestione della base di dati.