Guida a GattoWeb

stampa
Glossario


accumulatore

Tavola nella quale si copiano tutti o in parte i risultati di una ricerca (forme, lemmi o coppie forma-lemma) per l’uso successivo (visualizzazione di contesti o della lista testi), e che permette di raccogliere insieme forme, lemmi, o coppie forma-lemmi risultanti da più ricerche, anche di tipo diverso.


ansi

American National Standard Institute. Set di 256 caratteri riproducenti lettere maiuscole e minuscole con e senza accenti, numeri, segni di interpunzione e alcuni simboli speciali. I primi 128 caratteri sono uguali ai corrispondenti caratteri ASCII.


area generica

(dato bibliografico). Sigla che qualifica la provenienza linguistica di un testo assegnandolo ad un ambito esteso; nel sistema adottato all'OVI si tratta di regola di un ambito regionale. A seconda del tipo di corpus, questo dato può essere usato in coppia con quello contenuto in ‘area specifica’ in vario modo: per es. area generica = ‘lingue europee’, area specifica = ‘italiano’; area generica = ‘linguaggi tecnici’, area specifica = ‘linguaggio dell’ingegneria’.


area specifica

Sigla che qualifica la provenienza linguistica di un testo in modo più ristretto rispetto al dato contenuto in ‘area generica’; nell’uso dell’OVI si tratta della lingua di una città o di un paese (vedi per confronto area generica).


assetto grafico

Termine usato per definire l'insieme dei simboli grafici (lettere o altro) usati per scrivere una parola. Ad esempio, l'assetto grafico di è dato dalla lettera s, dalla lettera e e dall'accento acuto sulla e.


bottone

(vedi pulsante)


box a tendina

(vedi menu a tendina)


brano

Quando ad un testo del corpus è associato un secondo testo (non appartenente al corpus) che contiene una traduzione o una diversa versione del testo primario, le due opere sono suddivise in parti corrispondenti, dette brani, che non necessariamente corrispondono alle ripartizioni in periodi.


brano associato

Se il contesto visualizzato come risultato di una ricerca appartiene a un testo cui ne è associato un altro (non appartenente al corpus; può trattarsi di una traduzione o di una versione diversa), al contesto visualizzato può essere affiancata la porzione di testo corrispondente nel testo associato; questa porzione di testo è detta brano associato.


browser

Programma che consente di visualizzare le pagine dei siti appartenenti a una rete come Internet e di spostarsi (navigare) da una pagina all'altra.


carattere jolly

Carattere che, inserito in una parola, indica la presenza non di se stesso ma di altri caratteri. In particolare ? sta per un carattere qualunque; * sta per un qualunque gruppo di caratteri o nessun carattere.


categoria grammaticale

Parte del discorso (verbo, sostantivo, aggettivo,..) cui appartiene una parola. La classificazione adottata per il Corpus OVI dell’Italiano antico è quella descritta in Piero Esperti, Grammatichetta della lingua italiana ad uso del calcolatore, in d’Arco Silvio Avalle, Al servizio del vocabolario della lingua italiana, Firenze, Accademia della Crusca, 1979, pp. 123-87. Il software permette di adottare qualunque tipo di classificazione a seconda della natura e degli scopi del corpus.


categoria lessicale

Nell’uso dell’OVI (adottato per es. nella lemmatizzazione del Corpus Datini), la categoria attribuita ad una parola, diversa dalla categoria grammaticale (nome di persona, nome geografico, attrezzo, strumento musicale, cibo, animale...). Il sistema delle categorie può essere definito appositamente per ogni tipo di corpus.


checkbox

Riquadro che permette di attivare o disattivare una certa opzione del programma effettuando un singolo clic al suo interno. Un checkbox è attivato quando visualizza al suo interno un simbolo (una spunta, una 'x' o altro). Lo stato di attivazione di ogni checkbox è indipendente da quello di altri eventualmente presenti nella stessa pagina.


codice

Carattere o gruppo di caratteri che non appartiene al testo, ma ha la funzione di un’istruzione destinata al computer, che specifica quale operazione deve essere eseguita quando il programma analizza quel particolare punto del testo.


codifica

Insieme di codici diversi utilizzati, ad esempio, per marcare un testo elettronico.


contesto

Porzione di testo variabile contenente una occorrenza localizzata a seguito di una ricerca.


contesto kwic

(vedi kwic)


contesto standard

Porzione di testo contenente una occorrenza della forma cercata o analizzata. La sua lunghezza è normalmente di 31 parole, cioè quella localizzata e le 15 parole precedenti e successive; la lunghezza può essere inferiore poiché un contesto termina comunque se raggiunge i limiti del riferimento organico nel quale è incluso.


cooccorrenza

Presenza contemporanea di più elementi di testo, occorrenze e/o segni di interpunzione, entro una zona delimitata con precisione (intervallo di ricerca).


coppia forma-lemma

Connessione tra una forma e un lemma creata all'interno di GattoWeb quando almeno un'occorrenza della forma è lemmatizzata col lemma. L'utilità di questo legame consiste nel fatto che una ricerca effettuata a partire dal lemma permette di risalire alla forma (e alle sue occorrenze) e viceversa.


coppia forma-lemma muta

Coppia forma-lemma virtuale in quanto nel corpus non esistono in realtà occorrenze di quella forma lemmatizzate con quel lemma. La connessione è stata generata lemmatizzando un corpus diverso e poi forzatamente trasferita anche nel corpus corrente. L'utilità di questo legame consiste nel fatto che una ricerca effettuata a partire dal lemma permette, usando opportune opzioni di GattoWeb, di risalire comunque alle occorrenze della forma, non lemmatizzate o lemmatizzate con altri lemmi.


coppia lemma-iperlemma

Se il corpus include iperlemmi, ogni iperlemma di livello 1 è associato necessariamente a uno o più lemmi. Ognuna di queste associazioni costituisce una coppia lemma-iperlemma.


corpus

(plurale corpora). L'insieme dei testi che costituiscono la tavola dei testi citati. Si tratta in altre parole dell'insieme dei testi entro i quali è possibile fare delle ricerche.


default

Nel caso di possibilità di scelta tra più opzioni alternative, questo termine identifica la scelta impostata automaticamente dal programma in assenza di una indicazione esplicita da parte dell'utente.


diacritico

Carattere convenzionale, aggiunto ad un carattere alfabetico o inserito nel testo, avente uno speciale significato. Può essere, ad esempio, un accento, la cediglia, un punto in alto ("·") e via dicendo.


disambiguatore

Nella struttura dei lemmi di GattoWeb indica un attributo, di uso facoltativo, che permette di distinguere tra loro lemmi definiti dalla stessa entrata lessicale e dalla stessa categoria grammaticale (o lessicale, a seconda del corpus), oppure iperlemmi aventi lo stesso assetto grafico e livello.


dizionario di macchina

Lista dei lemmi associati ad una forma nell'ambito dell'intero corpus.


dominio di ricerca

Insieme di testi entro il quale viene effettuata una ricerca. Può coincidere con l'intero corpus, con un sottocorpus o con una combinazione di più sottocorpora.


entrata di vocabolario

La parola che funge da titolo ad una voce di un vocabolario, nella particolare forma prescelta a seconda dei criteri dello stesso (per es. l’infinito per i verbi, il maschile singolare per gli aggettivi ecc.). Con lo stesso significato viene usato molto frequentemente lemma; nell’uso dell’OVI si distinguono però le entrate del vocabolario (il TLIO) dai lemmi del Corpus OVI dell’Italiano antico lemmatizzato, perché non corrispondono necessariamente.


entrata lessicale

Assetto grafico di un lemma.


flessione

Variazione morfologica di una parola in rapporto alle varie funzioni grammaticali e sintattiche. Sinonimo di declinazione o coniugazione. Ad esempio, andarono è una forma flessa di andare, belle è una forma flessa di bello.


forma

Ogni singola parola, distinta dalle altre esclusivamente in base all'assetto grafico, che può comparire un qualsiasi numero di volte (occorrenze) nel corpus o in un testo.


forma (riferita ad un testo)

(dato bibliografico). Codice relativo alla tipologia del testo. I codici utilizzati dall'OVI sono: M per testo misto versi/prosa, P per testo in prosa, V per testo in versi.


forma monorematica

Parola formata da una sola sequenza di caratteri, senza spazi all'interno (in opposizione a forma polirematica).


forma polirematica

Forma composta da più parole separate da spazi e considerata come un tutto unico (in opposizione a forma monorematica).


formario

Elenco di tutte le forme diverse presenti nei testi del corpus, di un sottocorpus o di un testo.


formario esclusivo

Riferito a un testo o a un sottocorpus, è l'insieme di tutte le forme presenti al loro interno ma assenti in tutti gli altri testi del corpus.


GATTO

Acronimo per Gestione degli Archivi Testuali del Tesoro delle Origini. È il software usato per costruire, lemmatizzare e interrogare in rete locale i corpus testuali interrogabili via Internet con GattoWeb.


genere

(dato bibliografico). Sigla che connota un'opera come appartenente ad un determinato genere letterario o di scrittura.


index locorum

In latino "Indice dei luoghi". Denota un elenco, riportato in forma compatta, dei luoghi (in un testo o in un corpus: per es. testo, pagina e riga, testo, capitolo e paragrafo) nei quali si trovano occorrenze di una certa forma o di un gruppo di forme.


intervallo di ricerca

Zona del testo entro la quale devono essere racchiuse delle occorrenze per essere prese in considerazione nella formazione di una cooccorrenza; l'intervallo di ricerca può essere definito fissandone le dimensioni in numero di parole, facendone coincidere gli estremi con i limiti di un periodo o combinando entrambi i vincoli.


iperlemma

Elemento che può essere messo in connessione con più lemmi, consentendone la localizzazione simultanea in fase di ricerca. Data la struttura gerarchica nella quale possono essere collocati gli iperlemmi, ognuno di loro, anziché con dei lemmi, può essere collegato con altri iperlemmi di livello inferiore; un iperlemma può inoltre essere direttamente associato a occorrenze specifiche di forme specifiche. A titolo di esempio, possiamo immaginare una struttura gerarchica che includa vegetale (iperlemma di livello 2), associato ad albero (iperlemma di livello 1) a sua volta connesso coi lemmi faggio, pino, abete ecc.. In fase di ricerca vegetale o albero permetteranno di localizzare i lemmi come faggio e pino, le forme a loro collegate e relative occorrenze. Un iperlemma è caratterizzato dall'assetto grafico, dal livello e da un eventuale disambiguatore.


iperlemmario

Elenco di tutti gli iperlemmi utilizzati nel corpus.


iperlemmatizzazione

Operazione che associa a un lemma (ed eventualmente a un'occorrenza di una forma) un iperlemma.


kwic

(KeyWord In Context): contesto presentato su un'unica riga, con la parola trovata disposta al centro della riga di lettura.


lemma

La forma, presente nei testi o ricostruita, cui viene riportato un insieme di forme che si distinguono fra loro soltanto per l'assetto grafico (varianti grafiche, con o senza valore di varianti fonetiche) e/o perché sono forme della flessione dello stesso verbo o sostantivo o aggettivo. Corrisponde di regola, ma nell’uso dell’OVI non necessariamente, ad un'entrata del vocabolario. Ad esempio, la forma andarono è riferibile al lemma andare, la forma belle al lemma bello.


lemma muto

Lemma virtuale in quanto nel corpus non esistono in realtà forme lemmatizzate con quel lemma. Il lemma è stato generato lemmatizzando un corpus diverso e poi forzatamente trasferito anche nel corpus corrente. L'utilità di questo elemento consiste nel fatto che una ricerca effettuata a partire dal lemma permette, usando opportune opzioni di GattoWeb, di risalire comunque alle occorrenze delle forme, presenti nel corpus corrente, lemmatizzate con quel lemma nel corpus di partenza.


lemmario

Elenco di tutti i lemmi usati per lemmatizzare i testi del corpus, di un sottocorpus o di un testo.


lemmario esclusivo

Riferito a un testo o a un sottocorpus, è l'insieme di tutti i lemmi utilizzati per lemmatizzare occorrenze al loro interno; negli altri testi del corpus non esistono occorrenze lemmatizzate con tali lemmi.


lemmatizzazione

Operazione che associa un lemma a una occorrenza di una forma.


lista testi

Nella terminologia di GattoWeb indica l'elenco dei testi che includono le occorrenze che soddisfano una certa ricerca. Per ottenere la lista testi è necessario selezionare un'apposita modalità di ricerca.


menu a tendina

Elemento grafico normalmente composto da un riquadro e una freccia diretta in basso, posta sulla parte destra: cliccando sulla freccia apparirà una lista di dati alternativi tra i quali scegliere, cliccandolo, quello da inserire nel riquadro, come dato selezionato. Una volta effettuata la selezione, la lista di dati del box a tendina si richiude e resta visibile il solo dato selezionato (sinonimo di box a tendina).


occorrenza

Ogni singola parola di un testo, intendendo per parola una stringa di caratteri delimitata a sinistra e a destra da uno spazio o da un carattere di interpunzione. Intesa come evento, un’occorrenza è una singola comparsa di una forma in un testo. Il programma permette di conoscere il numero di occorrenze del corpus corrente, di un sottocorpus o di un singolo testo.


occorrenza iperlemmatizzata

Singola parola presente in un punto di un testo del corpus, separata dalla altre da spazi o segni di interpunzione, alla quale sono stati associati un lemma e un iperlemma di livello 1 mediante l'operazione di lemmatizzazione.


occorrenza lemmatizzata

Singola parola presente in punto di un testo del corpus, separata dalla altre da spazi o segni di interpunzione, alla quale è stato associato un lemma mediante l'operazione di lemmatizzazione.


omografo

Parola che ha lo stesso assetto grafico di un'altra, ma diverso significato. Ad esempio porta intesa come sostantivo è un omografo di porta voce del verbo portare.


option box

Finestrina circolare che permette di selezionare un'opzione del programma, scegliendo tra più opzioni alternative, ognuna controllata da uno specifico option box; gli option box tra i quali va operata una scelta mutuamente esclusiva sono racchiusi, ed eventualmente separati da altri option box presenti nella stessa finestra, da appositi pannelli o riquadri. Per attivare l'opzione associata ad un option box, disattivando automaticamente le opzioni alternative, fare clic su di esso. Un option box è attivato quando evidenzia al suo interno un dischetto nero.


OVI

Sigla dell'Istituto Opera del Vocabolario Italiano del Consiglio Nazionale delle Ricerche.


pagina

Ognuna delle schermate che GattoWeb (così come ogni altro programma in Internet) presenta all'utente.


pannello

Riquadro presente in una pagina di GattoWeb, usato per separare gli elementi (scritte o altro) contenuti al suo interno dal resto della pagina. Un riquadro, tipicamente di forma rettangolare, si distingue dall'ambito circostante per un differente colore e/o per la presenza di un bordo.


parola

Nell’uso di GattoWeb, come in generale di tutti i programmi di trattamento informatico di testi, è una stringa di caratteri inclusa in un testo e delimitata a sinistra e a destra da uno spazio o da un carattere di interpunzione.


pseudocarattere

Carattere diacritico appartenente ad una forma. Se presente, determina un ordinamento alfabetico tra forme che, in sua assenza, risulterebbero uguali. Non agisce invece sull'ordinamento alfabetico tra forme che in sua assenza risulterebbero diverse. Esempi di pseudocaratteri sono l'apostrofo e il punto in alto "·".


pulsante

Elemento grafico presente in una pagina e caratterizzato da una scritta descrittiva dell'azione che verrà svolta dal programma cliccando su di esso col tasto sinistro del mouse (sinonimo di bottone).


punteggiatura debole

Segno di interpunzione che il programma non interpreta come un separatore tra periodi. Sono segni di punteggiatura debole " « » , - ( ) . (punto debole). Possono essere definiti punteggiatura debole ! ? ... Questa definizione deve essere stabilita all’atto della creazione del corpus e non può essere modificata senza ricrearlo.


punteggiatura forte

Segno di interpunzione che il programma interpreta come un separatore tra periodi. Sono segni di punteggiatura forte . : ; Possono essere definiti punteggiatura forte ! ? ... Questa definizione deve essere stabilita all’atto della creazione del corpus e non può essere modificata senza ricrearlo.


punto di abbreviazione

Un punto che segnala un'abbreviazione o che sta per un carattere mancante dal testo, distinto da quello che ha valore di segno di interpunzione.


raffinamento

Restrizione dei contesti mostrati a quelli che includono o non includono una o più forme specificate, entro una distanza massima dalla forma centrale. La procedura di raffinamento può essere riapplicata più volte ai risultati via via ottenuti.


ricerca espansa

Ricerca estesa a tutte le parole caratterizzate dalla stessa sequenza di lettere, a prescindere dalla presenza o meno di accenti o altri caratteri diacritici; ad esempio, la ricerca espansa di "che" oppure di "ché" potrà localizzare "ché", "chè", "che", "che·",..


riferimento organico

Stringa che contiene il titolo di una ripartizione del testo (capitolo, paragrafo, ecc.). Con lo stesso termine ci si può riferire alla porzione di testo associata a questo titolo.


riferimento topografico

Dato che permette di individuare precisamente la collocazione di una parola nell’edizione a stampa del testo. È costituito da: volume (se multiplo), numero di pagina, numero di colonna (se la pagina contiene più colonne), numero di riga nella pagina (o nella colonna se la pagina contiene più colonne).


rima al mezzo

Una parola interna al verso che rima con parole alla fine o all’interno di altri versi; con lo stesso termine si indica la codifica che la individua.


RTF

Rich Text Format. Codifica standard che integra il testo vero e proprio con codici atti a memorizzare le istruzioni di formattazione, consentendo la lettura ed il recupero integrale di un documento completo di tutte le caratteristiche tipografiche da parte di qualunque programma in grado di interpretare questa codifica.


selettore

Riquadro destinato a contenere una forma, un lemma, una categoria grammaticale (o lessicale, a seconda del corpus), un iperlemma, un disambiguatore o un gruppo di tali elementi per indicarlo come obiettivo da localizzare in una ricerca.


sigla

Stringa formata da caratteri alfanumerici che identifica univocamente un testo del corpus.


sintagma

Successione di più parole che hanno, nel loro insieme, una determinata funzione sintattica o semantica; per es. quest’ermo colle nel primo verso dell’Infinito di Leopardi (soggetto di Sempre caro mi fu), in quattro e quattr’otto (locuzione avverbiale) ecc.


sottocorpus

Sottoinsieme dei testi inclusi nel corpus, utilizzabile per effettuare ricerche su porzioni limitate di esso. È possibile definire contemporaneamente fino a 6 sottocorpora ed utilizzarne una qualunque combinazione.


tipo

(dato bibliografico). I codici relativi utilizzati all'OVI sono: M per misto originale/volgarizzamento, O per originale, P per parafrasi, T per traduzione, V per volgarizzamento.


variante grafica

Parola che differisce da quella di cui costituisce una variante per leggere differenze nell'assetto grafico, fermo restando il significato. Ad esempio, nell'italiano antico si può trovare chasa come variante grafica di casa.