Thesaurus e controllo terminol

Views:
 
Category: Entertainment
     
 

Presentation Description

No description available.

Comments

Presentation Transcript

Indicizzazione e thesauri: 

Indicizzazione e thesauri Daniele Danesi Provincia di Verona Verona, 7.8 maggio 2003 Ifniaformazione Divisione Formativa di Ifnet s.r.l.

Principi generali e definizione Modalità di controllo della terminologia: 

Principi generali e definizione Modalità di controllo della terminologia Nessun controllo Liste strutturate Liste strutturate con indice Soggettari Thesauri Classificazioni

Principi generali e definizione Modalità di controllo della terminologia: 

Principi generali e definizione Modalità di controllo della terminologia Sistemi di indicizzazione Estrazione Indicizzazione Assegnazione da parte della macchina Precoord Postcoord Classificazioni Alfabetici

Principi generali e definizione : 

Principi generali e definizione Che cosa è un thesaurus Vocabolario di un linguaggio di indicizzazione controllato, organizzato in maniera formalizzata in modo che le relazioni a priori tra i concetti (es. relazioni generiche e specifiche) siano rese esplicite.

Principi generali e definizione : 

Principi generali e definizione Che cosa non è un linguaggio una lista di termini uno strumento di recupero delle informazioni uno strumento informatico o parainformatico

Principi generali e definizione : 

Principi generali e definizione ma è una struttura classificatoria (spesso una vera e propria classificazione) uno strumento di controllo del vocabolario, cioè un vocabolario controllato e formalizzato

Principi generali e definizione : 

Principi generali e definizione A che cosa serve a ridurre le dimensioni del vocabolario e a controllare la varietà del linguaggio naturale a evitare la dispersione delle informazioni in base a un criterio casuale come l’ordine alfabetico, mediante la costruzione di relazioni che raccolgono i concetti per mezzo di criteri classificatori a permettere all’utente di vedere la struttura del linguaggio e quindi a poter accedere da qualunque punto della struttura e a poter raggiungere qualunque informazione mediante il reticolo delle relazioni

Principi generali e definizione : 

Principi generali e definizione A che cosa somiglia alle classificazioni ai soggettari ai thesauri linguistici ai dizionari linguistici

Principi generali e definizione : 

Principi generali e definizione Criteri generali: la formalizzazione Il thesaurus è il vocabolario di un linguaggio di indicizzazione controllato. Le caratteristiche fondamentali a cui deve conformarsi sono: concisione, sinteticità, non ridondanza biunivocità nel rapporto tra termine e concetto rappresentato referenzialità struttura maggiore vicinanza possibile al linguaggio naturale

Morfologia : 

Morfologia Forma e tipi di termini In linea di massima il thesaurus accetta un solo tipo di termine, il sostantivo, e tutti quei sintagmi che sono assimilabili ai sostantivi: non accetta cioè aggettivi, avverbi o verbi se non in combinazione con sostantivi. Gli stessi aggettivi sostantivati sono da accogliere con molta cautela. Il termine, sia esso nome comune come nome proprio, va sempre usato nella sua forma diretta

Morfologia : 

Morfologia Forma e tipi di termini Sono quindi forme accettate: Nomi comuni termini formali termini molto generici (di solito: attività) forme gergali nomi propri usati con valore di nome comune

Morfologia : 

Morfologia Forma e tipi di termini nomi propri nomi di organizzazioni sigle nomi geografici nomi di persone (e, in combinazione, nomi delle loro opere) combinazioni di nomi comuni e nomi propri altri nomi propri (avvenimenti, etc.)

Morfologia : 

Morfologia Forma dei termini: il numero I termini di un vocabolario controllato possono essere espressi, quanto a numero, in modi diversi: tutti i termini al singolare (esclusi i pluralia tantum), nella forma tipica di enciclopedia e dizionari uso di singolare e plurale in base a criteri predefiniti, criteri che, in ultima analisi, si possono ricondurre all’appartenenza categoriale del termine uso prevalente del singolare, ma con l’uso anche del plurale quando ritenuto necessario per rispettare l’uso linguistico

Morfologia : 

Morfologia Il principio della numerabilità Il principio base di applicazione di singolare e plurale è quello della numerabilità: si usa il plurale per i termini che rappresentano concetti numerabili, che si possono contare e quindi rispondono alla domanda quanti; si usa il singolare per i termini che non sono numerabili, che cioè rappresentano concetti di massa (es. i materiali), rispondono alla domanda quanto o di entità (es. concetti astratti)

Morfologia : 

Morfologia Categorie Categorie plurali Aree Avvenimenti Istituzioni Oggetti (attrezzature, strumenti, strutture, documenti) Organismi (animali, piante) Persone

Morfologia: 

Morfologia Categorie Categorie singolari Attività, discipline, processi Credenze e sistemi ideologici Materia (sostanze, materiali) Proprietà, caratteristiche, condizioni Tempo

Morfologia: 

Morfologia Categorie Categorie miste Parti del corpo Per le parti del corpo vale una regola particolare, di facile applicazione, che stabilisce che viene usato il singolare quando un organo, un sistema o un elemento esiste, in un organismo completo, in un solo esemplare (es. Naso, Gola, Cuore), se esiste in più esemplari si userà il plurale (es. Polmoni, Mani, Gambe, Ventricoli)

Morfologia: 

Morfologia Scomposizione 1° criterio - parte + tutto - proprietà + possessore Es. Pendici montane = Pendici + Montagne

Morfologia: 

Morfologia Scomposizione 2° criterio Azione transitiva + Oggetto Es. Sfruttamento dei giacimenti = Giacimenti + Sfruttamento

Morfologia: 

Morfologia Scomposizione 3° criterio Azione intransitiva + Soggetto Es. Scioglimento dei ghiacciai = Ghiacciai + Scioglimento

Morfologia: 

Morfologia La disambiguazione Il metodo classico di disambiguazione è quello delle parentesi tonde che serve a creare termini diversi nei casi di omografia e di polisemia: Azione (Filosofia) Azione (Sociologia) Una volta fatta un’operazione di questo tipo si hanno due termini, ognuno con un suo corredo sintattico

Morfologia: 

Morfologia La disambiguazione Un altro metodo, meno usato ma più elegante è quello della contestualizzazione: Azione – Filosofia Azione – Sociologia In questo caso abbiamo un solo termine, molto generico, e due azioni esercitate su di esso, rappresentate dalle due discipline

Morfologia: 

Morfologia La disambiguazione Esiste anche un’altra soluzione, molto simile alla precedente: Azione : Concetti filosofici Azione : Concetti sociologici In questo esempio Azione può essere considerato ambiguo, ma lo possiamo considerare semplicemente come un termine, molto generico, che ha due campi di applicazione

Morfologia: 

Morfologia Limitazione delle disambiguazioni Se, da una parte, è indispensabile, nei limiti del possibile se ne dovrebbe limitare l’uso. Un sistema per ridurre le disambiguazioni è quello di non disambiguare, in una coppia (o più) di omografi, tutti i termini, ma solo quello o quelli che hanno significato meno tipico, o quello derivato rispetto a quello originario Società Società <diritto e economia>

Analisi categoriale e strutturazione: 

Analisi categoriale e strutturazione Elementi di un thesaurus Termini Termini preferiti (o descrittori) Termini non preferiti (non descrittori) Identificatori (nomi propri) Altri termini (termini con valore puramente descrittivo – formale, termini non indicizzati, termini utili, etc.) Nodi o etichette di nodo

Analisi categoriale e strutturazione: 

Analisi categoriale e strutturazione Altre strutture classificatorie Faccette, categorie Altre strutture di raggruppamento dei termini Fonti dei termini Articolazioni interne del thesaurus (elementi che servono a strutturare il thesaurus per aree disciplinari, microthesauri, etc.)

Analisi categoriale e strutturazione: 

Analisi categoriale e strutturazione Simboli BT, *BT, NT, *NT, BTP, NTP, BTG, NTG, RT, *RT, USE, UF, USE+, UF+, SN, HN, TT (e tutte le loro varianti linguistiche e di altro tipo)

Analisi categoriale e strutturazione: 

Analisi categoriale e strutturazione Elenchi esemplificativi di categorie 1. Persone Entità Prodotti Concetti Proprietà Materiali Processi Operazioni Industrie Luoghi Tempo Livello Forma bibliografica

Analisi categoriale e strutturazione: 

Analisi categoriale e strutturazione Elenchi esemplificativi di categorie 2. Cose, sostanze, entità Fenomeni naturali Prodotti Strumenti Costrutti mentali Parti di cose, sostanze, entità Componenti Organi Sistemi di cose Attributi delle cose Qualità, proprietà Struttura Misure Processi comportamentali Oggetti dell’azione (paziente) Relazioni tra cose, interazioni Effetti Reazioni Operazioni sulle cose Luoghi, condizioni Tempo

Analisi categoriale e strutturazione: 

Analisi categoriale e strutturazione Elenchi esemplificativi di categorie 3. Oggetti Strutture Prodotti Strumenti Documenti, costrutti mentali, forme Materia, materiali, sostanze Attività Discipline Avvenimenti Processi Credenze, sistemi ideologici Persone, gruppi Organismi viventi Istituzioni, organizzazioni Luoghi, spazio, aree Tempo, periodi Attributi, proprietà, caratteristiche, condizioni

SINONIMIA: 

SINONIMIA La sinonimia serve a: ridurre le dimensioni del vocabolario permettere l’accesso al vocabolario per mezzo di una terminologia più ricca possibile, anche a utenti che non conoscono quel particolare thesaurus

Sinonimia: 

Sinonimia I sinonimi possono presentarsi come: sigle e loro equivalente sciolto forme gergali, idiomatiche, di uso locale forme desuete, datate o socialmente non accettate forme in una lingue diversa da quella del vocabolario forme colte e popolari, termini scientifici e loro corrispettivi nel linguaggio corrente termini nuovi per concetti emergenti e loro corrispettivi non più accettati

Sinonimia: 

Sinonimia Criteri per la sinonimia la sinonimia dovrebbe sempre essere un rapporto di uno o più non preferiti a un preferito, ma non viceversa; non si dovrebbe mai avere la situazione in cui a un non preferito possano corrispondere più preferiti: in questo caso vuol dire che c’è un problema di analisi semantica o che qualcosa è andato storto

Sinonimia: 

Sinonimia Eccezione L’unica eccezione, poco usata peraltro in italiano, si ha quando si vuole rinviare da una differenza nascosta a tutti i termini che la contengono, es. Pastorizzato USE Birra pastorizzata Latte pastorizzato Panna pastorizzata

Sinonimia: 

Sinonimia La relazione sinonimica dovrebbe verificarsi sempre tra termini che appartengono alla stessa categoria (un’attività dovrebbe sempre rinviare a un’altra attività, un oggetto a un oggetto), vale a dire che tutti i termini di un gruppo di sinonimia dovrebbero appartenere tutti alla stessa categoria o faccetta. Eccezione

Sinonimia: 

Sinonimia Eccezione Si può avere una parziale eccezione a questo principio quando in un thesaurus una categoria viene sostituita, supplita da un’altra, cioè quando due categorie si considerano, ai fini dell’indicizzazione, come equivalenti per cui i membri di una delle due vengono ricondotti all’altra

Sinonimia: 

Sinonimia Criteri per l’implementazione della sinonimia Inserire come sinonimi nel thesaurus tutte le forme varianti che è possibile reperire Inserire solo le forme usate in maniera verificabile nella letteratura e/o dalla comunità degli utenti Trattare come sinonimi anche i quasi sinonimi o, viceversa, accettare una qualche ridondanza ammettendo anche termini sinonimi come preferiti

Relazioni gerarchiche: 

Relazioni gerarchiche Le relazioni gerarchiche Costituiscono la struttura portante del vocabolario. Esse individuano le classi in base ai criteri tipici delle classificazioni: la struttura gerarchica non solo lega reciprocamente due termini, ma dà luogo ad un rapporto di inclusione, che va dal termine più generico quello più specifico

Le relazioni gerarchiche: 

Le relazioni gerarchiche Due termini possono essere legati da una relazione gerarchica solo se appartengono alla stessa categoria . Per esempio, un termine che rappresenta un concetto di organismo non può avere come termine generico un termine che rappresenta un concetto di disciplina. Questo principio costituisce il fondamento della struttura del vocabolario.

Relazioni gerarchiche: 

Relazioni gerarchiche Esempio Animali BT Organismi RT Zoologia NON Animali BT Zoologia

Relazioni gerarchiche: 

Relazioni gerarchiche Si riconoscono 3 tipi di relazioni gerarchiche Relazione generica Relazione partitiva Relazione esemplificativa

Relazioni gerarchiche: 

Relazioni gerarchiche 1. Relazione generica È la relazione gerarchica tipica e di più ampia applicazione, in quanto utilizzata nella tassonomie. Stabilisce una relazione tra un genere e le sue specie: Uccelli NT Anseriformi NT Galliformi NT Gruiformi

Relazioni gerarchiche: 

Relazioni gerarchiche Edifici NT Edifici industriali NT Edifici militari NT Edifici per spettacoli NT Edifici rurali NT Edifici scolastici

Relazioni gerarchiche: 

Relazioni gerarchiche Per verificare la validità di una relazione generica si può ricorrere al medesimo test logico: “tutti e alcuni” vs. “alcuni e alcuni” utilizzato per distinguere le classe generica da quella quasi generica

Relazioni gerarchiche: 

Relazioni gerarchiche Relazione parte – tutto E’ considerata una relazione di tipo sintattico. Si possono, tuttavia, riconoscere alcuni casi nei quali la parte implica l’intero, e quindi la relazione parte – tutto va trattata come relazione semantica. Il rapporto di implicazione tra parte e tutto deve essere valido nel campo di pertinenza del vocabolario. Nei casi seguenti, invece, ha validità generale

Relazioni gerarchiche: 

Relazioni gerarchiche Relazione parte – tutto Parti di organismi Es. Apparato urinario NT Reni Aree Geografiche Es. Italia NT Toscana

Relazioni gerarchiche: 

Relazioni gerarchiche Relazione parte – tutto Discipline Es. Biologia NT Botanica NT Zoologia Strutture sociali ES. Unità sanitarie locali NT Distretti socio-sanitari

Relazioni gerarchiche: 

Relazioni gerarchiche Relazione esemplificativa E’ il legame che esiste tra una classe, espressa da un nome comune, e un esempio individuale di questa classe, espresso da un nome proprio: Regioni paludose NT Camargue NT Valli di Comacchio

Relazioni gerarchiche: 

Relazioni gerarchiche Relazione esemplificativa Si può rinunciare ad istituire collegamenti nel vocabolario fra le entità individuali e i loro termini generici. Queste relazioni possono essere indicate direttamente nella stringa di soggetto. Nella contestualizzazione il nome proprio è preceduto dal termine generico Es. Architetti: Borromini, Francesco Architetti: Piano, Renzo

Relazioni gerarchiche: 

Relazioni gerarchiche Relazione associativa E’ considerata una relazione residuale rispetto alle prime due. Si ha quando due termini sono legati da una relazione definitoria , diversa tuttavia dalla relazione di equivalenza e da quella gerarchica. Questa relazione serve a evidenziare relazioni molto strette, di sovrapposizione o interscambiabilità di significato, come nel caso dei quasi sinonimi, quando non siano trattati mediante la relazione sinonimica.

Relazioni gerarchiche: 

Relazioni gerarchiche Relazione associativa La relazione associativa è una relazione reciproca. Si può avere tra termini che appartengono alla stessa categoria e i cui significati si sovrappongono, tanto da essere usati talvolta in maniera intercambiabile Es. Abitazioni RT Alloggi

Relazioni gerarchiche: 

Relazioni gerarchiche Relazione associativa Tuttavia la relazione associativa più frequente è quella che lega termini che appartengono a categorie diverse. I questo caso svolge una importante funzione di collegamento tra strutture gerarchiche diverse. Es. Una disciplina e i fenomeni studiati Oceanografia RT Oceani

Relazioni gerarchiche: 

Relazioni gerarchiche Relazione associativa Es. Una attività e il suo agente o strumento Commercio al dettaglio RT Dettaglianti Concimazione RT Concimi Microscopia RT Microscopi

Relazioni gerarchiche: 

Relazioni gerarchiche Relazione associativa Es. Una azione e il suo prodotto Panificazione RT Pane Una azione e il suo paziente Adozione RT Figli adottivi Detenzione RT Detenuti

Relazioni gerarchiche: 

Relazioni gerarchiche Relazione associativa Es. Concetti in relazione alle loro proprietà Parlamentari RT Immunità parlamentare Invalidi RT Invalidità Concetti legati da un rapporto di causa ed effetto Parassiti RT Malattie parassitarie Guerre RT Danni di guerra

Relazioni gerarchiche: 

Relazioni gerarchiche Relazione associativa Es. Una cosa o azione e il suo agente contrario Dolore RT Analgesici Incendi RT Servizi antincendio Un concetto e il suo contrario Inquinamento RT Disinquinamento

authorStream Live Help