Indicizzazione semantica latente
L’indicizzazione semantica latente è la traduzione in lingua inglese di “Latent Semantic Indexing” abbreviata con LSI. Quest’espressione indica un metodo di indicizzazione e restituzione dei risultati che adopera una tecnica matematica detta scomposizione ai valori singolari.
Questa tecnica viene usata per identificare dei modelli nelle relazioni tra termini e concetti contenuti in un gruppo di testi.
L’indicizzazione semantica latente si basa sul principio che una parola che è utilizzata nello stesso contesto tende ad assumere lo stesso significato. Una caratteristica di rilievo di questo metodo è la capacità di estrarre il contenuto concettuale di un testo stabilendo delle associazioni tra i termini che si trovano in contesti simili.
I benefici dell’adozione dell’indicizzazione semantica latente sono molteplici: uno in particolare è in grado di risolvere il problema di termini con più di un significato o parole con significati simili.
Si sono ottenuti dei miglioramenti nella qualità dei risultati di un’interrogazione, adoperando l’indicizzazione semantica latente sono restituiti agli utenti risultati più pertinenti grazie alla categorizzazione che prevede l’assegnamento di documenti in base alla somiglianza con il contenuto.
admin on October 9th 2009 in indicizzazione, information retrival, motori di ricerca, tecniche, white hat