Awards

Maggiori informazioni

Perchč la Semantic Intelligence?

Piů dell'80% (per non dire il 100%...) della conoscenza su cui basiamo il nostro lavoro non č strutturata, ma č in forma testuale. Capitale intellettuale (know how, brevetti, marchi, diritti, progetti) e risorse web rappresentano il vero e proprio centro delle nostre attivitŕ quotidiane: ogni giorno siamo sommersi da mail, documenti, pagine di siti, articoli, ricerche, rapporti… insomma una quantitŕ enorme di testi in cui sono racchiusi dati potenzialmente utili.


Ma ciň, invece che tradursi in una grande opportunitŕ di crescita e sviluppo, finisce paradossalmente per rappresentare il principale ostacolo alle attivitŕ di strategia, analisi e controllo, progetto.


L'informazione č nulla, se non č gestita.


Avere un sacco di materiale a disposizione senza conoscerlo equivale a non averne.

Non si puň pensare di riuscire a gestire le conoscenze di cui disponiamo contando solo sulle nostre doti manuali. Perché non ne abbiamo il tempo. Sono troppe le cose da leggere, analizzare, sintetizzare e confrontare con altro. E non č cosě facile trovare al momento giusto la cosa che ci serve - solo quella! - rielaborarla, integrarla in nuovi scenari, aggregarla a tutte le altre cose che ci servono e, finalmente, condividerla e renderla fruibile anche ad altri.


Nella gestione della conoscenza, la tecnologia č un fattore irrinunciabile.


La decisione riguarda semmai quale tecnologia scegliere fra quelle disponibili.

Esistono tre tecnologie per il trattamento delle informazioni non strutturate:

a keyword (parole chiave) con la possibile aggiunta di elementi statistici

linguistica superficiale

linguistica profonda o semantica, cioč l'unica tecnologia che prevede la comprensione del significato.

Tecnologia a keyword

Il testo viene spezzato nelle parole da cui č composto, senza alcuna considerazione del contenuto. Si opera su una versione "ripulita" da tutti gli elementi ad altissima frequenza (come gli articoli e le preposizioni, per esempio). Il testo cosě filtrato, dunque, non č altro che un insieme di stringhe di caratteri che compaiono un certo numero di volte.

In pratica, avviene lo stesso che ci capiterebbe se avessimo dinanzi un testo in una lingua che non conosciamo.

In ungherese, per esempio:


Az IBM szokásosan nagy hangsúlyt helyez a továbbképzésre, így munkatársai évente számos szakmai tanfolyamon vesznek részt. Az elmúlt években a csoport több tagja is részt vett több hónapos, egyesült államokbeli, angliai illetve németországi projekt munkákban, melyek során nemzetközi csoportban végeztek fejlesztoi tevékenységet.


Non abbiamo idea del significato (se non siamo esperti d'ungherese…); eppure arriviamo lo stesso a capire che szokásosan, nagy, hangsúlyt, helyez… sono parole probabilmente dotate di senso, degne di essere inserite in un indice apposito: l'indice delle keyword, appunto.

Questo significa che in ricerca potranno essere trovati solo quei documenti che contengono le parole scritte esattamente cosě come l'utente le scrive.


Cosě, una frase tipo…

Quest'anno chiuderemo due stabilimenti in Italia e ne apriremo altrettanti in Polonia.

… potrŕ essere trovata solo sapendo che il verbo "chiudere" č usato alla prima persona plurale del futuro semplice: cercando infatti la cosa piů naturale, e cioč "chiudere stabilimenti" non si otterrebbe il risultato desiderato.

Tecnologia linguistica superficiale

Se le parole da cui č costituito il testo vengono riconosciute, allora sono automaticamente ricondotte al lemma base.

Ciň significa, per esempio, che per una ricerca impostata con la parola "vendere" sarŕ possibile trovare documenti dove sono presenti anche "vende", "venderŕ", ecc.


Ma significa anche che fra i due testi sotto non verrŕ percepita alcuna differenza:


testo 1

New York, 27 aprile - Al termine della giornata di contrattazioni al New York Stock Exchange, l'indice Dow Jones dei trenta principali titoli industriali guadagna 110,61 punti (piů 1,03%) a quota 10.802,96 punti dopo diverse sedute di perdite consistenti.

In ribasso invece il Nasdaq, il mercato telematico dove sono scambiati molti titoli del settore tecnologico, che perde 4,19 punti (meno 0,2%), a quota 2.075,97 punti.


testo 2

New York, 27 aprile - A due ore dal termine della giornata di contrattazioni, il New York Stock Exchange, l'indice Dow Jones dei trenta principali titoli industriali perde 110,61 punti (meno 1,03%) a quota 10.802,96 punti.

In rialzo invece il Nasdaq, il mercato telematico dove sono scambiati molti titoli del settore tecnologico, che guadagna 4,19 punti (piů 0,2%), a quota 2.075,97 punti.


Sebbene i due testi siano percepiti come identici, in realtŕ qualcosa č cambiato…

Tecnologia semantica

La semantica presuppone sia l'analisi grammaticale, logica e sintattica sia il riconoscimento dei concetti: in altre parole, sono correttamente identificate le diverse accezioni dei termini ("calcio" come sport, come colpo dato col piede, come elemento chimico o come impugnatura di una pistola) e sono identificati i diversi modi di esprimere lo stesso concetto (ad esempio "macchina" inteso come veicolo a motore equivale a "automobile, automezzo, auto, autoveicolo"; e, volendo, anche a "berlina, utilitaria, cabriolet" o, addirittura a "ferrari, smart, xsara picasso…").



Il testo, in pratica, viene analizzato in modo simile a quanto fatto dalle persone.


La tecnologia semantica rende trattabili problemi non altrimenti affrontabili e consente di superare i limiti del "cercare" per passare direttamente al "trovare, organizzare, selezionare, correlare".


In modo simile a quanto consente la Business Intelligence sui dati strutturati, la soluzione definitiva per lo sfruttamento dei dati non strutturati - ovvero quello sconfinato universo di conoscenza con cui abbiamo a che fare - č la Semantic Intelligence.

 

Le ultime notizie

Expert System partecipa ai Forrester Groundswell Awards 2010 Categoria Business to Business, 2-9-2010

Prossimi Eventi Gli eventi in programma per l'autunno 2010

Expert System si conferma leader nei software semantici per le aziende The Gilbane Group, 24-8-2010