|
Perchč la Semantic Intelligence?Piů dell'80% (per non dire il 100%...) della conoscenza su cui basiamo il nostro lavoro non č strutturata, ma č in forma testuale. Capitale intellettuale (know how, brevetti, marchi, diritti, progetti) e risorse web rappresentano il vero e proprio centro delle nostre attivitŕ quotidiane: ogni giorno siamo sommersi da mail, documenti, pagine di siti, articoli, ricerche, rapporti… insomma una quantitŕ enorme di testi in cui sono racchiusi dati potenzialmente utili. Ma ciň, invece che tradursi in una grande opportunitŕ di crescita e sviluppo, finisce paradossalmente per rappresentare il principale ostacolo alle attivitŕ di strategia, analisi e controllo, progetto. L'informazione č nulla, se non č gestita. Avere un sacco di materiale a disposizione senza conoscerlo equivale a non averne. Non si puň pensare di riuscire a gestire le conoscenze di cui disponiamo contando solo sulle nostre doti manuali. Perché non ne abbiamo il tempo. Sono troppe le cose da leggere, analizzare, sintetizzare e confrontare con altro. E non č cosě facile trovare al momento giusto la cosa che ci serve - solo quella! - rielaborarla, integrarla in nuovi scenari, aggregarla a tutte le altre cose che ci servono e, finalmente, condividerla e renderla fruibile anche ad altri. Nella gestione della conoscenza, la tecnologia č un fattore irrinunciabile. La decisione riguarda semmai quale tecnologia scegliere fra quelle disponibili. Esistono tre tecnologie per il trattamento delle informazioni non strutturate: • a keyword (parole chiave) con la possibile aggiunta di elementi statistici • linguistica superficiale • linguistica profonda o semantica, cioč l'unica tecnologia che prevede la comprensione del significato. Tecnologia a keywordIl testo viene spezzato nelle parole da cui č composto, senza alcuna considerazione del contenuto. Si opera su una versione "ripulita" da tutti gli elementi ad altissima frequenza (come gli articoli e le preposizioni, per esempio). Il testo cosě filtrato, dunque, non č altro che un insieme di stringhe di caratteri che compaiono un certo numero di volte. In pratica, avviene lo stesso che ci capiterebbe se avessimo dinanzi un testo in una lingua che non conosciamo. In ungherese, per esempio: Az IBM szokásosan nagy hangsúlyt helyez a továbbképzésre, így munkatársai évente számos szakmai tanfolyamon vesznek részt. Az elmúlt években a csoport több tagja is részt vett több hónapos, egyesült államokbeli, angliai illetve németországi projekt munkákban, melyek során nemzetközi csoportban végeztek fejlesztoi tevékenységet. Non abbiamo idea del significato (se non siamo esperti d'ungherese…); eppure arriviamo lo stesso a capire che szokásosan, nagy, hangsúlyt, helyez… sono parole probabilmente dotate di senso, degne di essere inserite in un indice apposito: l'indice delle keyword, appunto. Cosě, una frase tipo… Quest'anno chiuderemo due stabilimenti in Italia e ne apriremo altrettanti in Polonia. … potrŕ essere trovata solo sapendo che il verbo "chiudere" č usato alla prima persona plurale del futuro semplice: cercando infatti la cosa piů naturale, e cioč "chiudere stabilimenti" non si otterrebbe il risultato desiderato. Tecnologia linguistica superficialeSe le parole da cui č costituito il testo vengono riconosciute, allora sono automaticamente ricondotte al lemma base. Ciň significa, per esempio, che per una ricerca impostata con la parola "vendere" sarŕ possibile trovare documenti dove sono presenti anche "vende", "venderŕ", ecc. Ma significa anche che fra i due testi sotto non verrŕ percepita alcuna differenza: testo 1 New York, 27 aprile - Al termine della giornata di contrattazioni al New York Stock Exchange, l'indice Dow Jones dei trenta principali titoli industriali guadagna 110,61 punti (piů 1,03%) a quota 10.802,96 punti dopo diverse sedute di perdite consistenti. In ribasso invece il Nasdaq, il mercato telematico dove sono scambiati molti titoli del settore tecnologico, che perde 4,19 punti (meno 0,2%), a quota 2.075,97 punti. testo 2 New York, 27 aprile - A due ore dal termine della giornata di contrattazioni, il New York Stock Exchange, l'indice Dow Jones dei trenta principali titoli industriali perde 110,61 punti (meno 1,03%) a quota 10.802,96 punti. In rialzo invece il Nasdaq, il mercato telematico dove sono scambiati molti titoli del settore tecnologico, che guadagna 4,19 punti (piů 0,2%), a quota 2.075,97 punti. Tecnologia semanticaLa semantica presuppone sia l'analisi grammaticale, logica e sintattica sia il riconoscimento dei concetti: in altre parole, sono correttamente identificate le diverse accezioni dei termini ("calcio" come sport, come colpo dato col piede, come elemento chimico o come impugnatura di una pistola) e sono identificati i diversi modi di esprimere lo stesso concetto (ad esempio "macchina" inteso come veicolo a motore equivale a "automobile, automezzo, auto, autoveicolo"; e, volendo, anche a "berlina, utilitaria, cabriolet" o, addirittura a "ferrari, smart, xsara picasso…").
In modo simile a quanto consente la Business Intelligence sui dati strutturati, la soluzione definitiva per lo sfruttamento dei dati non strutturati - ovvero quello sconfinato universo di conoscenza con cui abbiamo a che fare - č la Semantic Intelligence.
|
Le ultime notizieExpert System partecipa ai Forrester Groundswell Awards 2010 Categoria Business to Business, 2-9-2010 Prossimi Eventi Gli eventi in programma per l'autunno 2010 Expert System si conferma leader nei software semantici per le aziende The Gilbane Group, 24-8-2010 |


