L’intelligenza artificiale ha impatto e offre opportunità alle startupa anche in un settore che è sembrato fino a oggi dominio assoluto e imperturbabile di Google: la search, ovvero il motore di ricerca, in cui si sono lanciati anche colossi come Microsoft con Bing e Yahoo, senza mai riuscire veramente a scalfire la dominanza di big G in questo ambito. I motori di ricerca sono destinati a evolversi, e a migliorare in qualità, grazie alle potenzialità dell’Intelligenza Artificiale (AI), in cui la stessa Google sta investendo tantissimo. Ma è terreno di ricerca anche per diverse startup, in Italia per esempio abbiamo un caso eccezionale in FacilityLive, rivoluzionario motore di ricerca sviluppato a Pavia, con uffici a Londra e Bruxelles, ha sviluppato un motore di ricerca semantico che ha è riuscito a riscuotere l’interesse di grandi aziende e di investitori internazionali e intende quotarsi alla Borsa londinese. E a Vienna c’è Cortical.io, startup che ha deciso di fare dell’intelligenza artificiale la sua arma per battere Google “Se non hai una soluzione migliore di Google – dice a EconomyUp il Ceo e co-founder Francisco De Sousa Webber – non ce la fai a competere con il colosso californiano. È la ragione per la quale ci sono pochissime startup in questo campo. L’unica strada è offrire qualcosa di diverso. Per esempio usare l’Intelligenza Artificiale per fornire risultati di ricerca non più basati solo sulla quantità di parole chiave contenute in un testo, ma sulla comprensione del testo stesso”.
Cosa fa Cortical
Fondata a Vienna nel 2011 da Daniel Schreiber e Francisco De Sousa Webber, ha raccolto finora 6,18 milioni di dollari da quattro investitori. Ha uffici a Vienna e San Francisco. Propone soluzioni di Natural Language Understanding (NLU) basate sul Semantic Folding, una teoria che apre una prospettiva fondamentalmente nuova nell’uso dei Big Data. Basandosi su questa teoria, ha sviluppato il Retina Engine, una piattaforma che converte il linguaggio in “semantic fingerprints”, “impronte digitali semantiche”. Si tratta di una rappresentazione numerica – concretamente un quadrato di dimensioni 128X128 composto da pixel – che cattura il significato esplicito di una porzione di testo e lo processa in via computazionale. Il Retina Engine confronta la relazione di natura semantica di due testi qualsiasi misurando le sovrapposizioni che emergono dalle loro rispettive fingerprints. Attraverso questa piattaforma è possibile processare qualsiasi tipo di testo, indipendentemente dal linguaggio o dalla lunghezza. Come spiega un articolo de L’Economist, che l’ha citata tra le startup internazionali più innovative nel campo dell’Artificial Intelligence, Cortical ha estratto centinaia di articoli da Wikipedia, li ha frammentati in migliaia di piccoli “snippets” (porzioni) di informazione, dopodiché ha applicato a questi snippets un algoritmo di machine learning che richiedeva al computer di individuare dei “pattern”, cioè degli schemi. Questi pattern sono stati successivamente rappresentati come “semantic fingerprints”, “impronte digitali semantiche”. Gruppi di pixel in luoghi simili rappresentano un’analogia semantica. Questo metodo può essere utilizzato per disambiguare parole con significati diversi. Per esempio la parola “organo” è correlata sia a “fegato” (il fegato è un organo del corpo) sia a “piano” (l’organo suonato in chiesa). Se cerchiamo “organo” in un motore di ricerca standard, è possibile ottenere risultati non attinenti all’obiettivo della ricerca. Il nostro sistema di linguaggio naturale è invece portato a capire se stiamo parlando di una parte del corpo o di uno strumento musicale in base a una serie di processi cognitivi. È quello che fa Cortical: si ispira al funzionamento del cervello umano. La startup è nata grazie a fondi pubblici ed ha raccolto finora 6,5 milioni di euro. “L’attuale sistema di ricerca – spiega il co-founder e Ceo Francisco De Sousa Webber – non capisce cosa è scritto nel documento, ma individua quali sono le parole chiave, quanto frequentemente sono citate e la probabilità di rilevanza di quelle parole. Questo, però, funziona fino a un certo punto. Non funziona, per esempio, se ci sono troppi documenti o documenti molto simili tra loro. Un caso per tutti: i documenti legali. Sono quei tipi di testi dove si usano sempre le stesse parole. Al momento della ricerca di una keyword, il search tenderà a puntare su quei documenti. Inoltre Internet è cresciuto a tal punto che ci sono centinaia di miliardi di parole là fuori e ne possono scaturire tutte le possibilità di search, ma il 20% dei documenti non uscirà mai nei risultati. E il problema diventerà sempre più grande”. Secondo De Sousa Webber, Google è consapevole di questo blind spot, così ha avviato funzionalità di hard coding. “Google è utile – prosegue – perché legge le key words, indovina a cosa è interessato l’utente e dirige la ricerca. Ma non è ancora una soluzione basata sulla comprensione di quello che il testo significa. Google ha centinaia di persone focalizzate su questo. Ma, per esempio, gli studi legali hanno necessità di ricerche interne sui propri documenti e quindi di soluzioni ad hoc. Hanno provato con il deep learning o il machine learning, sono diventati più bravi sulle statistiche, ma non hanno ottenuto sostanziosi cambiamenti. È un representational problem: se sai come rappresentare un problema, allora puoi trovare in cosa consiste il problema”. Continua a leggere su EconomyUp
© RIPRODUZIONE RISERVATA