Un nuovo metodo di calcolo ottico sta cambiando le operazioni tensoriali nell'intelligenza artificiale. La propagazione della luce permette di fare convoluzioni e moltiplicazioni di matrici alla velocità della luce stessa. In questo modo si va oltre i confini delle GPU classiche, e lo si fa in maniera davvero impressionante. Allo stesso tempo, tutto ciò crea nuove opportunità per realizzare chip fotonici che siano più facili da scalare e anche più efficienti
Intelligenza artificiale fotonica: il futuro viaggia alla velocità della luce.
Le operazioni tensoriali sono il tipo di aritmetica che costituisce la spina dorsale di quasi tutte le tecnologie moderne, in particolare dell’intelligenza artificiale, eppure si estendono oltre la matematica semplice a cui siamo abituati. Immagina la matematica dietro la rotazione, il taglio o la riorganizzazione di un cubo di Rubik lungo più dimensioni. Mentre gli esseri umani e i computer classici devono eseguire queste operazioni passo dopo passo, la luce può compierle tutte in una volta.
Oggi, ogni compito nell’IA, dal riconoscimento delle immagini all’elaborazione del linguaggio naturale, si basa sulle operazioni tensoriali. Tuttavia, l’esplosione dei dati ha spinto le piattaforme di calcolo digitale convenzionali, come le GPU, ai loro limiti in termini di velocità, scalabilità e consumo energetico.
Motivata da questo problema urgente, una collaborazione di ricerca internazionale, narrata in un articolo pubblicato su Nature Photonics (1) e guidata dal Dr. Yufeng Zhang (2) del Photonics Group presso il Dipartimento di Elettronica e Nanoingegneria della Aalto University ha sbloccato un nuovo approccio che esegue complesse computazioni tensoriali utilizzando una singola propagazione della luce. Il risultato è il calcolo tensoriale “single-shot”, ottenuto alla velocità stessa della luce.
«Il nostro metodo esegue gli stessi tipi di operazioni che oggi vengono gestite dalle GPU, come le convoluzioni e i livelli di attenzione, ma le compie tutte alla velocità della luce», afferma il Dr. Zhang. «Invece di fare affidamento sui circuiti elettronici, utilizziamo le proprietà fisiche della luce per eseguire molte computazioni simultaneamente».
Per raggiungere questo obiettivo, i ricercatori hanno codificato i dati digitali nell’ampiezza e nella fase delle onde luminose, trasformando di fatto i numeri in proprietà fisiche del campo ottico. Quando questi campi luminosi interagiscono e si combinano, eseguono naturalmente operazioni matematiche come moltiplicazioni di matrici e tensori, che costituiscono il nucleo degli algoritmi di deep learning. Introducendo più lunghezze d’onda della luce, il team ha esteso questo approccio per gestire operazioni tensoriali di ordine ancora superiore.
«Immagina di essere un doganiere che deve ispezionare ogni pacco attraverso più macchine con funzioni diverse e poi smistarli nei contenitori giusti», spiega Zhang. «Normalmente, elaboreresti ogni pacco uno per uno. Il nostro metodo di calcolo ottico unisce tutti i pacchi e tutte le macchine insieme - creiamo molteplici ‘ganci ottici’ che collegano ogni input al suo output corretto. Con una sola operazione, un solo passaggio di luce, tutte le ispezioni e lo smistamento avvengono istantaneamente e in parallelo».
Un altro vantaggio chiave di questo metodo è la sua semplicità. Le operazioni ottiche avvengono passivamente mentre la luce si propaga, quindi non è necessario alcun controllo attivo o commutazione elettronica durante la computazione.
«Questo approccio può essere implementato su quasi qualsiasi piattaforma ottica», afferma il Professor Zhipei Sun (3), leader del Photonics Group della Aalto University. «In futuro, prevediamo di integrare direttamente questo quadro computazionale sui chip fotonici, consentendo ai processori basati sulla luce di eseguire compiti complessi di IA con un consumo energetico estremamente ridotto».
In definitiva, l’obiettivo è distribuire il metodo sull’hardware o sulle piattaforme già stabilite dalle grandi aziende, afferma Zhang, che stima prudentemente che l’approccio sarà integrato in tali piattaforme entro 3-5 anni.
«Questo creerà una nuova generazione di sistemi di calcolo ottico, accelerando significativamente i compiti complessi di IA in una miriade di campi», conclude il ricercatore.
Riferimenti:
(1) Direct tensor processing with coherent light
(2) Yufeng Zhang
(3) Zhipei Sun
Descrizione foto: Mentre gli esseri umani e i computer classici devono eseguire le operazioni tensoriali passo dopo passo, la luce può farle tutte contemporaneamente. - Credit: Photonics group / Aalto University.
Autore traduzione riassuntiva e adattamento linguistico: Edoardo Capuano / Articolo originale: AI at the speed of light just became a possibility