banner
Casa / Blog / Codifica neurale con rete neurale convoluzionale a spillo non supervisionata
Blog

Codifica neurale con rete neurale convoluzionale a spillo non supervisionata

Dec 10, 2023Dec 10, 2023

Biologia delle comunicazioni volume 6, numero articolo: 880 (2023) Citare questo articolo

2 Altmetrico

Dettagli sulle metriche

Prevedere con precisione le risposte del cervello a vari stimoli rappresenta una sfida significativa per le neuroscienze. Nonostante i recenti progressi nella codifica neurale utilizzando le reti neurali convoluzionali (CNN) negli studi fMRI, permangono lacune critiche tra le regole computazionali dei neuroni artificiali tradizionali e dei neuroni biologici reali. Per affrontare questo problema, in questo studio viene presentato un framework basato sulla CNN (SCNN) per ottenere la codifica neurale in un modo più biologicamente plausibile. Il framework utilizza SCNN non supervisionato per estrarre le caratteristiche visive degli stimoli dell'immagine e impiega un algoritmo di regressione ricettivo basato sul campo per prevedere le risposte fMRI dalle caratteristiche SCNN. I risultati sperimentali su caratteri scritti a mano, cifre scritte a mano e immagini naturali dimostrano che l'approccio proposto può ottenere prestazioni di codifica straordinariamente buone e può essere utilizzato per compiti di "lettura del cervello" come la ricostruzione e l'identificazione delle immagini. Questo lavoro suggerisce che le SNN possono fungere da strumento promettente per la codifica neurale.

L'obiettivo della codifica neurale è prevedere la risposta del cervello agli stimoli esterni, fornendo un mezzo efficace per esplorare il meccanismo del cervello per l'elaborazione delle informazioni sensoriali e fungendo da base per i sistemi di interfaccia cervello-computer (BCI). La percezione visiva, essendo uno dei modi principali in cui riceviamo informazioni esterne, è stata uno degli obiettivi principali della ricerca sulla codifica neurale. Con il progresso delle tecniche di imaging cerebrale non invasive, come la risonanza magnetica funzionale (fMRI), gli scienziati hanno compiuto notevoli progressi nella codifica neurale basata sulla visione1,2,3,4 negli ultimi due decenni, rendendola un argomento scottante in neuroscienza.

Il processo di codifica basata sulla visione prevede in genere due fasi principali: estrazione delle caratteristiche e previsione della risposta5. L'estrazione delle caratteristiche mira a produrre caratteristiche visive degli stimoli stimolando la corteccia visiva. Un estrattore di caratteristiche accurato che si avvicini ai meccanismi visivi reali è fondamentale per una codifica di successo. La previsione della risposta mira a prevedere le risposte fMRI in termini di voxel in base alle caratteristiche visive estratte. Per questa fase viene comunemente utilizzata la regressione lineare6, poiché la relazione tra le caratteristiche e le risposte dovrebbe essere il più semplice possibile. Studi precedenti hanno dimostrato che la corteccia visiva iniziale elabora le informazioni in modo simile alle onde di Gabor7,8,9. Basandosi su questa scoperta, i modelli di codifica basati su filtri Gabor sono stati proposti e applicati con successo in attività quali l'identificazione di immagini e la ricostruzione di filmati1,3. Negli ultimi anni, le reti neurali convoluzionali (CNN) hanno raccolto un’attenzione significativa grazie ai loro impressionanti risultati nel campo della visione artificiale. Diversi studi10,11 hanno utilizzato l'analisi della somiglianza rappresentazionale12 per confrontare i modelli di dissomiglianza delle rappresentazioni CNN e fMRI, rivelando che la corteccia visiva umana condivide rappresentazioni gerarchiche simili alle CNN. Di conseguenza, i modelli di codifica basati sulla CNN sono diventati ampiamente utilizzati e hanno dimostrato prestazioni eccellenti2,4,13,14. Tuttavia, è importante notare che, nonostante il successo delle CNN nelle applicazioni di codifica, le differenze tra le CNN e il cervello nell’elaborazione delle informazioni visive non possono essere trascurate15.

In termini di meccanismi computazionali esiste una distinzione fondamentale tra i neuroni artificiali nelle CNN e i neuroni biologici, per cui i primi propagano valori digitali continui, mentre i secondi propagano potenziali d'azione (spikes). L’introduzione delle reti neurali “spiking” (SNN), considerate la terza generazione di reti neurali16, ha ridotto significativamente questa differenza. A differenza delle tradizionali reti neurali artificiali (ANN), le SNN trasmettono informazioni attraverso tempi di picco. Nelle SNN, ogni neurone integra i picchi dello strato precedente ed emette picchi allo strato successivo quando la sua tensione interna supera la soglia. L'algoritmo della plasticità dipendente dai tempi di picco (STDP)17,18, che è un metodo non supervisionato per l'aggiornamento del peso ed è stato scoperto nella corteccia visiva dei mammiferi19,20,21, è l'algoritmo di apprendimento più comunemente utilizzato per gli SNN. Studi recenti hanno applicato SNN basati su STDP al riconoscimento degli oggetti e hanno ottenuto prestazioni considerevoli22,23,24. La plausibilità biologica dei SNN fornisce loro un vantaggio nella codifica neurale.

 0.12, two-tailed two-sample t-test) for V2 and V3. For the colorful natural image dataset, we compared the encoding performance of SCNN with CNN and GWP and selected 500 voxels with the highest encoding performance for each subject for comparison. As depicted in Fig. 2f, the accuracies of SCNN were significantly higher than those of CNN (p < \({10}^{-36}\), one-tailed two-sample t-test) for all subjects. Moreover, SCNN demonstrated comparable results to GNet for subject1 (SCNN higher than GNet, \({{{{{\rm{p}}}}}}=1.58\times {10}^{-19}\), one-tailed two sample t-test) and subject4 (no significant difference, p = 0.725, two-tailed two-sample t-test)./p>