Che cosa sono le reti neurali? Quali sono gli aspetti salienti dell'architettura delle reti neurali artificiali? Questa introduzione copre le nozioni più importanti delle reti neurali: la metafora bilogica, il neurone artificiale, gli algoritmi di apprendimento, le potenzialità ed i limiti di questo approccio computazionale.
Simulare il S.N.C.
Poiché i sistemi nervosi biologici sono in numerose circostanze più potenti dei sistemi computazionali classici, si è cercato di simularne le potenzialità riproducendo alcuni aspetti della loro architettura fisica.
Poiché i sistemi nervosi biologici sono in numerose circostanze più potenti dei sistemi computazionali classici, si è cercato di simularne le potenzialità riproducendo alcuni aspetti della loro architettura fisica.
L'architettura biologica
L'approccio connessionista è sorto dall'ipotesi che la capacità dimostrata dai sistemi biologici ad affrontare compiti complessi fosse dovuta all'architettura fisica del loro sistema nervoso. Si è dunque tentato di creare delle architetture fisiche che riproducessero, in maniera semplificata, alcune delle caratteristiche del S.N.C.
L'approccio connessionista è sorto dall'ipotesi che la capacità dimostrata dai sistemi biologici ad affrontare compiti complessi fosse dovuta all'architettura fisica del loro sistema nervoso. Si è dunque tentato di creare delle architetture fisiche che riproducessero, in maniera semplificata, alcune delle caratteristiche del S.N.C.
Gli aspetti salienti
dell'architettura neuronale
Gli aspetti considerati salienti sono:
> numerosità - parallelismo: le reti neurali biologiche sono composte da un numero elevatissimo di unità che lavorano in parallelo
> connettività: le unità sono fra loro altamente connesse
Gli aspetti considerati salienti sono:
> numerosità - parallelismo: le reti neurali biologiche sono composte da un numero elevatissimo di unità che lavorano in parallelo
> connettività: le unità sono fra loro altamente connesse
Altre caratteristiche salienti
> unità computazionali semplici;
> alto grado di connettività;
> utilizzo di messaggi (relativamente) semplici;
> interazione adattiva fra elementi.
Risposta continua
ad esclusione di un numero finito di discontinuità ad input simili la rete risponde con output simili
ad esclusione di un numero finito di discontinuità ad input simili la rete risponde con output simili
Tolleranza agli errori
scostamenti non significativi dei valori di input vengono assorbiti dalla rete, diminuendo così il rumore statistico e risultando tolleranti agli errori o al decadimento del segnale.
Tolleranza ai guasti
La presenza di molte unità di processamento parallele l'eventuale perdita di un unità ha, nel caso di architetture con molti neuroni, conseguenze non irreparabili.
Capacità di apprendimento
Attraverso degli opportuni algoritmi di modificazione dinamica dei pesi la rete riesce ad adattare il proprio comportamento fino a computare una funzione arbitraria y= f (x) in base agli esempi presentati.
Livelli di descrizione
* Livello biologico - neurofisiologico
* Livello matematico
* Livello fisico
* Livello statistico
* Intelligenza artificiale
* Livello matematico
* Livello fisico
* Livello statistico
* Intelligenza artificiale
* Modelli psicologici e neuropsicologici
Livello biologico - neurofisiologico
Le reti neurali artificiali costituiscono delle metafore delle reti neurali biologiche;
nell'ambito delle "neuroscienze computazionali" le reti costituiscono dei modelli teorici di aree funzionali del sistema nervoso centrale.
Livello matematico
Le reti sono oggetti matematici, in quanto vengono realizzate attraverso degli stumenti matematici classici;
esse sono, a loro volta, degli strumenti matematici, in quanto calcolano delle funzioni arbitrarie.
Livello fisico
Alcune architetture di reti neurali artificiali presenti in letteratura costituiscono dei modelli di alcuni dominî fisici. L'esempio più significativo è costituito dalle reti di Hopfield, che simulano il comportamento elettromagnetico dei metalli.
Livello statistico
> i percettroni senza strati nascosti costituiscono dei modelli lineari;
> le reti con uno strato nascosto sono paragonabili a dei modelli di regressione;
> le reti neurali probabilistiche corrispondono alla kernel discriminant analysis;
> le reti di Kohonen di quantizzazione vettoriale adattiva sono simili alla cluster analisys;
> la regola di Hebb è correlata all'analisi delle componenti principali;
> i percettroni senza strati nascosti costituiscono dei modelli lineari;
> le reti con uno strato nascosto sono paragonabili a dei modelli di regressione;
> le reti neurali probabilistiche corrispondono alla kernel discriminant analysis;
> le reti di Kohonen di quantizzazione vettoriale adattiva sono simili alla cluster analisys;
> la regola di Hebb è correlata all'analisi delle componenti principali;
Intelligenza artificiale
Le reti neurali possono realizzare degli strumenti, e vengono usate in numerosi contesti, proprio perché capaci di affrontare problemi complessi e poco o male strutturati sotto il profilo formale
Le reti neurali possono realizzare degli strumenti, e vengono usate in numerosi contesti, proprio perché capaci di affrontare problemi complessi e poco o male strutturati sotto il profilo formale
Neurone formale
Il neurone formale è una schematizzazione del neurone biologico in cui le proprietà funzionali sono descritte da formule matematiche, senza preoccuparsi dei fenomeni elettrici, chimici, termici, biologici che avvengono nella realtà.
Il neurone artificiale. L'unità elementare di elaborazione di una rete neurale è il neurone artificiale le cui funzioni principali sono:
Il neurone artificiale. L'unità elementare di elaborazione di una rete neurale è il neurone artificiale le cui funzioni principali sono:
L'attivazione neuronale
L'attività di un neurone biologico dipende dall'attivazione di altri neuroni ad esso connessi che viene trasmessa attraverso sinapsi. In modo analogo il valore d'attivazione di un neurone artificiale viene calcolato attraverso una funzione matematica che regola i segnali che arrivano dagli altri neuroni.
L'attività del neurone
L'unità riceve numerosi ingressi;
L'unità riceve numerosi ingressi;
Connessioni fra unità
Nei modelli biologici, I'impulso viene modulato dal tipo e dalla quantità di neurotrasmettitore emesso dalle vescicole pre-sinaptiche: questo fenomeno viene simulato artificialmente con l'introduzione del "peso di connessione" il cui valore permette di trasmettere un segnale da un'unità all'altra con maggiore o minore facilita.
Le reti Autoassociative
le reti autoassociative, quali le reti di Hopfield, sono in grado di riprodurre un pattern appreso in presenza di una forma degradata del pattern stesso: il loro scopo è quello di ricostruire i pattern in qualche modo danneggiati.
Reti ad apprendimento con supervisione
Per quanto concerne le reti supervisionate lo scopo dell'apprendimento è quello di associare input di una classe con output di una classe diversa; la memoria è costituita dall'abilità di rievocare l'output a partire dall'input.
Addestramento
Addestrare una rete significa presentarle un insieme di esempi e lasciare che la rete si costruisca da sola la conoscenza interna necessaria per svolgere il compito richiesto.
In termini matematici si fornisce un insieme di coppie i/o (x,y) e la rete deve trovare i valori delle connessioni W che realizzino la funzione y= f (x).
In termini matematici si fornisce un insieme di coppie i/o (x,y) e la rete deve trovare i valori delle connessioni W che realizzino la funzione y= f (x).
Regole di apprendimento
La regola d'apprendimento determina il modo con cui la rete apprende. Per apprendimento si intende una ottimale modificazione delle intensità sinaptiche che permette di fornire una risposta adeguata ai vari stimoli che sono presentati alla rete.
Poiché l'attivazione di un'unità è determinata dalla somma di questi segnali, diventa cruciale, ai fini dell'apprendimento, il peso di connessione: tutte le regole d'apprendimento operano sui pesi di connessione, modificandoli.
Regola di Hebb
La più semplice regola di apprendimento è la legge di Hebb, la quale afferma che se un neurone di entrata ed un neurone in uscita sono attivati contemporaneamente per un certo tempo, aumenta la facilità di trasmissione del segnale stesso fra i due neuroni. In altri termini: si incrementa il valore del peso di connessione fra i due neuroni.
Applicabilità delle reti neurali
Le reti neurali non possono fare nulla che non possa essere fatto utilizzando un approccio computazionale tradizonale, ma possono fare cose che con un approccio tradizionale sarebbero estremamente difficili da realizzare.
Quando le reti sono utili?
* quando non possiamo formulare una soluzione algoritmica;
* quando disponiamo di un gran numero di esempi del comportamento che vogliamo simulare;
* quando vogliamo estrapolare la struttura da dati esistenti.
Esempi di applicazioni
* analisi dell'andamento azionario;
* ricognizione del parlato o dello scritto;
* analisi dell'andamento azionario;
* ricognizione del parlato o dello scritto;