Apprendimento profondo: differenze tra le versioni

Naviga nella cronologia in modo interattivo

← Differenza precedente Differenza successiva →

Contenuto cancellato Contenuto aggiunto

In linea

Versione delle 11:42, 7 feb 2018

L'apprendimento profondo (in inglese deep learning) è quel campo di ricerca dell'apprendimento automatico (in inglese machine learning) e dell'intelligenza artificiale che si basa su diversi livelli di rappresentazione, corrispondenti a gerarchie di caratteristiche di fattori o concetti, dove i concetti di alto livello sono definiti sulla base di quelli di basso.

Tra le architetture di apprendimento profondo si annoverano le reti neurali profonde, la convoluzione di reti neurali profonde, le Deep belief network, e reti neurali ricorrenti, che sono state applicate nella computer vision, nel riconoscimento automatico del discorso, nell'elaborazione del linguaggio naturale, nel riconoscimento audio e nella bioinformatica. "Deep learning" è un'espressione oggi famosa che ridà lustro al concetto di rete neurale.

Introduzione

Definizioni

L'apprendimento profondo è definito come una classe di algoritmi di apprendimento automatico che^[1]:

usano vari livelli di unità non lineari a cascata per svolgere compiti di estrazione di caratteristiche e di trasformazione. Ciascun livello successivo utilizza l'uscita del livello precedente come input. Gli algoritmi possono essere sia di tipo supervisionato sia non supervisionato e le applicazioni includono l'analisi di pattern (apprendimento non supervisionato) e classificazione (apprendimento supervisionato).
sono basati sull'apprendimento non supervisionato di livelli gerarchici multipli di caratteristiche (e di rappresentazioni) dei dati. Le caratteristiche di più alto livello vengono derivate da quelle di livello più basso per creare una rappresentazione gerarchica.
fanno parte della più ampia classe di algoritmi di apprendimento della rappresentazione dei dati all'interno dell'apprendimento automatico.
apprendono multipli livelli di rappresentazione che corrispondono a differenti livelli di astrazione; questi livelli formano una gerarchia di concetti.

Ciò che queste definizioni hanno in comune sono (1) i livelli multipli di unità non lineari e (2) l'apprendimento (supervisionato o non supervisionato) in ogni livello della rappresentazione di caratteristiche, in cui i livelli formano una gerarchia delle caratteristiche stesse^[1]. La composizione di ciascun livello di unità non lineari usata in un algoritmo di apprendimento profondo dipende dal problema che deve essere risolto. Nell'apprendimento profondo possono venire usati livelli nascosti di una rete neurale artificiale e insiemi di formule proposizionali^[2].

Storia

Architetture

Reti neurali profonde

Reti neurali convoluzionali

La Rete neurale convoluzionale (Convolution Neural Network CNN) è un metodo di scelta per elaborare dati visuali e dati di tipo 2D. Una CNN è composta da uno più strati convoluzionali con strati completamente connessi verso l'alto. Usa anche pesi e strati comuni (pooling layers). In particolare il "max-pooling" è spesso usato nell'architettura convoluzionale di Fukushima. Quest'architettura permette alle CNN di avere dei vantaggi dalle strutture 2D di ingresso. Sono particolarmente efficaci nell'area delle immagini e di riconoscimento del discorso. Possono essere allenate anche con la backpropagation standard. Sono inoltre facili da allenare rispetto ad altre reti neurali profonde o feed-forward ed hanno molti meno parametri da stimare. Un programma di CNN è il DeepDream di Google^[3].

Reti neurali ricorsive

una rete neurale ricorsiva è una rete neurale in cui alcuni elementi ricorsive ossia si basano su loro stessi

Compressore di storia neurale

Reti Deep Belief

Autoencoder impilato

Rete di impilamento profondo

Rete di impilamento profondo di tensore

Spike-and-slab RBM

Macchine di Boltzmann profonde

Macchine kernel multilivello

Strutture di memoria differenziabile LSTM correlata

Reti deep-q

Questa è una classe di modelli d'apprendimento profondi usando il Q-learning, una forma di apprendimento con rinforzo, del Google DeepMind. Risultati preliminari presentati nel 2014 con un articolo pubblicato su Nature nel febbraio 2015. L'applicazione di cui si fa riferimento è un gioco dell'Atari 2600.

Hashing semantico

Applicazione

Riconoscimento automatico del discorso
Riconoscimento di immagini
Elaborazione del linguaggio naturale
Scoperta di farmaci e tossicologia
Customer relationship management
Sistema di raccomandazione
Bioinformatica

Librerie software

Torch — Libreria software open source di machine learning in Lua
Theano — Libreria open source di machine learning in Python.
Deeplearning4j — Libreria open source di deep learning in Java. Fornisce parallelizzazione di CPU e GPU.^[4]
OpenNN — Libreria open source in C++ che impementa reti neurali profonde e fornisce parallelizazioni con CPU.
Gensim — Libreria di elaborazione del linguaggio naturale in Python.
Apache Singa^[5]^[6] — A deep learning platform developed for scalability, usability and extensibility.
TensorFlow — Libreria open source di machine learning in C++ e Python con API per entrambe le versioni di Google. Fornisce parallelizzazione con CPU e GPU.^[7]
Microsoft Cognitive Toolkit — Framework per il deep learning sviluppato da Microsoft.

Note

^ ^a ^b (EN) L. Deng e D. Yu, Deep Learning: Methods and Applications (PDF), in Foundations and Trends in Signal Processing, vol. 7, n. 3-4, 2014, pp. 1-199, DOI:10.1561/2000000039.
^ (EN) Yoshua Bengio, Learning Deep Architectures for AI (PDF), in Foundations and Trends in Machine Learning, vol. 2, n. 1, 2009, pp. 1-127, DOI:10.1561/2200000006 (archiviato dall'url originale il 4 marzo 2016).
^ Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke e Andrew Rabinovich, Going Deeper with Convolutions, in Computing Research Repository, 2014, arXiv:1409.4842.
^ deeplearning4j
^ B. C. Ooi, K.-L. Tan, S. Wang, W. Wang, G. Chen, J. Gao, Z. Luo, A.K.H. Tung, Y. Wang, Z. Xie, M. Zhang, K. Zheng. "SINGA: A Distributed Deep Learning Platform," ACM Multimedia (Open Source Software Competition). 2015.
^ W. Wang, G. Chen, T. T. A. Dinh, J. Gao, B. C. Ooi, K.-L.Tan, S. Wang. "SINGA: Putting Deep Learning in the Hands of Multimedia Users," ACM Multimedia. 2015.
^ Jeff Dean e Rajat Monga, TensorFlow: Large-scale machine learning on heterogeneous systems (PDF), su TensorFlow.org, Google Research, 9 novembre 2015. URL consultato il 10 novembre 2015.

Collegamenti esterni

(EN) Deep learning, su deeplearning.net.
(EN) Video on Recent Developments in Deep Learning, di Geoff Hinton

Template:Machine learning

Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica

[BOOK2014-1] (EN) L. Deng e D. Yu, Deep Learning: Methods and Applications (PDF), in Foundations and Trends in Signal Processing, vol. 7, n. 3-4, 2014, pp. 1-199, DOI:10.1561/2000000039.

[BENGIODEEP-2] (EN) Yoshua Bengio, Learning Deep Architectures for AI (PDF), in Foundations and Trends in Machine Learning, vol. 2, n. 1, 2009, pp. 1-127, DOI:10.1561/2200000006 (archiviato dall'url originale il 4 marzo 2016).

[deepdream-3] Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke e Andrew Rabinovich, Going Deeper with Convolutions, in Computing Research Repository, 2014, arXiv:1409.4842.

[4] rning4j

[Ooi2015-5] B. C. Ooi, K.-L. Tan, S. Wang, W. Wang, G. Chen, J. Gao, Z. Luo, A.K.H. Tung, Y. Wang, Z. Xie, M. Zhang, K. Zheng. "SINGA: A Distributed Deep Learning Platform," ACM Multimedia (Open Source Software Competition). 2015.

[Wang2015-6] W. Wang, G. Chen, T. T. A. Dinh, J. Gao, B. C. Ooi, K.-L.Tan, S. Wang. "SINGA: Putting Deep Learning in the Hands of Multimedia Users," ACM Multimedia. 2015.

[DeanMonga2015-7] Jeff Dean e Rajat Monga, TensorFlow: Large-scale machine learning on heterogeneous systems (PDF), su TensorFlow.org, Google Research, 9 novembre 2015. URL consultato il 10 novembre 2015.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

@@ Riga 13: / Riga 13: @@
 *apprendono multipli livelli di rappresentazione che corrispondono a differenti livelli di astrazione; questi livelli formano una gerarchia di concetti.
-Ciò che queste definizioni hanno in comune sono (1) i livelli multipli di unità non lineari e (2) l'apprendimento (supervisionato o non supervisionato) in ogni livello della rappresentazione di caratteristiche, in cui i livelli formano una gerarchia delle caratteristiche stesse<ref name="BOOK2014" />. La composizione di ciascun livello di unità non lineari usata in un algoritmo di apprendimento profondo dipende dal problema che deve essere risolto. Nell'apprendimento profondo possono venire usati livelli nascosti di una [[rete neurale artificiale]] e insiemi di [[Logica proposizionale|formule proposizionali]]<ref name="BENGIODEEP">{{cita pubblicazione |nome=Yoshua |cognome=Bengio |titolo=Learning Deep Architectures for AI |rivista=Foundations and Trends in Machine Learning |editore= |città= |volume=2 |numero=1 |anno=2009 |mese= |pp=1-127 |id= |pmid= |url=http://sanghv.com/download/soft/machine%20learning,%20artificial%20intelligence,%20mathematics%20ebooks/ML/learning%20deep%20architectures%20for%20AI%20%282009%29.pdf  |lingua=inglese |doi=10.1561/2200000006 }}</ref>.
+Ciò che queste definizioni hanno in comune sono (1) i livelli multipli di unità non lineari e (2) l'apprendimento (supervisionato o non supervisionato) in ogni livello della rappresentazione di caratteristiche, in cui i livelli formano una gerarchia delle caratteristiche stesse<ref name="BOOK2014" />. La composizione di ciascun livello di unità non lineari usata in un algoritmo di apprendimento profondo dipende dal problema che deve essere risolto. Nell'apprendimento profondo possono venire usati livelli nascosti di una [[rete neurale artificiale]] e insiemi di [[Logica proposizionale|formule proposizionali]]<ref name="BENGIODEEP">{{cita pubblicazione |nome=Yoshua |cognome=Bengio |titolo=Learning Deep Architectures for AI |rivista=Foundations and Trends in Machine Learning |editore= |città= |volume=2 |numero=1 |anno=2009 |mese= |pp=1-127 |id= |pmid= |url=http://sanghv.com/download/soft/machine%20learning,%20artificial%20intelligence,%20mathematics%20ebooks/ML/learning%20deep%20architectures%20for%20AI%20%282009%29.pdf |lingua=inglese |doi=10.1561/2200000006 |urlmorto=sì |urlarchivio=https://web.archive.org/web/20160304084250/http://sanghv.com/download/soft/machine%20learning,%20artificial%20intelligence,%20mathematics%20ebooks/ML/learning%20deep%20architectures%20for%20AI%20(2009).pdf |dataarchivio=4 marzo 2016 }}</ref>.
 == Storia ==

Apprendimento profondo: differenze tra le versioni

Versione delle 11:42, 7 feb 2018

Indice

Introduzione

Definizioni

Storia

Architetture

Reti neurali profonde

Reti neurali convoluzionali

Reti neurali ricorsive

Compressore di storia neurale

Reti Deep Belief

Autoencoder impilato

Rete di impilamento profondo

Rete di impilamento profondo di tensore

Spike-and-slab RBM

Macchine di Boltzmann profonde

Macchine kernel multilivello

Strutture di memoria differenziabile LSTM correlata

Reti deep-q

Hashing semantico

Applicazione

Librerie software

Note

Collegamenti esterni

Menu di navigazione

Apprendimento profondo: differenze tra le versioni

Versione delle 11:42, 7 feb 2018

Introduzione

Definizioni

Storia

Architetture

Reti neurali profonde

Reti neurali convoluzionali

Reti neurali ricorsive

Compressore di storia neurale

Reti Deep Belief

Autoencoder impilato

Rete di impilamento profondo

Rete di impilamento profondo di tensore

Spike-and-slab RBM

Macchine di Boltzmann profonde

Macchine kernel multilivello

Strutture di memoria differenziabile LSTM correlata

Reti deep-q

Hashing semantico

Applicazione

Librerie software

Note

Collegamenti esterni

Menu di navigazione

Ricerca