Con “Deep Learning”, Apprendimento Profondo (o Approfondito), si intende quell’aspetto dell'Intelligenza Artificiale (AI) che si occupa di emulare le dinamiche di apprendimento che gli esseri umani mettono in atto per acquisire determinati tipi di conoscenza.
La casistica di applicazione del Deep Learning include, per esempio, tutte le tipologie di analisi dei Big Data e della Computer Vision, ovvero le tecniche che permettono ai computer di riprodurre funzioni e processi dell’apparato visivo umano; quelle incentrate sull'elaborazione del linguaggio naturale (NLP) e il riconoscimento automatico della lingua parlata; la diagnosi medica e la bioinformatica; la sicurezza, sia quella legata alla sorveglianza che quella della rete; il riconoscimento e rilevamento di oggetti.
Deep Learning migliora i processi di automazione, eseguendo attività analitiche senza l'intervento umano. Questo tipo di tecnologia è alla base di soluzioni informatiche comuni e di servizi di uso quotidiano come gli assistenti digitali, quelli abilitati al riconoscimento della voce, i sistemi che aiutano il rilevamento di frodi con carte di credito, l’interpretazione di segnali di trading del mercato azionario, e permetterà sempre più di testare tecnologie emergenti come le piattaforme di guida autonoma nel mondo automotive.
Mentre gli algoritmi di Machine Learning tradizionali sono lineari, quelli che riguardano il Deep Learning sono organizzati in una gerarchia di complessità e astrazione crescenti. Ciascun algoritmo applica una trasformazione non lineare al proprio input e utilizza ciò che apprende per creare un modello statistico come output, generando iterazioni che continuano finché l'output non raggiunge un livello di precisione accettabile.
Il numero di livelli di elaborazione attraverso i quali devono passare i dati è ciò che ha ispirato la parola "profondo”, poiché a ogni iterazione il modello predittivo creato dal computer diventa più complesso e più accurato.
Per raggiungere un livello accettabile di accuratezza, i programmi di Deep Learning richiedono l'accesso a enormi quantità di dati di addestramento, e una grande potenza di elaborazione e capacità computazionale.
Nell'apprendimento automatico tradizionale, il programmatore deve essere molto preciso quando indica al computer quali sono le informazioni che dovrebbe cercare quando, per esempio, decide di analizzare il contenuto di un'immagine. Questo è un processo laborioso chiamato “estrazione delle funzionalità” e la percentuale di successo dipende interamente dalla capacità del programmatore di definire dettagliatamente un set di funzionalità per il riconoscimento.
Il vantaggio del Deep Learning, in questi casi, è che il programma costruisce da solo il set di funzionalità grazie alle reti neurali artificiali multistrato in grado di analizzare automaticamente dati quali immagini, video, audio, lingua parlata o testi. Oltre ad essere più veloce, questo meccanismo si rivela anche più preciso e affidabile, arrivando a superare le prestazioni degli esseri umani.
Poiché questo processo imita il pensiero umano, l'apprendimento profondo viene talvolta definito “apprendimento neurale profondo” o “a rete neurale profonda”.