Esplorare l'Intelligenza Artificiale

Cos’è l’intelligenza Artificiale e come è fatta 

Oltre l'hype

Intelligenza artificiale (AI) e apprendimento automatico (ML) sono due parole che vengono utilizzate molto in questi giorni. Queste tecnologie sono descritte come la soluzione che salverà il mondo o come l'ultimo passo prima dell'apocalisse. Ma per essere vero, c'è una vera discussione su cosa siano effettivamente queste tecnologie e cosa possono realmente fare o saranno in grado di fare in futuro.

Molti hanno provato a definire il termine AI, tuttavia, non esiste ancora una definizione su cui tutti siano d'accordo. Spesso le definizioni sono molto vaghe, rendendo difficile capire di cosa si tratta effettivamente. Ad esempio, in una definizione generale spesso citata, l'AI è descritta come "una tecnica che consente ai sistemi computazionali di imitare qualsiasi tipo di intelligenza". Semplificato, significa che una macchina è in grado di risolvere problemi specifici. Sebbene ci siano molte idee mistiche e fantascientifiche sull'intelligenza artificiale là fuori, oggi solo i problemi ben definiti possono essere risolti dai sistemi di intelligenza artificiale. Questo campo viene spesso definito IA stretta. Rispetto all'IA ristretta, l'IA generale si riferisce a sistemi in grado di eseguire qualsiasi compito intelligente che un essere umano sarebbe in grado di eseguire.

Poiché l'IA generale è ancora più fantascienza che realtà e molto ipotetica, ci atterremo alle applicazioni dell'intelligenza artificiale ristretta che possono essere effettivamente trovate là fuori. Perché è così difficile trovare una definizione ampiamente accettata? Il motivo è che fino ad ora nemmeno l'intelligenza umana è stata adeguatamente definita. Per non parlare dell'intelligenza animale. Pensaci. Cosa consideri veramente intelligente? Oltre alla questione dell'intelligence stessa, c'è anche disaccordo su ciò che comprende l'IA. Mentre alcuni si riferiscono all'intelligenza artificiale come un approccio tecnico, altri lo definiscono come la combinazione di software, hardware e dati. In ogni caso, l'IA comprende vari strumenti e metodi.

Aree di applicazione attuali dell'IA

Esaminiamo brevemente alcune aree di applicazione con cui potresti avere familiarità.

  1. Riconoscimento vocale: Siri di Apple e Alexa di Amazon includono entrambi i sistemi intelligenti. Questi sistemi utilizzano l'IA per riconoscere gli input vocali.
  2. Personalizzazione: diversi servizi online come le piattaforme di social media o Netflix e Amazon utilizzano l'intelligenza artificiale per personalizzare i contenuti presentati sulle pagine web. I servizi online apprendono dal comportamento precedente tuo e di altri utenti, ad es. guardare solo thriller o acquistare principalmente romanzi di fantascienza. Di conseguenza, ti consigliamo il contenuto che molto probabilmente si adatta al tuo interesse.
  3. Filtro e-mail: i servizi di posta elettronica utilizzano l'IA per distinguere tra spam e messaggi di posta elettronica pertinenti. Alcuni fornitori di servizi filtrano anche le e-mail in arrivo che considerano pubblicità o social media nelle rispettive cartelle di posta elettronica.
  4. Selezione dei candidati: alcune aziende che ricevono molte candidature dei dipendenti utilizzano l'IA per filtrare le applicazioni adatte da applicazioni meno adatte. L'IA aiuta a effettuare una preselezione delle applicazioni in arrivo.
  5. Diagnosi clinica: in medicina, l'IA è sempre più utilizzata per supportare il lavoro dei medici nella loro diagnosi.

Naturalmente, ci sono molte altre aree di applicazione. Alcuni di loro hanno un impatto incredibilmente positivo sugli individui e sulla società nel suo insieme e offrono grandi opportunità. In altre applicazioni, tuttavia, risulta che l'IA discrimina e svantaggia determinati gruppi di persone. Daremo ora uno sguardo al motivo per cui tali applicazioni possono portare a problemi di responsabilità, pregiudizi, trasparenza, qualità dei dati o altri problemi etici. Per fare ciò, ci concentreremo innanzitutto sul ML, a cui l'IA deve il suo boom negli ultimi anni.

Cos'è l'apprendimento automatico?

Essendo un particolare tipo di intelligenza artificiale, il machine learning è molto più facile da definire. ML si riferisce ad algoritmi e tecniche che apprendono da soli quando confrontati con dati, osservazioni e interazioni con il mondo circostante. Cominciando dall'inizio.

Gli algoritmi sono istruzioni per risolvere un'attività. I programmatori scrivono algoritmi per dire a un computer come risolvere un problema. Questi algoritmi essenzialmente costruiscono il mondo digitale. Date regole e istruzioni, gli algoritmi organizzano i dati e ci forniscono servizi e informazioni.


Gli algoritmi ML sono un particolare tipo di algoritmo. Invece di essere programmati da programmatori umani, gli algoritmi ML apprendono da soli mediante un approccio statistico. Ciò significa che gli algoritmi di ML sono in grado di regolare i parametri iniziali in risposta ai loro input e sviluppare le proprie regole, costruendo una rappresentazione statistica dell'ambiente a loro assegnato. Questi algoritmi non contengono regole passo passo, ma istruzioni su come “apprendere” e su come sovrascrivere quali parametri. Questo processo di apprendimento è spesso chiamato anche addestramento di un algoritmo ML. Ciò in cui gli algoritmi ML sono particolarmente bravi è l'identificazione di modelli in set di dati molto grandi, grazie al loro approccio statistico. Questa caratteristica ci consente di utilizzare i computer per nuove attività che altrimenti sarebbero state troppo complicate o addirittura impossibili da codificare manualmente. Nell'ultimo decennio, i progressi nel ML hanno portato a grandi miglioramenti nelle aree di applicazione in cui i problemi vengono risolti tramite finding pattern in set di dati molto grandi, come nei casi d'uso menzionati sopra o nella traduzione, riconoscimento di immagini e molti altri.

Sebbene tutto il ML possa essere considerato come AI, questa affermazione non è vera viceversa. Ad esempio, una normale calcolatrice per la scuola è molto più veloce nel calcolare determinate equazioni rispetto a un essere umano medio. Pertanto, può essere considerata un'applicazione dell'AI. Tuttavia, questo calcolatore scolastico si basa su regole fisse stabilite dagli esseri umani e non può apprendere da solo: non sono sistemi di apprendimento automatico.

Il Processo di Machine Learning

Allora come funziona l'apprendimento automatico? E cosa significa effettivamente addestrare un algoritmo? Non preoccuparti, non diventerà tecnico. Nella figura seguente, è possibile vedere un processo ML semplificato con passaggi dalla raccolta dei dati all'applicazione dell'algoritmo addestrato in un contesto specifico. Sebbene esistano diversi metodi ML, seguiremo un metodo esemplare per introdurre alcuni processi solitamente coinvolti. In generale, il processo ML del metodo esemplare scelto può essere suddiviso in due fasi:

  1. Innanzitutto, l'algoritmo ML deve essere addestrato. Il risultato di questo processo di formazione è il modello ML.
  2. In secondo luogo, il modello viene quindi distribuito nell'area di applicazione desiderata. Il risultato di questo passaggio è una previsione, ad esempio una probabilità che un paziente abbia un tumore canceroso o la probabilità che un candidato a un lavoro sia una buona corrispondenza per l'azienda.


Esaminiamo queste due fasi semplificate in modo più dettagliato.

Nella prima fase di questa fase di formazione semplificata, vengono raccolti i dati. I dati possono essere raccolti dalle persone utilizzando diversi metodi, ad esempio conducendo questionari o scattando foto, o anche automaticamente (raccolti o generati) dai computer.

Nella seconda fase, i dati raccolti vengono elaborati se necessario. In tal caso, in questa parte del processo i dati rilevanti sono separati dai dati irrilevanti. Questo passaggio è spesso chiamato anche pre-elaborazione. La pre-elaborazione può anche significare che i dati vengono aumentati, al fine di avere dati più puliti e precisi. Il risultato di questo passaggio è un bel set di dati di addestramento.

Questi dati di addestramento vengono quindi utilizzati come input per il processo di addestramento effettivo. Durante questo processo un algoritmo di apprendimento "apprende" dai dati di addestramento immessi. L'apprendimento qui si riferisce all'identificazione dei modelli nei dati di input mediante un approccio statistico e alla generazione di un nuovo insieme di regole basate sui modelli trovati.

Essenzialmente, viene creato un nuovo algoritmo. Questo nuovo algoritmo è il risultato del processo di formazione e si chiama modello ML. Un modello ML viene spesso definito una scatola nera, perché a seconda dell'algoritmo di apprendimento scelto è in realtà molto complicato capire cosa sta succedendo all'interno dell'algoritmo.

Prima di passare alla distribuzione di questo modello ML, un'ulteriore osservazione: se addestrate un algoritmo di apprendimento separatamente con tre diversi set di dati come input, riceverete tre distinti modelli ML. Ciò significa che un tipo di algoritmo di apprendimento può essere utilizzato per generare modelli ML per aree di applicazione molto diverse, ad esempio traduzione linguistica e previsione del mercato azionario.

Dopo che il modello è stato addestrato, può essere distribuito. Per questa fase di distribuzione, i nuovi dati vengono presi come input. Quindi avviene la magia della previsione: il modello che hai addestrato fa una previsione sulla nuova area di applicazione. Qui, è importante ricordare che qualsiasi previsione sarà sempre basata sui modelli trovati nei dati di allenamento durante l'allenamento.


A volte l'intero processo di machine learning è condotto da una sola persona, a volte c'è un enorme team dietro. A seconda del progetto, questa fase può essere conclusa in un tempo molto breve o richiedere molto tempo. Inoltre, questo viene fatto sia nel mondo accademico che nell'industria. In realtà, ci sono molti tutorial là fuori, quindi con l'aiuto adeguato saresti anche in grado di addestrare un modello ML piccolo (non così complesso) e distribuirlo.

Alcune sfide della Machine Learning

Le applicazioni AI possono essere trovate praticamente ovunque. Sono di enorme supporto e aiutano a rendere la vita più facile. Anche le decisioni prese dall'intelligenza artificiale (o i suggerimenti per le decisioni) possono avere un serio impatto sulla vita delle persone.

In particolare, il machine learning può diventare molto complesso e offrire molte fonti di errore. Ad esempio, possono verificarsi errori durante la raccolta dei dati; immagina una raccolta dati errata o parziale o una documentazione dei dati errata. Durante la preparazione dei dati, i fattori rilevanti possono essere filtrati in modo errato. Durante il processo di formazione possono verificarsi errori nella programmazione effettiva e nella selezione dei parametri. Quando si applica il modello addestrato in precedenza, può accadere che i nuovi dati del campo di applicazione non si adattino alla situazione precedente. Infine, i risultati possono ovviamente anche essere interpretati male.

A livello sociale, un grande pericolo è che i dati di allenamento utilizzati per il processo di formazione siano considerati perfetti. Un set di dati perfetto richiederebbe la registrazione di tutti i possibili fattori che costituiscono o influenzano una situazione. Questo in realtà non è mai possibile. I dati sono sempre solo una rappresentazione semplificata della situazione con un numero limitato di fattori presi in considerazione. Questo è particolarmente vero quando si tratta di dati sulle nostre società.

In effetti, i dati che dovrebbero rappresentare la nostra società includeranno sempre tutti i problemi e le disuguaglianze del nostro mondo, perché semplicemente esistono. Queste strutture (o modelli) vengono apprese dall'algoritmo di apprendimento automatico e vengono poi riflesse anche nella previsione finale. Ciò può portare a previsioni distorte a svantaggio di quei gruppi sociali che sono ad esempio meno rappresentati nel set di dati, anche se il set di dati potrebbe rappresentare una società rappresentativa.

In poche parole: immondizia dentro, spazzatura fuori.


Per il caso di bias in ML, ciò significa che dati distorti si tradurranno anche in previsioni distorte. E poiché, come accennato in precedenza, il punto di forza del ML è trovare modelli nei dati e derivare inferenze, i dati utilizzati hanno un ruolo fondamentale per il ML. In effetti, la qualità dei risultati del ML dipende molto dalla qualità e dalla quantità dei dati. Affinché il machine learning fornisca buoni risultati, è importante che i set di dati siano sufficientemente grandi. Di solito, la dimensione dei dati supera la quantità di dati che gli esseri umani sarebbero in grado di analizzare correttamente. Tuttavia, non è sempre facile trovare buoni set di dati già disponibili o raccogliere da soli dati validi. È il caso, ad esempio, di fenomeni rari o di contesti sociali difficili da quantificare. Quando i set di dati non sono sufficientemente buoni o semplicemente troppo piccoli, i risultati di ML possono facilmente mancare di accuratezza ed essere di scarsa qualità. È interessante notare che molti progressi nei campi dell'IA e del ML non possono essere ricondotti ad algoritmi altamente innovativi, invece, è a causa della grande quantità di dati disponibili che i modelli di AI forniscono previsioni promettenti.

Chi è responsabile?

Analogamente all'AI, anche ML è un termine generico e comprende molti strumenti diversi, ad esempio il deep learning. A seconda dello strumento applicato, è difficile capire come un sistema ML abbia raggiunto un determinato risultato, perché la logica dei sistemi a volte è difficile da comprendere. Questo è un problema importante: chi è responsabile (responsabile) dei risultati dell'uso dell'IA? Se c'è un incidente? Una diagnosi sbagliata? O discriminazione contro qualcuno?

La trasparenza può aiutare a garantire la responsabilità, ad es. in che modo un'applicazione sanitaria basata sul ML è arrivata a una certa previsione di malattia o perché l'auto a guida autonoma ha svoltato a sinistra e non a destra?

Capire come i modelli giungono ai loro risultati è importante per determinare la responsabilità, soprattutto in caso di decisioni sbagliate o incidente.

Tuttavia, molti modelli ML come gli algoritmi di deep learning sono molto complessi e piuttosto scatole nere rispetto a qualsiasi cosa che si avvicini al trasparente, rendendo ad esempio i problemi di bias difficili da risolvere. Pertanto, se un'area di applicazione richiede un modo chiaro per identificare la responsabilità, potrebbe essere utile scegliere uno strumento ML che abbia una logica meno complicata, anche se potenzialmente produce risultati meno accurati. Oltre alla complessità del modello, sorgono problemi di trasparenza anche con il segreto di Stato o aziendale. Molti processi ML sono segreti e non possono essere monitorati dal pubblico.

Inoltre, gli algoritmi ML spesso vengono addestrati solo per risolvere compiti molto specifici. Piccoli cambiamenti nel problema da risolvere possono essere accompagnati dalla necessità di riqualificare l'algoritmo per il nuovo compito. A volte, l'addestramento di un algoritmo può richiedere giorni, consumando così molta energia e avendo un elevato impatto ambientale. Per l'addestramento di algoritmi complessi, un normale personal computer non è sufficiente, perché è necessaria molta potenza di calcolo.


In conclusione, non tutti i contesti, in particolare non tutte le situazioni sociali, forniscono buone condizioni preliminari per applicare soluzioni di IA. I dati non sono neutri e non perfetti. Rispecchia, in una forma semplificata e incompleta, le strutture della società compresi i pregiudizi e le disuguaglianze strutturali. L'algoritmo ML apprende da questi modelli e genera risultati basati su questi modelli. I modelli ML sono validi solo quanto i dati di addestramento su cui sono stati addestrati e tanto precisi quanto gli individui che progettano, programmano e applicano il modello si prendono cura del suo corretto sviluppo e applicazione.