Immaginate di avere tra le mani un calendario della vostra vita, dove ogni pagina rappresenta un giorno passato e futuro. Immaginate ora che, scorrendo verso la fine, una data specifica appaia cerchiata in rosso, calcolata non da un indovino, ma da una sequenza matematica fredda e inappellabile. Questa non è la trama di un film di fantascienza distopica, ma la realtà concreta emersa con lo sviluppo di Life2vec, un modello di intelligenza artificiale che ha scosso la comunità scientifica e l’opinione pubblica. Mentre il mondo si concentrava sulle capacità generative di ChatGPT, nei laboratori di ricerca si stava perfezionando un’applicazione del deep learning ben più intima e inquietante: la capacità di prevedere l’esito dell’esistenza umana con una precisione che spesso supera quella della prognosi medica tradizionale.
La vita come sequenza di dati: oltre la cartella clinica
Per comprendere come sia possibile calcolare il “destino” di una persona, dobbiamo prima capire come ragiona questa specifica classe di algoritmi. La grande intuizione alla base di questa tecnologia è stata trattare la vita umana non come un insieme disordinato di eventi biologici, ma come un linguaggio. Proprio come i Large Language Models (LLM) come ChatGPT prevedono la parola successiva in una frase basandosi sul contesto precedente, i nuovi modelli predittivi analizzano la sequenza degli eventi della vita di una persona.
Ogni visita medica, ogni cambio di lavoro, il livello di istruzione, il reddito, il codice postale di residenza e persino le abitudini di consumo diventano “token”, ovvero parole di una frase complessa che racconta la storia di un individuo. L’architettura neurale utilizzata, basata sui Transformer, è in grado di individuare pattern invisibili all’occhio umano. Dove un medico vede un paziente iperteso di 50 anni, l’algoritmo vede un vettore multidimensionale posizionato in uno spazio matematico preciso, circondato da milioni di altre traiettorie di vita simili che hanno già raggiunto il loro termine.
Perché l’algoritmo batte il medico (sulla carta)

La superiorità dell’intelligenza artificiale in questo specifico ambito non risiede in una maggiore comprensione della fisiologia umana, ma nella pura potenza statistica e nella capacità di correlare dati eterogenei. Un medico specialista è addestrato a guardare i sintomi biologici e i fattori di rischio clinici. Tuttavia, la salute di un individuo è determinata in larga parte anche da determinanti sociali.
Il machine learning applicato a questi dataset massivi ha rivelato che variabili apparentemente non mediche – come una riduzione improvvisa del reddito o un trasloco in un’area con specifici indici di inquinamento – possono essere predittori di mortalità più accurati di alcune analisi del sangue, se contestualizzati in una finestra temporale specifica. L’algoritmo non ha pregiudizi: elabora correlazioni che la mente umana scarterebbe come irrilevanti. Se milioni di sequenze storiche mostrano che la combinazione di tre specifici eventi porta statisticamente al decesso entro quattro anni, l’IA emette la sua previsione, ignorando l’ottimismo o la speranza che potrebbero influenzare un giudizio umano.
Il segreto tecnico: Embeddings e Spazi Vettoriali

Entrando nel dettaglio tecnico, il cuore di questa tecnologia risiede nel concetto di embedding. L’algoritmo trasforma ogni evento della vita in un vettore numerico. In questo spazio matematico, concetti come “diagnosi di diabete” e “basso reddito” possono trovarsi vicini o lontani a seconda di quanto spesso appaiono insieme nelle vite delle persone.
Quando il modello analizza un nuovo soggetto, proietta la sua intera esistenza in questo spazio. La “data proibita” emerge dal calcolo della probabilità che la sequenza di eventi si interrompa. I benchmark effettuati su vasti dataset di popolazione (come quelli danesi utilizzati nello studio seminale su Life2vec) hanno mostrato un’accuratezza sorprendente, con tassi di successo nel prevedere la mortalità a 4 anni che superano il 78%, un margine significativamente più alto rispetto ai modelli attuariali standard utilizzati dalle compagnie assicurative.
Il paradosso etico: il diritto di non sapere
Qui sorge la domanda che giustifica il titolo di “data proibita”. Se la tecnologia esiste, perché non abbiamo un’app sul telefono che ci dice quanto ci resta da vivere? La risposta risiede nell’etica e nella gestione del rischio psicologico e sociale. I ricercatori che hanno sviluppato questi sistemi hanno deliberatamente scelto di non renderli accessibili al pubblico come strumenti di previsione individuale.
Le implicazioni sarebbero devastanti. Immaginate se le banche usassero questi dati per negare un mutuo, o se le assicurazioni sanitarie ricalcolassero i premi basandosi su una previsione algoritmica di morte imminente. Inoltre, c’è il fattore umano: la conoscenza della propria data di scadenza potrebbe innescare profezie che si autoavverano, depressione o comportamenti sconsiderati. L’automazione del destino pone un problema filosofico che il progresso tecnologico non è ancora attrezzato a risolvere.
In Breve (TL;DR)
Il modello Life2vec sfrutta l’architettura dei Transformer per trattare l’esistenza umana come un linguaggio e prevedere la mortalità con precisione chirurgica.
L’algoritmo integra dati clinici e socio-economici in spazi vettoriali, superando le prognosi mediche tradizionali grazie alla pura potenza statistica.
L’elevata accuratezza del sistema solleva profondi dubbi etici, impedendone la diffusione pubblica per evitare discriminazioni e conseguenze psicologiche devastanti.
Conclusioni

L’algoritmo che calcola il nostro destino meglio di un medico non è una sfera di cristallo, ma uno specchio ad altissima definizione che riflette le disuguaglianze e le fragilità della nostra società attraverso i dati. Sebbene la curiosità di conoscere la “data proibita” sia umana, il vero valore di questa tecnologia non sta nel dirci quando moriremo, ma nell’aiutarci a capire come vivere meglio. Identificando i fattori di rischio nascosti nelle trame delle nostre vite, l’intelligenza artificiale potrebbe trasformarsi da giudice implacabile a potente alleato per la prevenzione, permettendoci di riscrivere quel finale che, per ora, rimane saggiamente celato nei server dei centri di ricerca.
Domande frequenti

Life2vec è un modello di intelligenza artificiale che analizza la vita umana trattandola come un linguaggio, in modo simile a come i modelli linguistici gestiscono le parole. Invece di testo, l algoritmo elabora sequenze di eventi cronologici come visite mediche, livello di reddito, istruzione e luogo di residenza. Questi dati vengono trasformati in vettori matematici per prevedere esiti futuri, inclusa la probabilità di mortalità, individuando pattern complessi invisibili all occhio umano.
Gli studi effettuati su ampi dataset di popolazione hanno dimostrato che modelli come Life2vec possono prevedere la mortalità entro quattro anni con un tasso di accuratezza superiore al 78 per cento. Questa precisione supera spesso quella dei modelli attuariali standard utilizzati dalle assicurazioni, poiché l IA riesce a correlare efficacemente i dati clinici con determinanti sociali ed economici che influenzano pesantemente la longevità.
La superiorità dell algoritmo in questo ambito non deriva da una migliore comprensione biologica, ma dalla potenza statistica nell elaborare enormi quantità di dati eterogenei. Mentre un medico si concentra sui sintomi clinici e fattori biologici, l IA include nell analisi variabili apparentemente non mediche, come il reddito o l inquinamento ambientale, che si sono rivelate predittori di mortalità estremamente accurati se contestualizzati in una finestra temporale specifica.
Attualmente non esiste un applicazione pubblica per calcolare la propria data di morte, poiché i ricercatori hanno scelto di non rendere accessibile lo strumento per motivi etici e di sicurezza psicologica. L obiettivo della tecnologia non è fornire previsioni individuali che potrebbero causare ansia o discriminazioni da parte di banche e assicurazioni, ma utilizzare questi dati per migliorare la prevenzione sanitaria e comprendere i fattori di rischio a livello sociale.
Gli embeddings rappresentano il cuore tecnico di questa tecnologia e consistono nella trasformazione di ogni evento della vita in un vettore numerico posizionato in uno spazio matematico multidimensionale. Grazie a questo processo, concetti come una diagnosi medica e una condizione economica vengono mappati in base alla loro frequenza di apparizione congiunta. Ciò permette al modello di calcolare la vicinanza tra diverse traiettorie di vita e prevedere come una sequenza di eventi potrebbe interrompersi.




Hai trovato utile questo articolo? C'è un altro argomento che vorresti vedermi affrontare?
Scrivilo nei commenti qui sotto! Prendo ispirazione direttamente dai vostri suggerimenti.