Ingegneria dei Lead: Guida al Lead Scoring Predittivo con AI e CRM

Autore: Francesco Zinghinì | Data: 6 Febbraio 2026

Nel panorama attuale dell’intermediazione creditizia, considerare la Lead Generation come una semplice attività di marketing è un errore strategico fatale. Siamo nell’era dell’Ingegneria dei Lead, dove il flusso di acquisizione clienti deve essere trattato come un sistema di controllo a ciclo chiuso. Questa guida tecnica esplorerà come progettare e implementare un motore di lead scoring predittivo all’interno di un ecosistema CRM avanzato, come BOMA, trasformando dati comportamentali grezzi in probabilità matematiche di erogazione mutuo.

L’obiettivo non è più generare contatti, ma predire il fatturato. Utilizzando algoritmi di Machine Learning e un’architettura dati solida, passeremo dall’intuizione soggettiva dei commerciali a un approccio deterministico basato sui dati.

1. Architettura del Sistema: Dal Tracking all’Inferenza

Per costruire un modello di scoring efficace, dobbiamo prima stabilire una pipeline di dati (ETL) che colleghi il comportamento dell’utente sul sito web con l’esito reale della pratica nel CRM. L’architettura proposta si basa su tre pilastri:

Sorgente Dati (Input): Google Analytics 4 (GA4) per i dati comportamentali e i log del simulatore mutui.
Data Warehouse (Processing): Google BigQuery per lo stoccaggio e la normalizzazione dei dati.
Motore Decisionale (Core): Script Python (ospitati su Cloud Functions o Vertex AI) che eseguono modelli XGBoost.
Destinazione (Output): Il CRM BOMA, che riceve il punteggio e orchestra l’assegnazione del lead.

Prerequisiti Tecnici

Prima di procedere, assicurarsi di avere accesso a:

Account Google Cloud Platform con BigQuery abilitato.
Export giornaliero (o streaming) di GA4 verso BigQuery configurato.
Accesso API al CRM BOMA (o al vostro CRM proprietario).
Ambiente Python 3.9+ con librerie pandas, scikit-learn, xgboost.

2. Ingestione dei Dati e Feature Engineering

Il lead scoring predittivo non si basa solo sui dati demografici (età, reddito), ma soprattutto sui segnali impliciti. Nel settore mutui, il modo in cui un utente interagisce con il simulatore è un proxy della sua intenzione d’acquisto e della sua eleggibilità.

Estrazione da BigQuery

Dobbiamo estrarre le sessioni utente e trasformarle in feature. Ecco una query SQL di esempio per estrarre metriche comportamentali:


SELECT
  user_pseudo_id,
  COUNTIF(event_name = 'view_mortgage_simulator') as simulator_interactions,
  AVG(SAFE_CAST(event_params.value.string_value AS FLOAT64)) as avg_loan_amount,
  MAX(event_timestamp) - MIN(event_timestamp) as session_duration_micros,
  COUNTIF(event_name = 'download_pdf_guide') as high_intent_actions
FROM
  `project_id.analytics_123456.events_*`
WHERE
  _TABLE_SUFFIX BETWEEN '20251201' AND '20260131'
GROUP BY
  user_pseudo_id

Definizione delle Feature Critiche

Per un modello di scoring nel credito, le variabili (feature) più predittive che dobbiamo ingegnerizzare includono:

Loan-to-Value (LTV) Implicito: Se l’utente inserisce nel simulatore un importo richiesto e un valore immobile, il rapporto è un forte indicatore di fattibilità.
Tempo di Esitazione: Un tempo eccessivo sulla pagina dei tassi potrebbe indicare sensibilità al prezzo (price sensitivity).
Ricorsività: Numero di visite negli ultimi 30 giorni.

3. Sviluppo del Modello Algoritmico (XGBoost)

Perché usare XGBoost (Extreme Gradient Boosting) invece di una semplice regressione logistica? Perché i dati comportamentali sono spesso non lineari e contengono molti valori mancanti. Gli alberi decisionali gestiscono meglio queste irregolarità e offrono una maggiore interpretabilità tramite la feature importance.

Implementazione Python

Di seguito un esempio di codice per addestrare il modello. Assumiamo di avere un DataFrame df che unisce i dati di GA4 con l’esito storico delle pratiche (0 = persa, 1 = erogata) esportato dal CRM.


import xgboost as xgb
from sklearn.model_selection import train_test_split
from sklearn.metrics import roc_auc_score

# Separazione Feature e Target
X = df.drop(['conversion_flag', 'user_id'], axis=1)
y = df['conversion_flag']

# Split del dataset
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Configurazione del modello XGBoost
model = xgb.XGBClassifier(
    objective='binary:logistic',
    n_estimators=100,
    learning_rate=0.05,
    max_depth=6,
    scale_pos_weight=10 # Cruciale per dataset sbilanciati (pochi mutui erogati rispetto ai lead)
)

# Addestramento
model.fit(X_train, y_train)

# Valutazione
preds = model.predict_proba(X_test)[:, 1]
print(f"AUC Score: {roc_auc_score(y_test, preds)}")

Il parametro scale_pos_weight è fondamentale nel settore creditizio, dove il tasso di conversione reale può essere inferiore al 2-3%. Questo bilancia il peso degli errori sulle classi positive.

4. Integrazione API con il CRM BOMA

Una volta che il modello genera una probabilità (es. 0.85), questa deve essere inviata al CRM in tempo reale o in batch. Nel contesto di BOMA, utilizzeremo le API REST per aggiornare il campo personalizzato predictive_score.

Workflow di Aggiornamento

L’utente compila il form di richiesta preventivo.
Il backend invia i dati al CRM e contemporaneamente interroga il nostro modello (esposto via API Flask/FastAPI).
Il modello calcola lo score basandosi sullo storico di navigazione (recuperato via client_id o cookie).
Il sistema invia un PATCH request al CRM.

Esempio di Payload JSON verso BOMA:


{
  "lead_id": "102938",
  "custom_fields": {
    "predictive_score": 85,
    "score_cluster": "HOT",
    "recommended_action": "Call_Immediately"
  }
}

5. Il Loop di Feedback: Controllo Adattivo

La vera potenza dell’ingegneria dei sistemi risiede nel feedback. Un modello statico degrada nel tempo (model drift). È necessario configurare un processo inverso:

Ogni notte, uno script deve estrarre dal CRM BOMA lo stato aggiornato delle pratiche (es. “Istruttoria”, “Delibera”, “Rifiutata”) e caricarlo su BigQuery. Questi dati diventano il nuovo Ground Truth per il ri-addestramento del modello.

Se il modello aveva predetto 90/100 per un lead che è stato poi rifiutato per “Reddito Insufficiente”, l’algoritmo imparerà a penalizzare combinazioni simili di feature nelle iterazioni future.
Questo crea un sistema autocorrettivo che si adatta ai cambiamenti del mercato (es. inasprimento delle politiche di credito delle banche).

Conclusioni e Impatto sul ROI

Implementare un sistema di lead scoring predittivo non è un esercizio accademico, ma una necessità finanziaria. Spostando le risorse del call center sui lead con score > 70, le aziende di mediazione creditizia possono ridurre il costo di acquisizione cliente (CAC) fino al 40% e aumentare il tasso di conversione sulle pratiche lavorate.

L’integrazione tra GA4, BigQuery e un CRM evoluto come BOMA rappresenta lo stato dell’arte nel 2026. Non si tratta più di chiamare tutti i contatti il prima possibile, ma di chiamare i contatti giusti, con l’offerta giusta, al momento giusto, guidati dalla matematica.

Domande frequenti

Cos è il lead scoring predittivo e come si applica ai mutui?

Il lead scoring predittivo è una metodologia che utilizza algoritmi di Machine Learning per calcolare la probabilità matematica che un contatto si trasformi in fatturato. Nel settore creditizio, questo sistema analizza i comportamenti dell utente, come l interazione con il simulatore, per assegnare un punteggio di priorità, permettendo ai consulenti di concentrarsi solo sulle pratiche con alta probabilità di erogazione.

Perché utilizzare XGBoost invece della regressione logistica per il scoring?

Si preferisce XGBoost perché i dati comportamentali online sono spesso non lineari e frammentati. A differenza della regressione classica, gli alberi decisionali di questo algoritmo gestiscono meglio i valori mancanti e offrono una maggiore interpretabilità delle variabili, risultando più efficaci nel prevedere esiti complessi come l approvazione di un mutuo.

Quali dati servono per costruire un modello di scoring efficace?

Un modello robusto richiede la combinazione di dati di navigazione, provenienti da strumenti come Google Analytics 4, e dati storici sugli esiti delle pratiche presenti nel CRM. Le feature più predittive includono il rapporto rata reddito implicito, il tempo di esitazione sulle offerte e la frequenza delle visite al sito negli ultimi 30 giorni.

Come funziona l integrazione tra GA4, BigQuery e il CRM BOMA?

L architettura prevede l estrazione dei dati grezzi da GA4 verso BigQuery per lo stoccaggio. Successivamente, script Python elaborano questi dati generando uno score che viene inviato in tempo reale al CRM BOMA tramite API. Questo permette di aggiornare la scheda cliente con un punteggio predittivo e suggerire al commerciale l azione migliore da intraprendere.

In che modo il feedback loop migliora il ROI della lead generation?

Il feedback loop è un processo che reimporta l esito reale delle vendite dal CRM al modello di intelligenza artificiale. Questo permette al sistema di auto correggersi: se un lead con punteggio alto non converte, l algoritmo impara a penalizzare profili simili in futuro, riducendo il costo di acquisizione cliente e aumentando l efficienza operativa del call center.