La politica nei numeri (del lavoro): Un contributo all’apertura

Quando la politica trova il numero, il livello stesso della politica – nel senso di discussione – tende allo 0. Le motivazioni possono essere le più svariate: dal dominio dell’economia sulla società, all’esigenza di sintesi e semplificazione imposta dai media, dall’illusione del controllo che danno le informazioni numeriche, all’incapacità per, i più, di metterle in discussione. Quale che sia la motivazione che si preferisce, quella attorno alla quale ho immaginato di scrivere queste righe è sull’effettiva disponibilità dei dati che si dovrebbero discutere. Anzi, a dirla tutta, volevo più che altro contribuire alla loro pubblicizzazione.

Negli ultimi tempi, infatti, si sarà notato come in Italia il dibattito sul lavoro si stia arricchendo di dati prima sconosciuti (ai più). Qualche settimana fa Poletti dichiarava come a Gennaio fossero aumentati i contratti a tempo indeterminato, qualche giorno dopo l’ISTAT comunicava la sostanziale invarianza su base annuale dell’occupazione (+0,4% sulla media annuale) e qualche giorno dopo ancora, Boeri dall’INPS fa sapere che la variazione positiva col Jobs Act c’è stata, ma che ammonta alla bellezza di 13 occupati in più. Anche grazie ad alcuni mezzi di informazione (ilsole24ore soprattutto) si è provato a fare un po’ di chiarezza, ma, come spesso avviene in questi casi, pur essendo pubblici, i dati non sono poi così disponibili.

I dati di Poletti, ad esempio, sono quelli delle Comunicazioni Obbligatorie che le imprese mandano in caso di assunzione o variazione contrattuale o licenziamento di un qualsiasi addetto. Si tratta di dati molto complessi da gestire, in termini di privacy ovviamente, ma anche in termini di mole di dati. Un contratto di tre giorni dà luogo a una comunicazione, un rinnovo dà luogo a una comunicazione e così via. La possibilità di gestione è effettivamente complicata, ma se si decide che quello deve essere il terreno per misurare gli effetti di una riforma, allora quei dati devono essere messi a disposizione. Il Ministero del Lavoro ha abbozzato una procedura di accesso a quei dati, difficile in realtà e, tutto sommato, non ho ancora capito che tipo di dati ne escono fuori dato che sul sito si parla di “campione” ma non si dice se è rappresentativo e, nel tracciato record, non si vedono coefficenti di riporto all’universo.

Istat, invece, ha semplificato le procedure di accesso alla base informativa che da sempre quantifica e pretende di descrivere il mercato del lavoro in Italia: la Rilevazione Continua sulle Forze di Lavoro. La semplificazione consiste nell’aver rimosso quell’odiosa trafila tra invio di fax e specifiche sull’utilizzo dei dati e aver messo parte dei dati on line. Basta registrarsi e scaricare in un comodo file .zip il sottocampione del trimestre che interessa. Una volta aperto il file all’interno ci sono un sacco di informaizoni utili, tra cui il tutorial per importare il database vero e proprio in excel e il mitico foglio dell’errore campionario, che una volta compreso per bene ci chiarisce a quanto poco servano quei dati. Alla semplificazine, infatti, Istat ha fatto corrispondere una riduzione del numero di record messi a disposizione per l’analisi e quindi ad un incremento dell’errore campionario. Per fare un esempio, per il IV trimestre, a una stima di 50.000 casi in Friuli-Venezia Giulia corrispode un errore del 10,3%. Che significa? Che se faccio un qualsiasi calcolo il cui risultato è 50.000 in Friuli-Venezia Giulia, nella realtà, non saprò mai con certezza a quale numero compreso tra 45 e 55 mila quel 50.000 corrisponda davvero. Per fare un esempio concreto, poniamo di voler conoscere il genere dei collaboratori (parasubordinati) in Emilia Romagna nel IV trimestre del 2014. Il risultato è si 186 mila maschi e 173 mila femmine. Su 186 mila l’errore è del 3,66%, su 173 mila 3,81%. Il che significa che i collaboratori maschi possono essere una qualsiasi quantità tra 179 mila e 192 mila, mentre  le collaboratrici tra 179 mila e  166 mila.  Il risultato, triste, è che non si sa se nel primo trimestre del 2014 ci siano stati, in Emilia-Romagna, più colaboratori o più collaboratrici.

Ciò detto, è indubbio che da quel database possano uscire informazioni utili. Quindi – e questo voleva essere il mio contributo – dato che il file reso disponibile dall’ISTAT non contiene praticamente una sola riga per automatizzare l’importazione delle etichette nelle diverse variabili, ho preparato questa sintassi per l’importazione in SPSS che basta far girare una volta importati i file.

Ecco i passi per l’importazione dei dati relativi al 2014:

1) scaricare il file dal sito Istat e aprirlo;

2) trascinare il file .txt contenuto nella cartella /MICRODATI sulla finestra preventivamente aperta di SPSS;

3) seguire la procedura di importazione in SPSS ricordandosi di modificare le voci di default per quanto riguarda il nome delle variabili (che sono sulla prima riga e che quindi i dati veri e propri iniziano dalla seconda) e il carattere di tabulazione, che consiste nel solo tab (deselazionare spazio);

3bis) per la media annuale, ripetere i passaggi per tutti i trimestri, salvare i file separatamente e solo sucessivamente eseguire l’aggregazione (modifica –> aggiungi casi –> etc. etc.). Come specificato nell’apposito file fornito da ISTAT, per per l’anno 2014 il numero di record del file di media è pari a 101.388 + 94.798 + 92.311 + 94.492 = 382.989;

4) aprire e incollare la sintassi contenuta nel file RCFdL ISTAT importazione in SPSS nel prompt di sintassi. Le prime righe, si noterà, sono relative al calcolo del coefficente di riporto all’universo. Il calcolo è sia per il calcolo all’unità che alle migliaia del trimestre (COEF = COEFMI/10 e COEFMIL=COEFMI/1.000) sia per il calcolo all’unità e alle migliaia della media annuale (COEFMED=COEFMI/40 e COEMILMED=COEFMI/4.000). Basterà pesare i casi in base al coefficente adeguato ai risultati che si vogliono ottenere. Segue poi il minimo necessario a calcolare un tasso qualsiasi, giusto per essere sicuri di aver eseguito bene l’importazione.

Per dubbi, problemi o boh, scrivete pure.