La semplice guida del TP per comprendere i sondaggi

media sondaggi

Spieghiamo in termini semplici e chiari come leggere e comprendere un sondaggio.

A seguito di un appunto mossoci da un nostro lettore, intendiamo con questo articolo fornire un semplice ed intuitivo vademecum su come leggere un sondaggio, comprenderlo ed analizzarlo. Molti dei concetti espressi saranno ampiamente conosciuti da alcuni lettori: tuttavia, per altri non è necessariamente vero ed è a questi lettori che ci rivolgiamo. Qualunque consiglio/suggerimento è ben accetto in ogni momento, tramite la sezione commenti che trovate al fondo dell’articolo.

 

Partiamo con un esempio pratico: supponiamo di aver di fronte un sondaggio politico, in cui si segnalano le percentuali di 4 partiti: A, B, C e D, includendo anche la percentuale di indecisi ed astenuti.

PARTITO PERCENTUALE
A 20%
B 30%
C 35%
D 15%
TOTALE 100%
INDECISI 12%
ASTENUTI 25%

CASI: 1000. Metodologia: CATI

Prima di tutto, un elenco necessario di termini usati per indicare il CORPO ELETTORALE.

ELETTORI: numero di cittadini italiani maggiorenni, iscritti alle liste elettorali di ogni comune, che possono votare ad una data elezione. Ricordiamo che in Italia si può votare al Senato solo dopo aver compiuto 25 anni.

VOTANTI: numero di elettori che si è recato effettivamente al seggio per votare. I votanti non possono mai essere superiori agli elettori, tranne in rare occasioni, che non stiamo qui ad indicare.

VOTANTI VALIDI: numero di votanti che hanno espresso una preferenza per un partito in modo corretto. Sono quindi escluse dal conteggio le SCHEDE BIANCHE, le SCHEDE NULLE e le SCHEDE CONTESTATE non assegnate dal presidente di seggio o altri organi elettorali. Per questo motivo, i votanti sono sempre in numero maggiore dei voti validi.

ASTENUTI: numero di elettori che non si sono recati alle urne. Ovvero il numero di ELETTORI meno il numero di VOTANTI.

AFFLUENZA: il rapporto (percentuale) tra votanti ed elettori, quindi VOTANTI / ELETTORI, moltiplicato per 100 generalmente. Gli astenuti si possono quindi anche calcolare come ASTENUTI = (100 – AFFLUENZA) / 100 * ELETTORI.

(per continuare la lettura cliccare su “2”)

In un sondaggio, come nel nostro esempio, compare spesso anche un’altra voce: gli INDECISI. Gli indecisi sono quegli elettori che non hanno ancora chiaro se andare a votare oppure, nel caso in cui si rechino ai seggi, per quale partito votare. Chiaramente gli indecisi non sono mai indicati nel riepilogo ufficiale finale di un’elezione, poiché se sono rimasti a casa, vengono inclusi tra gli astenuti. Se invece hanno espresso un parere, qualunque esso sia, vengono conteggiati come tutti gli altri. Gli indecisi perciò sono una peculiarità solo dei sondaggi pre-voto.

Chiarito il significato di questi termini basilari, possiamo ora comprendere meglio come leggere ed interpretare il sondaggio-test di cui sopra.

Come è già successo in passato, ed anche sul nostro sito, il primo errore che si può commettere è il seguente: si sommano tutte le percentuali dei 4 partiti, includendo anche la quota di indecisi ed astenuti. Il che vuol dire che l’eventuale totale è pari al 137%. Questo ovviamente è un controsenso. Nessuno sondaggio può avere come somma totale una percentuale maggiore di 100. Tanti cittadini si interpellano, tanti cittadini devono fornire una risposta. L’errore tuttavia NON sta nel sondaggio, quanto nell’interpretazione dei dati.

Le percentuali dei partiti vengono calcolate non sul numero totale di elettori, ma sul numero totale di voti validi.

Poiché gli astenuti non possono esprimere un voto valido, non essendo andati a votare, e poiché gli indecisi non hanno ancora espresso un parere, è chiaro che non possono essere inclusi tra i voti validi. Il totale dei voti validi è perciò esattamente 100, come è logico che sia, ovvero la somma delle percentuali dei 4 partiti, A,B,C e D:

% di A + % di B + % di C + % di D = 100%, corrispondente al TOTALE VOTI VALIDI

Come facciamo dunque a risalire dai dati del sondaggio al numero effettivo di risposte? Molto semplice, si usa il penultimo dato, ovvero “CASI: 1000”.

Se la voce “CASI” non è affiancata dall’aggettivo “UTILI” oppure “VALIDI”, vuol dire che il campione totale, inclusi astenuti ed indecisi è pari a 1000; dunque non solo i voti validi. Nel nostro caso, si è indicato solo il termine “CASI”. Questo implica che se volessimo sapere quante persone hanno votato per il partito A, non potremmo eseguire il conto: il 20% di 1000 è pari a 200, quindi 200 sono le persone che hanno votato per il partito A. Questo perché stiamo includendo tra i 1000 anche i voti non validi, gli indecisi e gli astenuti. Per aggirare l’ostacolo, si procede come segue.

  1. si calcola il numero effettivo di astenuti: il 25% di 1000 è pari a 250, quindi 250 persone su 1000 hanno detto che non andrebbero a votare.
  2. si calcola il numero di indecisi: il 12% di 1000 è uguale a 120, quindi 120 persone su 1000 non sanno ancora cosa faranno alle prossime elezioni, se andare a votare, e se andranno, per quale partito votare.
  3. si calcola il numero di voti validi (ipotizzando che le schede bianche/nulle siano incluse tra gli indecisi): 1000-120-250=630. Quindi, 630 persone su 1000 hanno indicato un voto valido per uno dei 4 partiti. 630 corrisponde al 63% di 1000 ed è su questo dato che bisogna calcolare la percentuale dei voti ai partiti.
  4. si calcolano perciò i voti effettivi ai singli partiti

Numero voti per il partito A: 126 = 630/100*20

Numero voti per il partito B: 189= 630/100*30

Numero voti per il partito C: 220,5= 630/100*35

Numero voti per il partito D: 94,5= 630/100*15

TOTALE: 630

(per continuare la lettura cliccare su “3”)

Per ovvi motivi, non ha senso affermare che 0,5 persone hanno votato per un tal partito, quindi tutti i numeri decimali (dopo la virgola) si devono approssimare per rendere le cifre dei numeri interi (senza virgola). Dipende dai casi e dal sistema, ma in questo articolo non ce ne preoccupiamo troppo ed indichiamo come 221 il numero di voti per C e 94 per D.

Abbiamo così derivato con semplici conti il numero reali di voti che l’Istituto ha riscontrato nel proprio sondaggio e che ha espresso con un certo numero di percentuali.

Un ultimo passaggio, per chi vuole rendere i dati ancora più uniformi: bisogna normalizzare il campione. Cosa vuol dire normalizzare il campione? Vuol dire molto brutalmente rendere più regolare un insieme di dati. Nel caso nostro specifico, vogliamo sapere quale sia la percentuale dei 4 partiti rispetto non ai voti validi, ma al numero di elettori, in modo tale da poter equiperare tali percentuali con il dato degli astenuti.

Anche qui, il processo è molto semplice:

  1. A = 126 voti, B = 189 voti, C = 221 voti, D = 94 voti.
  2. Totale indecisi = 120.
  3. Totale astenuti = 250.
  4. Totale casi = 1000.
  5. Si calcolano le percentuali dei partiti non sui voti validi (630) ma sui casi totali, 1000.

A = 126/1000*100 = 12,6%, approssimato a 13%

B = 189/1000*100 = 18,9%, approssimato a 19%

C = 221/1000*100 = 22,1%, approssimato a 22%

D = 94/1000*100 = 9,4%, approssimato a 9%

Indecisi = 120/1000*100 = 12%

Astenuti = 250/1000*100 = 25%

TOTALE = 100%

Come si vede, quando si normalizza, le percentuali dei partiti cambiano, poiché il numero di casi aumenta (da 630 si passa a 1000, includendo indecisi ed astenuti). Da qui si evince come il partito C che aveva il 35% dei consensi, ora diventa pari al 22% del campione, inferiore al numero di astenuti, pari al 25%.

Questo è il modo corretto di sommare le voci in un sondaggio. In pratica: non si sommano pere con mele. Traduzione. non si sommano voti validi con elettori.

Spiegato il modo di ricavare i dati e trattarli, spieghiamo ora cosa si intenda per metodologia “CATI”, l’ultima voce.. Nel nostro sondaggio-test abbiamo indicato come 1000 il numero di casi totali. Questi 1000 corrispondono al nostro CAMPIONE. Cosa si intende per campione? Si intende quella frazione di elettori che può essere considerata, per una serie di ragioni, indicativa di tutto il corpo elettorale. Esempio: in italia vi sono circa 40 milioni di potenziali elettori. E’ assolutamente impossibile poter pensare di chiedere ad ognuno di essi un parere in un sondaggio, sia per regioni di tempo, sia per ragioni di costo del sondaggio stesso. Immaginate quanto possa costare ad un istituto effettuare una telefonata al singolo cittadino. Moltiplicate questo costo per 40 milioni ed avrete il costo totale del sondaggio, escludendo altre spese eventuali. I tempi poi sarebbero enormi. Evidentemente bisogna trovare un sistema più efficiente per sapere come i 40 milioni di potenziali elettori voteranno. Per farlo, si usano almeno 3 tecniche differenti di campionamnto (ovvero, raccolta dati): CAWI, CATI o CAPI.

CAWI: rilevazioni via internet

CATI: rilevazioni via telefono

CAPI: rilevazione faccia a faccia.

Ogni metodologia prevede punti deboli e forti: generalmente il CAWI è molto adatto per rielvare un pubblico giovane o mediamente giovane, altamente istruito ed interessato alla politica (altrimenti non andrebbe a cercare un sito che effettui queste rilevazioni), prevalentemente concentrato nei grandi centri urbani. E’ tuttavia debole sulle fasce più anziane (quanti di voi conoscono ultra 70-enni che si collegano ad internet?), bassamente istruiti (licenza elementare e meno), pensionati e casalinghe. Il CATI è praticamente speculare al CAWI: dove è forte il CAWI è debole il CATI e viceversa. Ecco spiegato il motivo per cui la maggior parte degli istituti di sondaggi usano il CATI (ovvero le interviste telefoniche): per poter usare il CAWI bisogna apportare correttivi maggiori e richiede un sito internet largamente conosciuto per poter avere un campione sufficientemente ampio. Tuttavia, ed è questo un punto di forza del CAWI rispetto al CATI, gli italiani hanno spesso la tendenza a mentire ai sondaggi. Non è questa la sede per comprenderne le motivazioni, ma se ci pensate un attimo è piuttosto logico capire perché per il CAWI questo problema sia secondario. Se qualcuno vi chiama per telefono, sul fisso o cellulare, mentre voi siete occupati in qualche attività, sarete predisposti o ad interrompere la conversazione, oppure a rispondere in modo sbrigativo per non perdere tempo. Il che porta, in alcuni, la tendenza a “vendicarsi” dello sgarbo subito di essere stati disturbati senza il proprio consenso. Ed ecco che possono emergere risposte non veritiere. Oppure, vi è la tendenza storica di aver timore di indicare il proprio voto ad uno sconosciuto. Col CATI, si ha sempre l’impressione che vi sia qualcuno dall’altra parte della cornetta ad ascoltare, e conoscendo il numero di telefono, riuscire a risalire alla persona. Questo in realtà non è vero, nel senso che le telefonate sono spesso generate automaticamente tramite un computer, e l’intervento umano avviene solo nel momento di analizzare i dati. Nessuno ha molta voglia di risalire ad ogni numero di telefono per poter controllare se tizio o caio abbiano votato per A oppure B. A che pro, poi?

(per continuare la lettura cliccare su “4”)

Nel CAWI il discorso cambia drasticamente: innanzitutto non è l’istituto a disturbare il cliente. E’ il cliente che di sua spontanea volontà si reca su un certo sito per esprimere un’opinione. Quindi, è molto difficile che vi sia qualcuno che quel giorno decida di mentire appositamente, sprecando tempo della sua giornata a cercare il sito tal dei tali e dare preferenze sbagliate. Può succedere, certo, ma è un caso molto piccolo sul totale. In più, il CAWI difende maggiormente la segretezza: le connessioni a banda larga, ormai diffuse largamente sul territorio, permettono di generare indirizzi (IP: internet protocol) in modo dinamico attraverso appositi router (il modem, per capirci). Ogni volta che ci si connette, si cambia l’indirizzo automaticamente, rendendo molto arduo poter risalire al singolo utente. Se per il CATI è difficile, ma non impossibile risalire alla persona fisica, per il CAWI è ancor più diffiicile, a meno di non aver gli strumenti adottati dalla Polizia Postale.

Infine, il CAPI, ovvero le interviste faccia a faccia, è ancora più potenzialmente afflitto dal rischio di “menzogna”, poiché in quel caso si deve rispondere dinanzi ad un’altra persona, con tutte le limitazioni del caso.

Un’ulteriore differenza fondamentale tra tutti questi 3 metodi è il COSTO: nel CATI bisogna pagare o dei centralinisti oppure il sistema informatizzato di telefonate. Nel CAPI bisogna pagare delle persone affinché si rechino sul posto fisico ed effettuino interviste. Nel CAWI, se il sito a cui ci si appoggia non fa pagare nulla, oppure se quel sito è addirittura di propria proprietà, il costo è in buona sostanza pari a zero. Differenza sostanziale per chi vuol far quadrare il bilancio tra entrate ed uscite o per chi vuole commissionare un sondaggio e non ha un budget grande da spendere.

Non parliamo poi del tasso di abbandono di un’intervista. Quante persone dovete contattare per poter avere 1000 casi buoni tramite telefono? Quante persone dovete fermare per strada per poter avere 1000 casi buoni? Il rapporto è grossomodo di 1:10 per il CATI. Per il CAPI non ne ho nessuna idea. Per il CAWI, nuovamente, le cose cambiano: nei sondaggi del Termometro Politico via internet, il tasso di abbandono di un’intervista è praticamente nullo. Chi inizia un sondaggio, lo porta a termine nella stragrande maggioranza dei casi.

 

Ci auguriamo che con questa semplice guida il lettore meno esperto abbia avuto modo di comprendere come si debba leggere ed analizzare velocemente, ma correttamente, un sondaggio.

Come detto all’inizio, per qualunque suggerimento/domanda/consiglio, scrivete i vostri commenti al fondo dell’articolo nell’apposito spazio.

 

Grazie.