-
SECONDA
PARTE
-
I concetti possono essere semplico o
complessi e si parla di costrutti quando si fa riferimento a costruzioni
concettuali complesse che includono più concetti semplici.
Gli
indicatori sono legati ai concetti generali da quello che viene definito
rapporto di indicazione; per rilevare uno stesso concetto occorre ricorrere a più
indicatori (ad esempio,se il concetto generale è la religiosità un indicatore
può essere costituito dalla frequenza con cui un individuo si reca alla messa).
La variabile è un concetto
operativizzato;
il concetto per essere operativizzato è stato applicato ad un oggetto di cui ne
è divenuto proprietà. Tra concetto, proprietà e variabile c’è la stessa
differenza che intercorre tra peso (concetto), peso di un oggetto (proprietà) e
peso dell’oggetto misurato (variabile). Le caratteristiche logico-matematiche
di una variabile sono quelle che fanno riferimento alle operazioni logiche (per
esempio le operazioni di uguaglianza e disuguaglianza) e matematiche (le 4
operazioni). Le variabili possono essere dipendenti o indipendenti: le variabili
dipendenti sono l’oggetto della ricerca e sono elementi influenzati mentre
le variabili indipendenti sono gli elementi che pongo come ipotesi di
causa.
Le variabili inoltre possono essere manipolabili
(sono quelle che il ricercatore può modificare o non manipolabili (età,genere),
latenti o osservate, individuali o collettive.
Gli stati e i valori delle variabili sono le modalità
di una variabile; per esempio la variabile “pratica religiosa in un
mese” avrà come modalità mai, 2, 3, 4, ecc.
Le
variabili si distinguono in tre classi: variabili nominali, variabili ordinali e
variabili cardinali.
Variabili
nominali: l’operazione usata per questo tipo di variabili dicotomiche che
non sono ordinabili (maschi/femmine, neri/bianchi,ecc)
è quella di uguaglianza e di disuguaglianza e le proprietà da
registrare sono discrete, ovvero non ammettono stati intermedi;
Variabili ordinali: oltre
all’operazione di uguaglianza e di disuguaglianza si possono stabilire
rapporti di grandezza tra le proprietà (maggiore e minore); le proprietà da
registrare sono ordinabili;
Variabili
cardinali: sono variabili per le quali i numeri che ne identificano le
modalità (i valori della variabile) non sono semplici etichette ma hanno un
significato numerico; si possono stabilire oltre alle relazioni di eguaglianza e
disuguaglianza e ai rapporti di grandezza tutte quelle operazioni per cui è
necessario l’uso delle 4 operazioni.
L’ultima
fase è la costruzione degli indici che sintetizzano in un unico valore
la pluralità delle variabili prodotte; in generale per indice intendiamo una
variabile funzione di altre variabili che sintetizza le informazioni contenute
nelle singole variabili operativizzando un concetto complesso.
Quando
misuriamo qualcosa, trasformiamo una serie di eventi in numeri, cioè cerchiamo
di stabilire una corrispondenza biunivoca tra “numeri” ed “eventi”. La
scala di misura è la funzione di relazione che stabiliamo tra il sistema
empirico degli eventi e quello numerico.
La scala
di misura può essere nominale, ordinale, a intervalli, a rapporti
Scala nominale:
sono rappresentate da quei caratteri qualitativi la cui modalità non
rappresentano alcun ordine di successione e nessuna relazione quantitativa.
Sono caratteri nominali il sesso, lo stato civile, la religione, la
nazionalità, ecc. Misurare con una scala di questo tipo significa classificare ogni
elemento in due o più categorie diverse tra loro individuando il numero di
elementi appartenenti ad una categoria e la categoria più numerosa; classi
in base al sesso m/f.
Scala ordinale:
sono rappresentate da quei caratteri qualitativi le cui modalità presentano un
ordine di successione ma non una grandezza (graduatorie, ranghi); utilizzare una
scala ordinale equivale a stabilire un ordine tra gli elementi, cioè a
classificarli sulla base della loro grandezza; scala della durezza dei
minerali.
Scala ad intervalli:
questo tipo di scala permette di quantificare la differenza che esiste tra due
elementi, cioè consente di individuare quante unità di misura differenziano
due osservazioni; scala della temperatura.
Scala proporzionale:
questo tipo di scala si differenzia dalla precedente perché ha un punto 0 che
è assoluto; questo tipo di misurazione consente di stabilire delle relazioni
tra gli elementi (a è doppio di b, b è la metà di a, ecc.); scala in
base e all’altezza e/o al peso.
La
matrice dati consiste in un insieme rettangolare di numeri dove in riga
abbiamo i casi (esemplari dell’unità di analisi, l’oggetto studiato,
inseriti nella ricerca) e nelle colonne le variabili (i concetti operativizzati);
in ogni cella derivante dall’incrocio tra una riga e una colonna abbiamo un
dato
Una
volta costruita la matrice dei dati si tratta di analizzarla e l’analisi viene
condotta attraverso l’uso delle variabili; uno strumento di analisi riguarda
lo studio delle distribuzioni di frequenza.
La
distribuzione di frequenza di una variabile è una rappresentazione nella
quale ad ogni variabile viene associata la frequenza con la quale essa si
rappresenta nei dati standardizzati;tale rappresentazione può essere letta in
forma tabellare, grafica, oppure algebrica.
Analisi
monovariata
L’analisi
monovariata consiste nell’analizzare le variabili singolarmente, prese cioè
una ad una senza metterle in relazione tra loro.
L’analisi
monovariata è l’analisi puramente descrittiva dei fenomeni studiati e si
limita a dire come ogni variabile è distribuita tra i casi rilevati.
Misure
della tendenza centrale
Le
misure della tendenza centrale ci dicono qual è il baricentro in una
distribuzione di frequenza, ovvero il valore che meglio di qualsiasi altro,
esprime la distribuzione se si decide di sintetizzarla in un unico numero.
La
moda è il punto in cui cade il maggior numero di dati ed identifica il
punteggio più frequente nella distribuzione. Si può calcolare con variabili
nominali, ordinali e cardinali.
La
mediana di una variabile è la modalità del caso che occupa il posto di
mezzo nella distribuzione ordinata dei casi secondo quella variabile. Si può
calcolare con variabili ordinali e cardinali.
Misure
della dispersione
Per
descrivere in modo completo una distribuzione, oltre alla misure della tendenza
centrale si deve anche far ricorso alle misure della dispersione o della
variabilità: questo secondo tipo di indici ci permette di verificare quanto
ogni singolo valore si allontani dalla media.
La
gamma è l’indice più semplice e si ottiene dalla differenza tra il
valore massimo ed il valore minimo della distribuzione.
Gamma=
Xmas-Xmin
La
media aritmetica: è data dalla somma dei valori assunti dalla variabile
su tutti i casi diviso il numero dei casi. E’ la misura di tendenza centrale
più comune e si può calcolare con le variabili cardinali. Se un carattere si
distribuisce su N unità presentando modalità X1 con frequenza n1,
modalità X2 con frequenza n2
e l’ultima modalità Xt con frequenza nt, la media sarà data dalla
somma dei prodotti tra le modalità e le loro rispettive frequenze, diviso il
numero dei casi.
La media armonica è
l’inverso della media aritmetica ed esprime il rapporto tra i casi di una
distribuzione e i risultati ottenuti dalle divisioni tra le frequenze e le
modalità di una distribuzione.
La media
aritmetica e quella armonica sono casi particolari della media di potenze
di ordine S. Se S è uguale ad 1 si ha la media aritmetica, se S è uguale a –
1 si ha la media armonica.
La media
geometrica di un insieme N di numeri X1, X2, X3, Xn è la radice N-esima del
prodotto tra le modalità.
Lo scostamento
semplice medio della media aritmetica è dato dalla somma degli scarti della
media (gli scarti della media sono
il risultato della differenza tra ogni singola modalità e la media della
distribuzione che nella formula è indicata con M).
La deviazione
standard non è altro che lo scostamento semplice medio al quadrato sotto
radice e si applica per ottenere tutti numeri positivi.
Il
quadrato della deviazione standard è la varianza della distribuzione; la
varianza esprime la variabilità di una variabile; maggiore è l’indice della
varianza maggiore sarà il la variabilità all’interno della distribuzione.
Nel
caso di caratteri qualitativi l’attitudine di un fenomeno ad assumere
differenti modalità qualitative si chiama mutabilità. Una popolazione
di unità statistiche si dice omogenea rispetto a un carattere se la
modalità è uguale in tutte le unità; essa è tanto più eterogenea
quanto più le frequenze si ripartiscono uniformemente tra le varie unità.
In statistica l’entropia è introdotta per misurare l’eterogeneità
di un sistema cioè il suo disordine.
Il
rapporto statistico è un quoziente tra due termini di cui almeno uno è
di natura statistica ed esprime un legame logico; i rapporti statistici
consentono comparazioni nel tempo, nello spazio tra le frequenze di due fenomeni
omogenei o eterogenei. I rapporti statistici possono essere distinti in:
rapporti di composizione:
vengono anche chiamati rapporti “parte del tutto” e consistono nel
rapportare una parte del fenomeno al fenomeno stesso nella sua totalità
(proporzione di maschi in una classe= maschi : (maschi+femmine);
rapporti di coesistenza:
è il rapporto tra due parti ovvero il rapporto tra la frequenza di una modalità
e la frequenza di un’altra modalità (indice di vecchiaia= popolazione sopra i
65 anni : popolazione sotto i 15);
rapporti di derivazione: si
tratta di rapporti tra la misura di un fenomeno e quello di un altro che può
essere considerato un suo presupposto necessario (laureati : iscritti
all’università);
rapporti medi: si
hanno tutte le volte che il fenomeno posto al numeratore si può associare
mediamente ad una unità posta al denominatore (numero di posti letto in
ospedale : popolazione).
Il calcolo della probabilità
interviene in tutte le situazioni in cui i fatti osservabili non sono
prevedibili e qualora si debbano prendere decisioni in base a ipotesi
riguardanti eventi futuri.
Un
esperimento casuale dà luogo a più risultati e quindi a più eventi casuali;
un evento casuale può essere: certo, impossibili, possibile. L’insieme dei
risultati possibili è detto spazio campionario; due o più eventi sono
incompatibili se il verificarsi dell’uno esclude il verificarsi dell’altro
mentre si dice complementare l’evento corrispondente al non verificarsi di uno
dei due (nel lancio di una moneta la testa è complementare alla croce).
Analisi
bivariata
L’analisi
bivariata riguarda invece lo studio delle relazioni tra due variabili; dove
c’è una relazione tra le variabili significa dire che c’è una relazione
concomitante tra i loro valori, una covariazione. Si tratta di relazioni di tipo
statistico, ovvero probabilistico.
Nella
tavole di contingenza collochiamo in riga una variabile, in colonna
l’altra variabile e nelle celle definite dall’incrocio tra le righe e le
colonne il numero dei casi che presentano la corrispondente modalità delle due
variabili. La tecnica dell’analisi della varianza serve per studiare la
relazione tra una variabile nominale ed una cardinale. La regressione
serve per studiare le relazioni tra due variabili cardinali; l’insieme dei
punti da riportare viene detta “nuvola di punti” e la rappresentazione
grafica nel suo complesso si chiama diagramma di dispersione. Data una nuvola di
punti possiamo tracciare una retta, la retta di regressione, che unendo i
punti sintetizzi la nuvola e ci dice qual è la forma della relazione tra le due
variabili cardinali. Per misurare la forza di una relazione tra due
variabili cardinali si utilizza il coefficiente di correlazione (assume il
valore di +1 se la relazione è positiva, -1 se la relazione è negativa e 0 se
l relazione è assente).
Analisi
multivariata
E’
lo studio delle relazioni intercorrenti tra più di due variabili.
Nell’analisi multivariata il ricercatore prende in esame un determinato numero
di gruppi di variabili (cluster analisys)
che descrivono aspetti simili e dissimili. Per le tecniche di clustering
si fa riferimento a metodi scissori o aggregativi o metodi gerarchici o non
gerarchici.