Ricerca personalizzata

Pagina iniziale
Preferiti

Contatti

Forum

cerca nel sito

 

www.dittatori.it

 

 

 

 

Viaggi nel mondo

 

Segnala questo sito ai tuoi amici!
clicca qui
 

 

 

 

 

 

 

 


ELEMENTI DI STATISTICA

- SECONDA PARTE -

I concetti possono essere semplico o complessi e si parla di costrutti quando si fa riferimento a costruzioni concettuali complesse che includono più concetti semplici.

Gli indicatori sono legati ai concetti generali da quello che viene definito rapporto di indicazione; per rilevare uno stesso concetto occorre ricorrere a più indicatori (ad esempio,se il concetto generale è la religiosità un indicatore può essere costituito dalla frequenza con cui un individuo si reca alla messa).

            La variabile è un concetto operativizzato; il concetto per essere operativizzato è stato applicato ad un oggetto di cui ne è divenuto proprietà. Tra concetto, proprietà e variabile c’è la stessa differenza che intercorre tra peso (concetto), peso di un oggetto (proprietà) e peso dell’oggetto misurato (variabile). Le caratteristiche logico-matematiche di una variabile sono quelle che fanno riferimento alle operazioni logiche (per esempio le operazioni di uguaglianza e disuguaglianza) e matematiche (le 4 operazioni). Le variabili possono essere dipendenti o indipendenti: le variabili dipendenti sono l’oggetto della ricerca e sono elementi influenzati mentre le variabili indipendenti sono gli elementi che pongo come ipotesi di causa.

            Le variabili inoltre possono essere manipolabili (sono quelle che il ricercatore può modificare o non manipolabili (età,genere), latenti o osservate, individuali o collettive.

            Gli stati e i valori delle variabili sono le modalità di una variabile; per esempio la variabile “pratica religiosa in un mese” avrà come modalità mai, 2, 3, 4, ecc.

 Le variabili si distinguono in tre classi: variabili nominali, variabili ordinali e variabili cardinali.

Variabili nominali: l’operazione usata per questo tipo di variabili dicotomiche che non sono ordinabili (maschi/femmine, neri/bianchi,ecc)  è quella di uguaglianza e di disuguaglianza e le proprietà da registrare sono discrete, ovvero non ammettono stati intermedi;

Variabili ordinali: oltre all’operazione di uguaglianza e di disuguaglianza si possono stabilire rapporti di grandezza tra le proprietà (maggiore e minore); le proprietà da registrare sono ordinabili;

Variabili cardinali: sono variabili per le quali i numeri che ne identificano le modalità (i valori della variabile) non sono semplici etichette ma hanno un significato numerico; si possono stabilire oltre alle relazioni di eguaglianza e disuguaglianza e ai rapporti di grandezza tutte quelle operazioni per cui è necessario l’uso delle 4 operazioni.

L’ultima fase è la costruzione degli indici che sintetizzano in un unico valore la pluralità delle variabili prodotte; in generale per indice intendiamo una variabile funzione di altre variabili che sintetizza le informazioni contenute nelle singole variabili operativizzando un concetto complesso.

Quando misuriamo qualcosa, trasformiamo una serie di eventi in numeri, cioè cerchiamo di stabilire una corrispondenza biunivoca tra “numeri” ed “eventi”. La scala di misura è la funzione di relazione che stabiliamo tra il sistema empirico degli eventi e quello numerico.

La scala di misura può essere nominale, ordinale, a intervalli, a rapporti

     Scala nominale: sono rappresentate da quei caratteri qualitativi la cui modalità non rappresentano alcun ordine di successione e nessuna relazione quantitativa.                     Sono caratteri nominali il sesso, lo stato civile, la religione, la nazionalità, ecc.  Misurare con una scala di questo tipo significa classificare ogni elemento in due o più categorie diverse tra loro individuando il numero di elementi appartenenti ad una categoria e la categoria più numerosa; classi in base al sesso m/f.

     Scala ordinale: sono rappresentate da quei caratteri qualitativi le cui modalità presentano un ordine di successione ma non una grandezza (graduatorie, ranghi); utilizzare una scala ordinale equivale a stabilire un ordine tra gli elementi, cioè a classificarli sulla base della loro grandezza; scala della durezza dei minerali.

     Scala ad intervalli: questo tipo di scala permette di quantificare la differenza che esiste tra due elementi, cioè consente di individuare quante unità di misura differenziano due osservazioni; scala della temperatura.

     Scala proporzionale: questo tipo di scala si differenzia dalla precedente perché ha un punto 0 che è assoluto; questo tipo di misurazione consente di stabilire delle relazioni tra gli elementi (a è doppio di b, b è la metà di a, ecc.); scala in base e all’altezza e/o al peso.

La matrice dati consiste in un insieme rettangolare di numeri dove in riga abbiamo i casi (esemplari dell’unità di analisi, l’oggetto studiato, inseriti nella ricerca) e nelle colonne le variabili (i concetti operativizzati); in ogni cella derivante dall’incrocio tra una riga e una colonna abbiamo un dato

Una volta costruita la matrice dei dati si tratta di analizzarla e l’analisi viene condotta attraverso l’uso delle variabili; uno strumento di analisi riguarda lo studio delle distribuzioni di frequenza.

La distribuzione di frequenza di una variabile è una rappresentazione nella quale ad ogni variabile viene associata la frequenza con la quale essa si rappresenta nei dati standardizzati;tale rappresentazione può essere letta in forma tabellare, grafica, oppure algebrica.

 

Analisi monovariata  

L’analisi monovariata consiste nell’analizzare le variabili singolarmente, prese cioè una ad una senza metterle in relazione tra loro.

L’analisi monovariata è l’analisi puramente descrittiva dei fenomeni studiati e si limita a dire come ogni variabile è distribuita tra i casi rilevati.    

Misure della tendenza centrale 

Le misure della tendenza centrale ci dicono qual è il baricentro in una distribuzione di frequenza, ovvero il valore che meglio di qualsiasi altro, esprime la distribuzione se si decide di sintetizzarla in un unico numero.

La moda è il punto in cui cade il maggior numero di dati ed identifica il punteggio più frequente nella distribuzione. Si può calcolare con variabili nominali, ordinali e cardinali.

La mediana di una variabile è la modalità del caso che occupa il posto di mezzo nella distribuzione ordinata dei casi secondo quella variabile. Si può calcolare con variabili ordinali e cardinali.  

 

Misure della dispersione 

Per descrivere in modo completo una distribuzione, oltre alla misure della tendenza centrale si deve anche far ricorso alle misure della dispersione o della variabilità: questo secondo tipo di indici ci permette di verificare quanto ogni singolo valore si allontani dalla media.

La gamma è l’indice più semplice e si ottiene dalla differenza tra il valore massimo ed il valore minimo della distribuzione.  

Gamma= Xmas-Xmin  

La media aritmetica: è data dalla somma dei valori assunti dalla variabile su tutti i casi diviso il numero dei casi. E’ la misura di tendenza centrale più comune e si può calcolare con le variabili cardinali. Se un carattere si distribuisce su N unità presentando modalità X1 con frequenza n1, modalità X2 con frequenza n2 e l’ultima modalità Xt con frequenza nt, la media sarà data dalla somma dei prodotti tra le modalità e le loro rispettive frequenze, diviso il numero dei casi.

La media armonica è l’inverso della media aritmetica ed esprime il rapporto tra i casi di una distribuzione e i risultati ottenuti dalle divisioni tra le frequenze e le modalità di una distribuzione.

La media aritmetica e quella armonica sono casi particolari della media di potenze di ordine S. Se S è uguale ad 1 si ha la media aritmetica, se S è uguale a – 1 si ha la media armonica.

 La media geometrica di un insieme N di numeri X1, X2, X3, Xn è la radice N-esima del prodotto tra le modalità.

Lo scostamento semplice medio della media aritmetica è dato dalla somma degli scarti della media (gli scarti della  media sono il risultato della differenza tra ogni singola modalità e la media della distribuzione che nella formula è indicata con M).

La deviazione standard non è altro che lo scostamento semplice medio al quadrato sotto radice e si applica per ottenere tutti numeri positivi.

            Il quadrato della deviazione standard è la varianza della distribuzione; la varianza esprime la variabilità di una variabile; maggiore è l’indice della varianza maggiore sarà il la variabilità all’interno della distribuzione.

 

Nel caso di caratteri qualitativi l’attitudine di un fenomeno ad assumere differenti modalità qualitative si chiama mutabilità. Una popolazione di unità statistiche si dice omogenea rispetto a un carattere se la modalità è uguale in tutte le unità; essa è tanto più eterogenea  quanto più le frequenze si ripartiscono uniformemente tra le varie unità. In statistica l’entropia è introdotta per misurare l’eterogeneità di un sistema cioè il suo disordine.

Il rapporto statistico è un quoziente tra due termini di cui almeno uno è di natura statistica ed esprime un legame logico; i rapporti statistici consentono comparazioni nel tempo, nello spazio tra le frequenze di due fenomeni omogenei o eterogenei. I rapporti statistici possono essere distinti in:

      rapporti di composizione: vengono anche chiamati rapporti “parte del tutto” e consistono nel rapportare una parte del fenomeno al fenomeno stesso nella sua totalità (proporzione di maschi in una classe= maschi : (maschi+femmine);

     rapporti di coesistenza: è il rapporto tra due parti ovvero il rapporto tra la frequenza di una modalità e la frequenza di un’altra modalità (indice di vecchiaia= popolazione sopra i 65 anni : popolazione sotto i 15);

     rapporti di derivazione: si tratta di rapporti tra la misura di un fenomeno e quello di un altro che può essere considerato un suo presupposto necessario (laureati : iscritti all’università);

     rapporti medi: si hanno tutte le volte che il fenomeno posto al numeratore si può associare mediamente ad una unità posta al denominatore (numero di posti letto in ospedale : popolazione).

Il calcolo della probabilità interviene in tutte le situazioni in cui i fatti osservabili non sono prevedibili e qualora si debbano prendere decisioni in base a ipotesi riguardanti eventi futuri.

Un esperimento casuale dà luogo a più risultati e quindi a più eventi casuali; un evento casuale può essere: certo, impossibili, possibile. L’insieme dei risultati possibili è detto spazio campionario; due o più eventi sono incompatibili se il verificarsi dell’uno esclude il verificarsi dell’altro mentre si dice complementare l’evento corrispondente al non verificarsi di uno dei due (nel lancio di una moneta la testa è complementare alla croce).

 

Analisi bivariata  

L’analisi bivariata riguarda invece lo studio delle relazioni tra due variabili; dove c’è una relazione tra le variabili significa dire che c’è una relazione concomitante tra i loro valori, una covariazione. Si tratta di relazioni di tipo statistico, ovvero probabilistico.

Nella tavole di contingenza collochiamo in riga una variabile, in colonna l’altra variabile e nelle celle definite dall’incrocio tra le righe e le colonne il numero dei casi che presentano la corrispondente modalità delle due variabili. La tecnica dell’analisi della varianza serve per studiare la relazione tra una variabile nominale ed una cardinale. La regressione serve per studiare le relazioni tra due variabili cardinali; l’insieme dei punti da riportare viene detta “nuvola di punti” e la rappresentazione grafica nel suo complesso si chiama diagramma di dispersione. Data una nuvola di punti possiamo tracciare una retta, la retta di regressione, che unendo i punti sintetizzi la nuvola e ci dice qual è la forma della relazione tra le due  variabili cardinali. Per misurare la forza di una relazione tra due variabili cardinali si utilizza il coefficiente di correlazione (assume il valore di +1 se la relazione è positiva, -1 se la relazione è negativa e 0 se l relazione è assente).

 

Analisi multivariata

              E’ lo studio delle relazioni intercorrenti tra più di due variabili. Nell’analisi multivariata il ricercatore prende in esame un determinato numero di gruppi di variabili (cluster analisys) che descrivono aspetti simili e dissimili. Per le tecniche di clustering si fa riferimento a metodi scissori o aggregativi o metodi gerarchici o non gerarchici.  

 

 

 

 

© www.villaggiomondiale.it - Webmaster: Amedeo Lomonaco