Come Calcolare la Covarianza

Scritto in collaborazione con: Lo Staff di wikiHow

La covarianza è un termine statistico che aiuta a comprendere la correlazione fra due serie di dati. Ad esempio, supponiamo che gli antropologi stiano studiando l'altezza e il peso di una determinata popolazione; per ogni individuo preso in esame, i valori relativi all'altezza e al peso vengono espressi come coppia di dati (x;y). Questi numeri possono essere inseriti in una formula standard per calcolare la loro relazione di covarianza. Questo articolo descrive innanzitutto il processo matematico per giungere a tale valore e in seguito affronta due metodi automatici per ottenere il risultato.

Parte 1 di 4:
Calcolare la Covarianza a Mano usando la Formula Standard

  1. 1
    Impara la formula standard e le sue componenti. L'equazione per il calcolo della covarianza è: ; per poterla utilizzare devi conoscere il significato delle variabili e dei simboli:[1]
    • : questo simbolo è la lettera greca "sigma" che in matematica rappresenta la sommatoria di tutte le variabili che seguono. Nella formula della covarianza, il simbolo Σ indica che devi calcolare i valori che si trovano al numeratore della frazione e sommarli fra loro prima di dividerli per il denominatore.[2]
    • : questa variabile si legge "x di i", il pedice è un contatore e significa che devi eseguire i calcoli considerando ogni valore di x presente nella serie di dati.
    • : l'abbreviazione "avg" indica il valore medio di tutti i dati "x"; a volte, la media viene indicata con la lettera x con un trattino orizzontale sopra di essa. Il simbolo si legge "valore medio di x".
    • : in questo caso, devi leggere "y di i" e il pedice rappresenta un contatore che indica che devi eseguire i calcoli considerando ogni valore di y presente nella serie di dati.
    • : l'abbreviazione "avg" indica il valore medio di tutti i dati "y"; a volte, la media viene indicata con la lettera y con un trattino orizzontale sopra di essa. Il simbolo si legge "valore medio di y".
    • : rappresenta il numero di dati presenti nell'insieme. Ricorda che per risolvere un problema relativo alla covarianza devi considerare gli elementi statistici come una coppia di valori (x;y). Il valore di n è pari al numero di coppie e non a quello dei singoli dati.
  2. 2
    Organizza una tabella di dati. Prima di procedere con i calcoli, vale la pena riunire tutti i valori. Dovresti tracciare una tabella composta da cinque colonne etichettando ciascuna secondo questi criteri:
    • : completa questa colonna con tutti i valori "x" dell'insieme;
    • : annota tutti i valori di "y" della serie in questa colonna. Fai attenzione ad accoppiare correttamente ogni valore di y con quello x corrispondente. Nei problemi che riguardano la covarianza, l'ordine e le coppie dei dati sono importanti;
    • : lascia questa colonna in bianco, in seguito vi scriverai la media dei valori di x;
    • : all'inizio non scrivere nulla, la completerai in seguito con la media dei valori di y;
    • : per il momento non devi scrivere nulla, la completerai durante il procedimento.
  3. 3
    Calcola il valore medio di x. L'insieme descritto in seguito è composto da nove numeri; per trovare il dato medio devi sommarli e dividere il risultato per 9. Questo significa che: 1+3+2+5+8+7+12+2+4=44. Dividi la somma per 9 e ottieni il valore medio pari a 4,89. Questo è il dato medio per x che utilizzi al posto della variabile x(avg) durante i prossimi calcoli.[3]
  4. 4
    Calcola il valore medio di y. Procedi in maniera simile. La colonna corrispondente ai dati di y è composta da nove numeri accoppiati con quelli di x; trova la media di questi dati. Per l'esempio considerato procedi con: 8+6+9+4+3+3+2+7+7=49. Dividi la somma per 9 e ottieni 5,44. Questo è il valore medio che utilizzi al posto della variabile y(avg) nei prossimi calcoli.[4]
  5. 5
    Trova i valori per . Per ogni dato x elencato nella colonna corrispondente devi trovare la differenza con il valore medio. Si tratta di un calcolo semplice, devi cioè sottrarre 4,89 da ogni valore di x presente nell'insieme. Se il valore è inferiore al dato medio, ottieni un numero negativo; se invece è maggiore, ottieni un numero positivo. Fai attenzione a non dimenticare i segni.[5]
    • Per esempio, il primo valore presente nella colonna x è 1. Inseriscilo nella prima riga della colonna e ottieni quindi 1-4,89= -3,89.
    • Ripeti la procedura per ogni dato di x. Di conseguenza, la seconda riga è 3-4,89 = -1,89. La terza riga è 2-4,89, cioè -2,89. Continua in questo modo per tutti i valori di x, i nove numeri che ottieni dovrebbero essere: -3,89; -1,89; -2,89, 0,11; 3,11; 2,11; 7,11; -2,89; -0,89.
  6. 6
    Calcola i valori per . In questa colonna devi riportare i risultati di una sottrazione simile, usando tutti i valori di y e il dato medio y(avg). Se il valore iniziale è inferiore alla media, ottieni un risultato negativo; in caso contrario, il risultato è positivo. Fai attenzione a non tralasciare i segni.[6]
    • Quindi, per la prima riga i calcoli sono: 8-5,44=2,56.
    • La seconda riga è: 6-5,44=0,56.
    • Continua a svolgere le sottrazioni fino alla fine dell'elenco di numeri. Al termine, le nove differenze che hai trovato dovrebbero essere: 2,56; 0,56; 3,56; -1,44; -2,44; -2,44; -3,44; 1,56; 1,56.
  7. 7
    Calcola il prodotto per ogni riga di dati. Riempi le caselle dell'ultima colonna moltiplicando i numeri che hai scritto nelle due precedenti e che sono etichettate come e . Fai attenzione a lavorare riga per riga, moltiplicando due numeri corrispondenti alle coppie di dati; non dimenticare i segni negativi mentre procedi.[7]
    • Nella prima riga, nella colonna relativa a , hai scritto il numero -3,89, mentre nella colonna hai riportato 2,56. Il prodotto di tali numeri è -3,89*2,56=-9,96.
    • Lungo la seconda riga, moltiplica i due numeri: -1,88*0,56=-1,06.
    • Continua in questo modo, riga per riga, finché non hai esaurito tutte le coppie; al termine, i nove numeri dovrebbero essere: -9,96; -1,06; -10,29; -0,16; -7,59; -5,15; -24,46; -4,51; -1,39.
  8. 8
    Somma fra loro i dati elencati nell'ultima colonna. Questa è la fase in cui il simbolo Σ "entra in azione". Una volta svolti tutti i calcoli, devi sommare i risultati. Per il semplice insieme di dati considerato come esempio, dovresti ottenere nove numeri nella colonna finale, sommali facendo attenzione ai simboli negativi.
    • In questo caso, il valore finale è -64,57. Scrivilo nella casella alla base della colonna; questo dato è il numero che devi scrivere al numeratore nella formula standard della covarianza.
  9. 9
    Calcola il denominatore dell'equazione. In realtà, questo valore è già stato trovato durante il procedimento descritto in precedenza; è rappresentato infatti da (n-1), cioè dal numero di coppie di valori meno 1.
    • Nell'esempio finora considerato ci sono 9 coppie di dati, quindi n=9; di conseguenza n-1=8.
  10. 10
    Dividi il numeratore per il denominatore. La fase finale del procedimento per il calcolo della covarianza è dividere il numeratore – – per il denominatore, cioè . Il quoziente è la covarianza dell'insieme dei dati.[8]
    • Considerando sempre l'esempio precedente, l'operazione è: -64,75/8=-8,07.
    Pubblicità

Parte 2 di 4:
Usare un Foglio di Calcolo Excel per Calcolare la Covarianza

  1. 1
    Prendi nota dei calcoli che si ripetono. Quello della covarianza è un procedimento matematico che dovresti svolgere a mano per alcune volte, in modo da comprendere il significato del risultato; tuttavia, se usi costantemente questo strumento statistico per interpretare i dati, è utile trovare un metodo più veloce e automatico per ottenere i risultati. Dovresti esserti accorto che per la serie di dati relativamente piccola che è stata considerata fino ad ora, hai dovuto trovare due valori medi, eseguire otto sottrazioni singole, nove moltiplicazioni separate, un'addizione e una divisione finali. Si tratta di 31 calcoli elementari necessari per ottenere un dato; lungo il percorso, potresti rischiare di dimenticare dei segni negativi o di copiare erroneamente dei numeri, alterando quindi il risultato.
  2. 2
    Crea un foglio di calcolo per trovare la covarianza. Se sei in grado di usare il programma Excel (o un altro foglio di calcolo con le stesse potenzialità), puoi impostare facilmente una tabella. Etichetta le cinque colonne come faresti per i calcoli a mano: x, y, (x(i)-x(avg)), (y(i)-y(avg)) e prodotto.[9]
    • Per semplificare la nomenclatura, puoi etichettare la terza colonna come "differenza di x" e la quarta come "differenza di y", fintanto che ricordi il significato dei dati.
    • Se inizi a tracciare la tabella nell'angolo in alto a sinistra del foglio di calcolo, la cella A1 contiene l'etichetta "x", le altre vanno di conseguenza fino alla cella E1.
  3. 3
    Trascrivi le serie numeriche. Digita i valori di x e y nelle colonne opportune; ricorda che l'ordine dei punti è importante e che devi accoppiare ogni valore di y al corrispondente x.[10]
    • L'elenco dei valori di x inizia nella cella A2 e continua verso il basso per tutte le caselle necessarie.
    • L'elenco dei valori di y inizia nella cella B2 e continua verso il basso per tutte le caselle necessarie.
  4. 4
    Trova la media di x e y. Il programma Excel è in grado di calcolare il valore medio molto rapidamente. Nella prima cella vuota di ciascuna colonna di dati, digita la formula =MEDIA(A2:A___). Nello spazio bianco digita il numero corrispondente alla cella occupata dall'ultimo dato.[11]
    • Per esempio, se l'elenco è composto da 100 valori, questi occupano le celle da A2 fino a A101, quindi la formula è: =MEDIA(A2:A101).
    • Per l'elenco di dati y, la formula è =MEDIA(B2:B101).
    • Ricorda che devi iniziare a scrivere la formula con un segno di uguaglianza (=).
  5. 5
    Digita la formula per la colonna (x(i)-x(avg)). Nella cella C2, devi inserire la funzione che ti permette di calcolare la prima sottrazione che è: =A2-____. Nello spazio bianco devi riportare la cella che contiene il valore medio di x.[12]
    • Nell'esempio di 100 dati, la media si trova nella casella A102, quindi la formula è: =A2-A102.
  6. 6
    Ripeti la stessa funzione per la colonna (y(i)-y(avg)). Seguendo l'esempio precedente, devi inserire la formula nella cella D2 come =B2-B102.[13]
  7. 7
    Inserisci la formula per la colonna del prodotto. Nella casella E2 della quinta colonna devi digitare la formula che permette di calcolare il prodotto delle due celle precedenti; in questo caso ti basta scrivere: =C2*D2.[14]
  8. 8
    Copia le varie funzioni nelle celle sottostanti di ogni colonna. Finora hai programmato i calcoli solo per la prima coppia numerica che occupa la riga 2. Usando il mouse, evidenzia le celle C2, D2 e E2; in seguito, porta il cursore sul piccolo quadrato che si trova nell'angolo in basso a destra finché non diventa un segno "+". Clicca con il tasto sinistro del mouse e trascina il cursore verso il basso per espandere le caselle evidenziate all'intera tabella. Questa azione copia automaticamente le tre formule presenti in C2, D2 e E2 nelle celle sottostanti. Dovresti notare che i calcoli vengono eseguiti automaticamente riempiendo la tabella di numeri.[15]
  9. 9
    Imposta la somma per l'ultima colonna. Devi calcolare la somma di tutti i valori presenti nella colonna "prodotto". Nella prima cella vuota sotto l'elenco di valori, digita la formula =SOMMA(E2:E___) e riempi lo spazio bianco con il numero della cella che contiene l'ultimo dato dell'elenco.[16]
    • Per l'esempio della serie di 100 dati, la formula deve essere scritta nella cella E102 secondo questa sintassi: =SOMMA(E2:E101).
  10. 10
    Trova la covarianza. Il foglio di calcolo ti permette di svolgere l'ultima operazione. L'ultimo numero trovato, che nell'esempio precedente si trova in E102, rappresenta il numeratore della formula della covarianza; puoi digitare la funzione subito sotto questa cella: =E102/___ scrivendo al posto dello spazio bianco il numero dei dati in tuo possesso meno 1. Nell'esempio considerato finora i dati sono 100, devi quindi digitare 99; il quoziente ottenuto è il valore della covarianza.[17]
    Pubblicità

Parte 3 di 4:
Usare un Calcolatore Online

  1. 1
    Fai una ricerca online per trovare dei calcolatori di covarianza. Diverse scuole, aziende di programmazione o altre fonti hanno creato delle pagine web che permettono di calcolare facilmente i dati della covarianza; puoi usare qualsiasi motore di ricerca digitando le parole chiave "calcolatore di covarianza".
  2. 2
    Inserisci i dati. Leggi attentamente le istruzioni del sito per digitare correttamente le serie numeriche. È importante che le coppie di dati siano ordinate, altrimenti ottieni risultati sbagliati. Le diverse pagine online prevedono dei metodi differenti di inserimento dei dati.
    • Ad esempio, questo sito propone una casella orizzontale per i valori di "x" e una seconda casella orizzontale per quelli di "y". Le istruzioni (in lingua inglese) indicano che devi digitare i due termini separati solo da una virgola; di conseguenza, i valori "x" considerati nella prima parte dell'articolo dovrebbero essere digitati in questo modo: 1,3,2,5,8,7,12,2,4, mentre la serie di valori "y" dovrebbe avere questo aspetto: 8,6,9,4,3,3,2,7,7.
    • Quest'altro sito web, sempre in lingua inglese, richiede di inserire la serie dei valori "x" nella prima casella, rispettando un andamento verticale e scrivendo un numero in ciascuna riga; di conseguenza, l'insieme dei valori "x" ha questo aspetto:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. 3
    Calcola i risultati. L'aspetto interessante di queste pagine è che, dopo aver digitato i dati, devi solo cliccare sul tasto "Calcola" per ottenere immediatamente il valore della covarianza; la maggior parte dei calcolatori online fornisce anche i risultati intermedi per la media di x, di y e il valore di n.
    Pubblicità

Parte 4 di 4:
Interpretare i Risultati della Covarianza

  1. 1
    Cerca una relazione positiva o negativa. La covarianza è uno strumento statistico che rappresenta la relazione fra due insiemi di dati. Nell'esempio citato nell'introduzione, si prendono in esame l'altezza e il peso di una popolazione; ti aspetteresti che, man mano che l'altezza aumenta, cresca anche il peso, il che significa che c'è un rapporto di covarianza positivo. Un altro esempio è l'insieme del numero di ore in cui un individuo si allena a golf e i punteggi che ottiene; in questo caso, dovresti aspettarti una covarianza negativa, perché man mano che la persona si allena, il suo Gara_Stroke_Play score dovrebbe diminuire (nel gioco del golf vince il giocatore con il punteggio inferiore).[18]
    • Considera il campione di dati descritto in precedenza. La covarianza finale è -8,07, ossia un numero negativo, il che significa che all'aumentare di x, y decresce. Puoi verificare che questo fenomeno è vero osservando alcune coppie di dati; per esempio, per i valori 1 e 2 di x si hanno, rispettivamente, dei valori di 7, 8 e 9. I valori di x pari a 8 e 12 sono accoppiati, rispettivamente, con y=3 e -y=2.
  2. 2
    Interpreta il significato del valore assoluto della covarianza. Se il numero è grande, sia esso positivo o negativo, significa che le due serie numeriche sono fortemente correlate fra loro in maniera sia positiva sia negativa.[19]
    • Nell'esempio considerato, la covarianza è pari a -8,07 che è un valore abbastanza grande. I dati sono compresi in un intervallo fra 1 e 12, quindi 8 rappresenta un numero piuttosto elevato; questo significa che ogni coppia numerica è legata da una forte correlazione.
  3. 3
    Comprendi l'assenza di relazione. Se trovi un valore di covarianza pari o vicino a 0, puoi giungere alla conclusione che le coppie di dati sono praticamente indipendenti; in questo caso, aumentare o diminuire un valore non comporta la variazione dell'altro: i due termini sono accoppiati in maniera casuale.[20]
    • Per esempio, supponi di confrontare le misure delle scarpe con i voti di laurea. Dato che ci sono moltissimi fattori che influiscono sul voto finale di uno studente universitario, dovresti aspettarti una covarianza prossima allo zero; questo significa che non c'è alcuna relazione fra i due insiemi.
  4. 4
    Osserva la relazione da un punto di vista grafico. Per comprendere la covarianza visivamente, puoi riportare le coppie di valori su un sistema cartesiano; così facendo, è abbastanza semplice rendersi conto che, sebbene non formino una perfetta linea retta, i vari punti si distribuiscono lungo una diagonale approssimativa che va dall'angolo in alto a sinistra a quello in basso a destra; questa è la descrizione del grafico di una covarianza negativa. Inoltre, il valore della covarianza è -8,07 che, se confrontato con i dati degli insiemi, è un numero piuttosto grande; questo suggerisce che il rapporto fra le due serie numeriche è abbastanza stretto e lo si può notare dall'aspetto lineare della distribuzione dei punti.
    • Per ripassare come inserire le coppie di valori in un grafico cartesiano, leggi questo articolo.
    Pubblicità

Avvertenze

  • La covarianza ha un'applicazione limitata in statistica; il suo calcolo è spesso un passaggio intermedio per trovare gli indici di correlazione o altri termini. Fai attenzione a non trarre delle conclusioni basandoti troppo su questo dato.
Pubblicità

Informazioni su questo wikiHow

Scritto in collaborazione con:
Redazione di wikiHow
Questo articolo è stato scritto in collaborazione con il nostro team di editor e ricercatori esperti che ne hanno approvato accuratezza ed esaustività.
Categorie: Matematica
Questa pagina è stata letta 50 479 volte.

Hai trovato utile questo articolo?

Pubblicità