La Mediana e le Misure di Posizione


Perché la Mediana Minimizza la Somma delle Deviazioni Assolute

La mediana è una misura di posizione che rappresenta il valore centrale di un insieme di dati ordinati. Formalmente, data una serie di osservazioni \( x_1, x_2, \dots, x_n \), la mediana è il valore \( c \) che minimizza la somma delle deviazioni assolute:

\( S(c) = \sum_{i=1}^{n} |x_i - c| \)

Dimostrazione Semplice

Supponiamo di voler trovare il valore di \( c \) che minimizza \( S(c) \). Consideriamo i dati ordinati in ordine crescente:

\( x_{(1)} \leq x_{(2)} \leq \dots \leq x_{(n)} \)

La funzione \( S(c) \) è una funzione convessa rispetto a \( c \) e presenta un minimo quando \( c \) è uguale alla mediana dei dati. Per dimostrarlo, osserviamo che:

Questo significa che il punto di minimo di \( S(c) \) si trova proprio in corrispondenza della mediana.

Dimostrazione Formale

Consideriamo la derivata della funzione obiettivo \( S(c) \):

\( \dfrac{dS}{dc} = \sum_{i=1}^{n} \dfrac{d}{dc} |x_i - c| \)

Poiché la derivata di \( |x_i - c| \) rispetto a \( c \) è:

\( \dfrac{d}{dc} |x_i - c| = \begin{cases} -1 & \text{se } c < x_i \\ 0 & \text{se } c = x_i \\ 1 & \text{se } c > x_i \end{cases} \)

La derivata totale diventa:

\( \dfrac{dS}{dc} = \sum_{x_i < c} (-1) + \sum_{x_i = c} (0) + \sum_{x_i > c} (1) = (-n_1) + n_2 \)

Dove \( n_1 \) è il numero di osservazioni minori di \( c \) e \( n_2 \) è il numero di osservazioni maggiori di \( c \). Il minimo di \( S(c) \) si verifica quando la derivata cambia segno, cioè quando \( n_1 = n_2 \), ovvero quando \( c \) è la mediana.

Diverse Definizioni di Misure di Posizione

Le misure di posizione, o di tendenza centrale, sono statistiche che riassumono un insieme di dati identificando un valore centrale attorno al quale i dati sono distribuiti. Esistono diverse misure di posizione, ciascuna con le proprie caratteristiche e applicazioni.

Misure di Posizione Comuni

Generalizzazioni e Infinite Altre Definizioni

Le misure di posizione possono essere generalizzate attraverso varie metodologie, portando a un numero infinito di possibili definizioni. Alcuni esempi includono:

Queste generalizzazioni mostrano come, variando le formule o introducendo nuovi parametri, possiamo definire infinite altre misure di posizione per adattarci a diverse esigenze analitiche.

Conclusione

La scelta della misura di posizione più appropriata dipende dalla natura dei dati e dagli obiettivi dell'analisi. Comprendere le diverse opzioni e le loro proprietà permette di sintetizzare le informazioni in modo efficace e significativo.




Approfondisci con una Simulazione

Clicca qui per Avviare una Simulazione