miércoles, 26 de marzo de 2008

ESTADISTICA

¿Que es Estadistica?
Cuando se habla de estadística, se piensa en una relación de datos numéricos presentada de forma ordenada y sistemática. Esta idea es la consecuencia del concepto popular que existe sobre el término y que cada vez está más extendido debido a la influencia de nuestro entorno, ya que hoy día es casi imposible que cualquier medio de difusión, periódico, radio, televisión, etc, no nos aborde diariamente con cualquier tipo de información estadística sobre accidentes de tráfico, índices de crecimiento de población, turismo, tendencias políticas, etc

Es una ciencia que sirve para cuantificar numericamente datos sobre un fonomeno que deseamos estudiar.

¿En donde se utiliza la estadistica?

La estadistica se puede aplicar en una variedad de ciencias. Siempre que se necesite procesar una serie de datos de una investigación específica para conocer lo que éstos signifiquen se debe utilizar un procedimiento estadístico.para obtener datos cuantificables sobre una población u otros casos.


Variable

Una variable es un elemento de una fórmula, proposición o algoritmo que puede adquirir o ser sustituido por un valor cualquiera. Los valores que una variable es capaz de recibir, pueden estar definidos dentro de un rango.


DIVISION DE LA VARIABLE

Variables cualitativas
Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser ordinales y nominales. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir:
Variable cualitativa ordinal: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo, leve, moderado, grave
Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores o el lugar de residencia.

Cuantitativas
Son las variables que se expresan mediante cantidades numéricas. Las variables cuas además pueden ser:

Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Un ejemplo es el número de hijos.

Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo el peso o la altura, que solamente limitado por la precisión del aparato medidor, en teoría permiten que siempre existe un valor entre dos cualesquiera.

EL DIAGRAMA DE TALLO Y HOJA

Es una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes. El o los dígitos principales forman el tallo y los dígitos secundarios las hojas. Los tallos están colocados a lo largo del eje vertical, y las hojas de cada observación a lo largo del eje horizontal.

Comentario: esta grafica nos sirve para describir un grupo de datos el cual esta dividido por 1ero los números principales que forman el tallo y 2do y los números secundarios que forman las hojas

Notación sumatoria

Se representa por la letra griega "sigma" y la utilizas para abreviar una suma que es demasiado larga.

Por ejemplo:

1+2+3+4+5+6+7+8+9+10+11+12+13+14+15+16+17
:
La Moda

A veces es importante conocer cuál es el valor que más prevalece en el conjunto de datos. El valor que ocurre con más frecuencia se le conoce como moda. La moda es la medida de tendencia central especialmente útil para describir mediciones de tipo ordinal, de intervalos y nominales.

A menudo necesitamos un solo número para representar una serie de datos. Este único número puede ser considerado como típico de todos los datos. La palabra promedio es usada frecuentemente en nuestro lenguaje diario, normalmente nos referimos a la media aritmética, pero podría referirse a cualquiera de los promedios. Un término más preciso que promedio es una medida de tendencia central.. La Moda (Mo.):

A veces es importante conocer cuál es el valor que más prevalece en el conjunto de datos. El valor que ocurre con más frecuencia se le conoce como moda..

En un conjunto de números la moda se define como el valor ó número

Comentario:La moda es la medida de tendencia central especialmente útil para describir mediciones de tipo ordinal, de intervalos y nominal

DIAGRAMA DE CAJAS Y BIGOTES (Box and Whisker Plot)

Presentación visual que describe al mismo tiempo varias características importantes de un conjunto de datos, tales como el centro, la dispersión, el alejamiento de la simetría, y la identificación de valores extremos (puntos atípicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos.

Comentario: Presenta los tres cuartiles, alineados sobre una caja vertical u horizontalmente.

La Mediana

Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeños, la media aritmética no es representativa. El valor central en tales problemas puede ser mejor descrito usando una medida de tendencia central llamada mediana., y denotada por X0.5

La mediana es una medida de posición y se define como la posición central en el arreglo ordenado de la siguiente manera:

Dado un conjunto de números agrupados en orden creciente de magnitud, la mediana es el número colocado en el centro del arreglo, de tal forma que una mitad de las observaciones está por encima y la otra por debajo de dicho valor. Si el número de observaciones es par, la mediana es la media de los dos valores que se hallan en el medio del arreglo, de donde se concluye en la siguiente definición:

Comentario: Es el punto medio de los valores de una serie de datos después de haber sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como posteriores en el arreglo de datos

La Media Armónica:

La Media Armónica, la representaremos como , es la inversa de la media aritmética de las inversas de los valores de la variable, responde a la siguiente definición:

Si se tiene un conjunto de observaciones tales como: X1, X2, … . Xn; la media armónica, denotada por a, se define como el reciproco de la suma de los valores inversos de la variable estadística divididos entre el número total de datos.

Comentario: Se utiliza para promediar velocidades, tiempos, rendimiento, etc..

La media cuadrática

Es igual a la raíz cuadrada de la suma de los cuadrados de los valores dividida entre el número de datos:

Esta media como medida de asociación tiene aplicaciones tanto en ciencias biológicas como en medicina.

A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo, en los errores de medida. En tal caso se puede estar interesado en obtener un promedio que no recoja los efectos del signo. Este problema se resuelve, mediante la denominada media cuadrática. Consiste en elevar al cuadrado todas las observaciones (así los signos negativos desaparecen), en obtener después su media aritmética y en extraer, finalmente, la raíz cuadrada de dicha media para volver a la unidad de medida original.

La Media Geométrica

Se define como la raíz de índice de la frecuencia total cuyo radicando es el producto de las potencias de cada valor de la variable elevado a sus respectivas frecuencias absolutas, se denota por g; suele utilizarse cuando los valores de la variable siguen una progresión geométrica. También para promediar porcentajes, tasas, nº índices, etc. siempre que nos vengan dados en porcentajes y se calcula mediante la siguiente fórmula

Fórmula que algunas veces es conveniente expresarla en forma logarítmica. El logaritmo de la media geométrica es la media aritmética de los logaritmos de los valores de la variable. El problema se presenta cuando algún valor es 0 ó negativo y exponente de la raíz par ya que no exista raíz par de un número negativo.

Desviación media

La desviación media es la media de las diferencias en valor absoluto de los valores a la media.

Este valor estadístico no es de mucha utilidad en estadística debido a que no es fácil manipular dicha función al no ser derivable.

Siendo más formales, la desviación media debería llamarse desviación absoluta respecto a la media, para evitar confusiones con otra medida de dispersión, la desviación absoluta respecto a la mediana, DM, cuya fórmula es la misma, sustituyendo la media aritmética  \overline{x} por la mediana M. Pero tal precisión no es relevante, porque la desviación absoluta respecto a la mediana es de uso todavía menos frecuente.

Desviación estándar

La desviación estándar (o desviación típica) es una medida de dispersión para variables de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva. Es una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable.

Comentario: la desviación estándar es una medida que nos sirve para saber a que distancia se encuentran unos de otros.

MEDIDAS DE POSICION

Cuartiles, deciles y centiles

Un conjunto de puntajes o mediciones puede dividirse en un cierto número de partes iguales mediante la selección de valores que correspondan a una posición determinada en dicho conjunto. Por ejemplo, la mediana divide a un conjunto de valores dados en dos partes iguales, y su posición es, en consecuencia, a la mitad del mismo. De manera que 50% de los puntajes quedan a uno u otro lado valor estadístico.

En general, se llaman cuartiles a estos valores con posición divisora determinada.

Comentario: Las medidas de posición (cuarteles, deciles y percentiles) nos sirven para encontrar la posición de un dato.

RANGO SEMIINTERCUARTÍLICO O DESVIACIÓN CUARTÍLICA

De una serie de datos se define por los cuarteles donde el Q1 y Q3 son el primer y tercer cuartil de los datos. El rango intercuartílico Q3 - Q1 se emplea a veces, pero el rango semiintercuartílico es más utilizado como medida de dispersión.

Comentario: El rango semiintercuartilico nos sirve para encontrar una medida que existe de un punto a otro, para ello se utilizan los cuarteles 3 y 1.

Relación empírica entre la media, la mediana y la moda

En distribuciones totalmente simétricas, la media, la mediana y la moda coinciden, localizándose en un mismo valor. En cambio, en distribuciones moderadamente asimétricas, la siguiente relación se mantiene aproximadamente:

Media – Moda = 3(Media – Mediana)

Posiciones relativas de la media, la mediana y la moda para curvas de frecuencias asimétricas a derecha e izquierda respectivamente, para curvas simétricas los tres valores coinciden.