martes, 10 de mayo de 2016

Ejercicio clase: grafica de barras y pastel








¿Qué es un histograma? ¿Es lo mismo que un diagrama de barras?

Parece que no todos tenemos clara cuál es la respuesta. Y si uno empieza a consultar libros de Secundaria, de universidad, Internet... acabamos de liarnos, porque cada uno dice la suya.

Diagrama de barras: idóneo para representar gráficamente los datos de una variable cuantitativa discreta (o cualitativa). Las modalidades de la variable se representan en el eje X y se levanta una barra de altura igual a la frecuencia de cada modalidad.

La elección del eje X para las modalidades y el eje Y para las frecuencias es arbitraria y no es raro ver diagramas con las modalidades en el eje Y.

Histograma: se utiliza para representar gráficamente los datos de una variable continua (o cuantitativa discreta con muchas modalidades), que han sido agrupados en (intervalos de) clases. En un eje (X) representamos las clases, teniendo en cuenta la amplitud de los intervalos, y en el otro eje (Y) levantamos un rectángulo de área igual a la frecuencia de la clase.

Una de las utilidades del histograma es poder ver de qué manera se distribuyen los datos (distribución de la variable). Y como ya hemos dicho, en los histogramas, a diferencia de los diagramas de barras, no es la altura la que determina la frecuencia de cada clase, sino el área del rectángulo. Y esto lo hacen mal en muchos libros de secundaria. Si todos los intervalos tienen la misma amplitud no hay problema, pero si no es así y cogemos una definición de histograma que diga que tenemos que levantar un rectángulo de altura igual a la frecuencia, entonces eso no es un histograma (es una especie de diagrama de barras para variables cuantitativas continuas) y no nos sirve para observar la distribución de la variable.

Pues bien, el diagrama de barras sirve para representar las variables cualitativas ordinales. En el eje horizontal se representan las diferentes categorí­as y sobre él se levantan unas columnas o barras cuya altura es proporcional a la frecuencia de cada categorí­a. También podrí­amos utilizar este tipo de gráfico para representar variables cuantitativas discretas, pero lo que no es correcto hacer es usarlo para las variables cualitativas nominales.
El gran mérito del diagrama de barras es expresar la magnitud de las diferencias entre las categorí­as de la variable. Pero ahí­ está precisamente, su punto débil, ya que son fácilmente manipulables si modificamos los ejes. Como podéis ver en la figura 1, la diferencia entre poco y fumadores ocasionales parece mucho mayor en el primer gráfico, en el que nos hemos comido parte del eje vertical. Por eso hay que tener cuidado al analizar este tipo de gráficos para evitar que nos engañen con el mensaje que el autor del estudio pueda querer transmitir.


Cambiando de tema, el histograma es un gráfico con un significado mucho más profundo. Un histograma representa una distribución de frecuencias que se utiliza (o debe) para representar la frecuencia de las variables cuantitativas continuas. Aquí­ no es la altura, sino el área de la barra lo que es proporcional a la frecuencia de ese intervalo, y está en relación con la probabilidad con la que cada intervalo puede presentarse. Como veis en la figura 2, las columnas, a diferencia del diagrama de barras, están todas juntas y el punto medio es el que da el nombre al intervalo. Los intervalos no tienen por qué ser todos iguales (aunque es lo más habitual), pero siempre tendrán un área mayor aquellos intervalos con mayor frecuencia.

Existe, además, otra diferencia muy importante entre el diagrama de barras y el histograma. En el primero solo se representan los valores de las variables que hemos observado al hacer el estudio. Sin embargo, el histograma va mucho más allá, ya que representa todos los valores posibles que existen dentro de los intervalos, aunque no hayamos observado ninguno de forma directa. Permite así­ calcular la probabilidad de que se represente cualquier valor de la distribución, lo que es de gran importancia si queremos hacer inferencia y estimar valores de la población a partir de los resultados de nuestra muestra.

Tipos de causas 

Causas Asignables
Los cambios en las variables controlables se denominan Causas Asignables de variación del proceso, porque es posible identificarlas. Las fluctuaciones al azar de las variables no controlables se denominan Causas No Asignables de variación del proceso, porque no son pasibles de ser identificadas. Causas Asignables: Son causas que pueden ser identificadas y que conviene descubrir y eliminar, por ejemplo, una falla de la máquina por desgaste de una pieza, un cambio muy notorio en la calidad del plástico, etc. Estas causas provocan que el proceso no funcione como se desea y por lo tanto es necesario eliminar la causa, y retornar el proceso a un funcionamiento correcto.
Causas aleatorias
Un proceso de fabricación es una suma compleja de eventos grandes y pequeños. Hay una gran cantidad de variables que sería imposible o muy difícil controlar. Estas se denominan variables no controlables. Por ejemplo, pequeñas variaciones de calidad del plástico, pequeños cambios en la velocidad del pistón, ligeras fluctuaciones de la corriente eléctrica que alimenta la máquina, etc.

Los efectos que producen las variables no controlables son aleatorios. Además, la contribución de cada una de dichas variables a la variabilidad total es cuantitativamente pequeña. Son las variables no controlables las responsables de la variabilidad de las características de calidad del producto.

¿En un histograma las gráficas deben de ir juntas o separadas?
En el histograma las barras están juntas, y pueden tener diferente ancho,  ya que nos permiten observar mejor los datos, mas sin embargo se necesitan para apreciar mejor donde es que pasa nuestra línea, mas sin embargo no se sabe bien del todo.

¿En una gráfica de barras las gráficas deben de ir juntas o separadas?
A diferencia del diagrama de barras en el que están separadas y la única diferencia es su altura. Ya que cada una de las barras representa un valor entero por lo general, en cambio el histograma está compuesto por datos con más particiones decimales y/o por porcentaje, mas sin embargo no está bien establecido que afecte en algo.