Guia de Excel - CiberEsquina - Universidad Nacional Abierta

16 downloads 489 Views 5MB Size Report
herramientas, para el tratamiento adecuado y efectivo de datos estadísticos. ... Aplicada, nos han motivado para realizar estas breves notas referidas a la hoja ...
UNIVERSIDAD NACIONAL ABIERTA VICERECTORADO ACADÉMICO ÁREA DE MATEMÁTICA

ELEMENTOS DE EXCEL PARA LA ESTADÍSTICA

Prof. Gilberto Noguera

Caracas, 07 de marzo de 2007

Introducción

En la actualidad existe software específico, de variada calidad, desarrolladores, precio y herramientas, para el tratamiento adecuado y efectivo de datos estadísticos. Sin embargo una serie de factores que no viene al caso mencionar, así como la inquietud de nuestros participantes en los cursos correspondientes a las asignaturas Inferencia Estadística, Estadística General y Estadística Aplicada, nos han motivado para realizar estas breves notas referidas a la hoja de cálculo Excel proporcionada con el software Microsoft Office. Estas páginas no pretenden constituirse en un manual sobre el uso y potencialidad de Excel, sólo orientaran en los aspectos básicos para el manejo estadístico de datos. Se recomienda, al lector de estas notas, que al finalizar la lectura de las mismas proceda a estudiar con la ayuda proporcionada por Microsoft Excel las características y uso de las funciones correspondientes a las utilidades Insertar funciones y Análisis de datos. La información suministrada, por las ayudas, respecto a una función en particular se puede imprimir y de esta forma tener una guía más detallada de rápida consulta. Se utilizó la versión Microsoft 2003 y el sistema

operativo Xp. Si embargo, las

directrices referidas a Excel son validas para Windows 98 o superior. En esta versión, siguiendo las sugerencias de los estudiantes UNA del curso 746, sólo agregamos una parte referida al uso de la utilidad Regresión de la herramienta Análisis de Datos de Excel, aspecto que no se había tratado en la versión publicada en el 2006.

2

PARTE I 1. Verificación de instalación de Excel. El primer paso es verificar que esta instalado en la máquina el Excel, para ello hacemos una revisión del escritorio para ver si existe un acceso directo a este programa, de ser así debe aparecer el icono señalado con una flecha en la figura 1. Fig. 1

De no ser esta la situación, procedemos a buscar, haciendo clic en inicio como se ilustra en la figura 2. Fig. 2

Se abre un cuadro (menú de inicio), puede suceder que el icono de Excel esté anclado en el menú de inicio como se muestra en la figura 3.

3

Fig. 3

Si el icono de acceso directo a Excel no está anclado en el menú de inicio, debemos buscar este programa en el computador. Esta búsqueda se puede hacer de varias maneras: activando el motor de búsqueda representado en el menú de inicio con el icono lupa (ver figura 3), revisando el disco duro, etc. La forma más sencilla de hacer la búsqueda es desplegar todos los programas colocando el puntero del ratón en todo los programas o programas en el menú de inicio, luego desplazar el puntero hasta Microsoft Office y revisar si se encuentra el icono de Excel, Fig. 4

Nota: La forma en que aparece la primera pantalla, al encender el computador, recibe el nombre de escritorio. La presentación puede variar según la configuración definida por el usuario.

4

Si en el cuadro desplegado de programas no se encuentra el icono de Excel, lo más probable es que no esté instalado el programa. En este caso es necesario instalar el Excel, si la máquina es personal y no tiene experiencia en la instalación solicite ayuda. Si la computadora es propiedad de un Cyber pida al encargado(a) del mismo que instale el Excel, si la computadora está instalada en el Centro Local o Unidad de Apoyo, solicite con toda confianza al encargado de informática la instalación del software y la orientación que considere necesaria. 2. Revisión de los componentes necesarios para el tratamiento de datos estadísticos. Una vez comprobada la instalación del Excel, debemos revisar si los componentes que facilitan el tratamiento estadístico de datos están habilitados, para ello abrimos la hoja de cálculo de Excel, debe aparecer una interfaz como la que se muestra en la figura 5. Fig. 5

Si en la pantalla aparece la hoja de cálculo, mostrada en la figura 5, el Excel se ha instalado correctamente. Sin embargo, debemos asegurarnos que la instalación ha sido completa, para poder hacer uso de todas las herramientas de Excel, en particular las referidas a estadísticas. Haciendo clic en insertar, ubicado en la barra de herramientas, se debe desplegar un menú como el mostrado en la figura 6.

5

Fig.6

Ahora haciendo clic en función, debe mostrarse un cuadro de dialogo llamado insertar función (Fig. 7). Este cuadro de dialogo le permite: •

Si conoce el nombre de la función, buscar con el motor escribiendo en el cuadro

correspondiente el nombre de la función que desea usar, y luego haciendo clic en ir. •

Seleccionar la categoría de las funciones en que está interesado, en nuestro caso, estadísticas.

Para seleccionar estadísticas debe hacer clic en la flecha de despliegue, indicada como 1 en la figura 7, ubicar, usando la barra de deslizamiento, estadísticas y hacer clic en esta última. Así aparecerá un cuadro de selección de las diferentes funciones estadísticas que posee Excel, en la figura 7 se indica con el número 2. Al seleccionar una función, se te informa de manera breve, sobre los argumentos de entrada requeridos por la función así como la salida que produce, en la figura 7 indicamos este hecho con el número 3. Fig. 7

1 2 4

3

6



Si considera insuficiente la información sobre la función presentada en el cuadro de dialogo

insertar función, puede solicitar ayuda haciendo clic en ayuda sobre esta función señalado en la figura 7 con el número 4, en este caso se abrirá un cuadro informativo al lado derecho de la hoja de cálculo como se muestra en la figura 8. Este cuadro informativo llamado Ayuda de Microsoft Excel, te proporciona información detallada de la función que deseas utilizar, así como un ejemplo de su uso. Esta información se puede imprimir haciendo clic en el icono que representa una impresora, indicado en la figura 8 con el número 1. Se recomienda hacer el ejemplo para ver como funciona en la práctica. Fig. 8

1

Otra herramienta de interés para los estudios estadísticos que proporciona Excel es el componente para el análisis de datos. Si la instalación de Excel ha sido completa se puede habilitar este componente, para ello, primero haga clic en herramientas ubicado en la barra de herramientas de Excel, como se muestra en figura 9, para desplegar las utilidades disponibles. Fig. 9

7

Ahora haciendo clic en complementos aparecerá la siguiente interfaz, Fig. 10

Seleccione herramientas para análisis como se muestra en la figura 11, y haga clic en aceptar. Fig. 11

Si este componente se ha habilitado correctamente, al hacer clic en herramientas el componente debe aparecer en el listado de herramientas como lo muestra la figura 12, e indicado con una flecha. Fig. 12

8

Una poderosa herramienta para la transformación de variables lo constituyen los macros, que son funciones programadas en Visual Basic. Para revisar si esta herramienta está a nuestra disposición, hacemos clic en herramientas ubicada en la barra de herramientas, localizamos Macro y colocando el puntero en esta etiqueta se desplegará un cuadro con información sobre las tareas permitidas, tal como se muestra en la figura 13. Fig. 13

Para terminar la revisión y puesta a punto de las herramientas y utilidades proporcionadas por Excel para el tratamiento de datos en el área de la estadística, hagamos clic en Editor de Visual Basic o presionemos las teclas Alt + F11 para que aparezca el espacio de trabajo como se muestra en la figura 14. Fig. 14

9

Las versatilidad de esta herramienta de programación es realmente alta, que dominarla en su totalidad requeriría tiempo y esfuerzo, ameritando un curso específico de varias semanas y quizás meses. Nuestras necesidades sólo se limitan a poder insertar en la hoja de cálculo Excel módulos que efectúen de manera rápida y eficiente cálculos sobre la variable o variables que estamos tratando en un trabajo estadístico, y que de hacerlo sólo con las funciones de Excel proporcionadas por insertar funciones implicaría tener que usar varias columnas. Verifiquemos que contamos con esta utilidad, para ello hagamos clic en insertar (ver figura 15) y luego en módulo, si todo esta bien debe aparecer una ventana llamada espacio de trabajo, como se ilustra en la figura 16. Fig. 15

Fig. 16

Si se abre este sitio de trabajo nuestro equipo esta bien, sólo nos resta resaltar la importancia del uso de la ayuda correspondiente a Visual Basic, no olvide que en esta parte estamos programando,

10

al hacer clic en ayuda o teclear F1 se debe desplegar a la derecha el cuadro de Ayuda de Visual Basic en el encontrará toda información requerida para programar en este lenguaje (ver figura 17). Fig. 17

Ahora estamos seguros de contar con todo lo necesario para empezar a realizar los trabajos estadísticos básicos correspondientes a las asignaturas, Inferencia Estadística, Estadística General y Estadística Aplicada. Puede cerrar todas las ventanas confiado(a) de contar, si no sucede algo extraordinario, con un paquete adecuado para satisfacer los requerimientos mínimos exigidos en las asignaturas arriba mencionadas cuyos códigos son 738, 745 y 746 respectivamente.

11

PARTE II En esta parte nos dedicamos, a ilustrar los aspectos básicos de algunas herramientas de Excel. Para ello trabajaremos con la siguiente data constituida por 50 casos, Fig. 18

Variables

Casos u observaciones

Empecemos por la estadística descriptiva referida a la variable edad, hacemos clic en herramientas y de seguido clic en análisis de datos. Seleccionemos Estadística descriptiva, ver figura 19 Fig. 19

Hacemos clic en aceptar para activar el cuadro de dialogo correspondiente a la utilidad Estadística descriptiva.

12

Fig. 20

Colocamos el puntero del ratón, sobre la columna a analizar, en nuestro ejemplo edad, como se puede ver en la figura 20, indicamos que la columna tiene un rotulo en la primera fila y seleccionamos resumen de estadísticas, como se muestra en la siguiente figura. Fig. 21

Al hacer clic en aceptar, por defecto el programa colocará los resultados en una nueva hoja del mismo libro, al menos que indiquemos lo contrario, seleccionando rango de salida e indicando en la ventana correspondiente a partir de que celda se deben colocar los resultados, en muestro caso G1, como se ilustra en la figura 22.

13

Fig. 22

Al hacer clic en aceptar obtenemos, Fig. 23

No entraremos a explicar el significado de cada elemento de los resultados arrojados por Excel, se entiende que el participante ha estudiado la teoría correspondiente, solo indicamos que estos resultados corresponden a los datos no agrupados. En la práctica se trabaja con datos agrupados,

14

aprovechemos para ver como funciona el Visual Basic, calcularemos el tamaño aproximado de los intervalos de clase. Para esto insertemos un módulo tal como se muestra en la figura 24 Fig. 24

Ahora guardemos el módulo y regresemos al área de trabajo de Excel, haciendo clic en archivo y de seguido clic en cerrar y volver a Microsoft Excel. Ahora haremos uso de la función tamint creada anteriormente, para ello seleccionamos la celda donde queremos tener el resultado, G18, figura 25. Fig. 25

15

insertamos la función como se explico en la primera parte, pero seleccionamos Definidas por el usuario como se muestra en la figura 26 Fig. 26

Al hacer clic en aceptar aparecerá un cuadro de dialogo solicitando los argumentos de entrada de la función que se ha llamado (tamint), ver la figura 27, selecciona la celda que contiene el máximo. Fig. 27

16

Luego hacemos clic en la ventana Mi para informar que introduciremos el mínimo, Fig. 28

Por último introducimos el número de observaciones al lado de cuenta en la tabla edad, aceptamos y obtenemos el resultado, ver figuras 29 y 30. Fig. 29

17

Fig. 30

En realidad el uso de Visual Basic se recomienda cuando los cálculos son más complicados o las transformaciones de los datos de una o más variables implican, por el número de operaciones o facilidades de Excel, usar más de una columna para obtener el resultado. Otra forma de obtener el mismo resultado sin usar el Visual Basic es: seleccionar la celda donde quiere dejar el resultado del cálculo, digitar el símbolo = o el símbolo +, y luego escribir la fórmula de manera específica es decir, dando los valores involucrados en el cálculo, ver figura 31, 32 y 33. Fig. 31

18

Fig. 32

Fig. 33

Es claro que el cálculo del tamaño del intervalo de clase debe hacerse una sola vez. Conocido el tamaño del intervalo que asumiremos como 6, procedemos a determinar los límites superiores de

19

cada intervalo, para ello seleccionamos la celda y la columna donde ubicaremos las clases, luego procedemos como ilustran las figuras 34 y 35 Fig. 34

Al presionar enter, se obtiene el límite superior de la primera clase, si dividimos el rango entre el tamaño del intervalo de clase, o simplemente el tamaño de clase, tenemos el número de intervalos o clases necesarios para agrupar los datos, en este ejemplo 42/6=7, así que procedemos a determinar los límites superiores de las clases restantes en este caso 6, ver figura 35. Fig. 35

Ahora podemos obtener la información requerida para hacer un histograma, o un diagrama de torta. Para ello habilitamos la herramienta análisis de datos, figura 36, y seleccionamos histograma.

20

Fig. 36

Al hacer clic donde se indica, aparecerá la siguiente interfaz, ver figura 37 Fig. 37

Seleccionamos la columna que estamos analizando (edad), y luego cerramos (x)

21

Fig. 38

Fig. 39

Hacemos clic dentro de la ventana Rango de clases, y seleccionamos las clases como se muestra en la siguiente figura.

22

Fig. 40

Podíamos haber seleccionado Crear gráfico pero, es nuestra opinión que didácticamente es más conveniente utilizar las herramientas gráficas de Excel. Al aceptar en una hoja nueva tendremos el siguiente resultado. Fig. 41

Editamos los resultados anteriores de manera que su presentación sea la siguiente,

23

Fig. 42

Para obtener la gráfica del histograma procedemos a seleccionar como se puede ver en la siguiente figura, y habilitamos las utilidades gráficas haciendo clic en el icono correspondiente. Fig. 43

Hacemos clic en siguiente, Fig. 44

24

Hacemos clic en siguiente, Fig. 45

Colocamos los títulos, en las casillas correspondientes y haciendo clic en siguiente obtenemos. Fig. 46

Por último terminamos de editar el gráfico; primero unamos las barras, colocamos el puntero sobre una barra y hacemos clic con botón derecho del ratón,

25

Fig. 47

Hacemos clic en formato de serie de datos, Fig. 48

Este cuadro le permite editar lo referente a la serie de datos (barras), hacemos clic en opciones y disminuimos a cero el ancho del rango.

26

Fig. 49

Al aceptar obtenemos, Fig. 50

27

Podemos terminar de editar la gráfica haciendo clic con el botón derecho del ratón, en los elementos del gráfico que deseamos modificar, se abrirá un cuadro de dialogo indicando las posibilidades de cambios a realizar, selecciona lo que deseas y presiona aceptar.

Fig. 51

Recordemos que todos los objetos creados en Microsoft Excel se pueden copiar y pegar en un documento Microsoft Word, por otro lado si un gráfico requiere una edición que vaya más allá de las facilidades de Excel, puede utilizar el software Dibujo – Paint. Ahora recrearemos el uso de Visual Basic para un caso más complicado que el dado anteriormente, suponga que debe transforma los datos contenidos en las columnas C y E, para obtener una nueva variable cuya (edad − tiempo) 2 + 5 ecuación es Var = edad 3 Entonces como ya sabemos, abrimos la estación de trabajo de Visual Basic,

28

Fig. 52

Cerramos, volvemos a Excel, e insertamos la función. Fig. 53

Fig. 54

29

Como indicamos la primera vez que usamos, esta herramienta se introduce los datos (argumentos) y al aceptar obtenemos, Fig. 55

Ahora seleccionamos y copiamos la celda F2, colocamos el puntero en F3, y manteniendo el botón izquierdo presionado arrastramos sin soltar hasta F51(figura 56). Fig. 56

Soltamos el botón y pegamos digitando Control + v, el resultado es el cálculo para todas las observaciones de Var. Fig. 57

30

Como comentamos arriba, esto no cubre todas las utilidades de Excel y mucho menos las potencialidades Visual Basic, sin embargo se han tocado de alguna manera las técnicas básicas para aproximarnos al trabajo mínimo que se puede hacer al analizar datos estadísticos.

31

PARTE III

En esta parte ilustramos, de manera práctica, el uso de la utilidad Regresión de la herramienta Análisis de datos, de la hoja de cálculo Excel. Para ello utilizaremos una data pequeña, en la confianza de que el lector deducirá de lo tratado anteriormente que la hoja de cálculo Excel es capaz de procesar información más amplia que la del siguiente ejemplo. La figura 58, muestra una data que consta de cuatro variables y 20 observaciones. Fig. 58

En el cuadro de texto en las filas 22 a 25 muestra los modelos que se ajustaran a la data suministrada. Para iniciar el proceso haga clic en herramientas ubicada en la barra de la aplicación Excel, debe aparecer una lista tal como se muestra en la figura 59, Fig. 59

32

De esta lista seleccione y haga clic en análisis de datos, y aparecerá un cuadro de dialogo como el que se muestra en la figura 60, Fig. 60

Seleccione Regresión y haga clic en aceptar, emergerá un cuadro de dialogo, observe detenidamente la figura 61. Fig. 61

33

Donde dice Rango Y de entrada se debe seleccionar todos la información que corresponde a la variable independiente o explicada, en el ejemplo, como se ha indicado en la parte II, se arrastra el cursor desde la celda A1 hasta la celda A21 correspondientes a la columna A, aparecerá que has seleccionado $A$1:$A$21. Haciendo clic en donde dice Rango X de entrada, luego colocando el cursor en B1 y seleccionando todas las variables independientes Y, Z y W hasta la fila 21, aparece en la ventana correspondiente, la siguiente información $B$1:$E$21 indicando que has seleccionado toda la información correspondiente a las variables independientes o explicativas del modelo X = aY+bZ+cW +d. Como se han incluido los encabezados, X, Y, Z y W se debe indicar que se tomaron los rótulos, observe que el modelo que pretendemos estudiar tiene el término independiente diferente de cero por tal motivo no se activa la casilla Constante igual a cero, en nivel de confianza si no se dice nada en contrario se trabaja por defecto al 95%, por lo tanto no se selecciona la casilla correspondiente a esta información. En Opciones de salida se recomienda seleccionar hoja nueva, que en algunos casos esta por defecto, si indicamos en el cuadro de diálogo que queremos como resultados: Residuos, Residuos estándares, Gráfico de residuales, Curva de regresión ajustada y Gráfico de probabilidad normal, es preferible que sobre información, la cual podemos borrar, a que falte. Ahora hacemos clic en aceptar y obtenemos un cuadro resumen con todos los estadístico básicos referidos a la regresión y un conjunto de gráficos de los cuales escogemos los de interés. En la figura 62 se muestra las gráficas resultantes en la hoja 4. Fig. 62

34

En esta misma hoja aparecen los resultados numéricos correspondientes al modelo, y que presentamos a continuación, figura 63. Fig. 63 Resumen

Estadísticas de la regresión Coeficiente de correlación múltiple

1

Coeficiente de determinación R^2

1

R^2 ajustado

0.941176471

Error típico

2.38621E-15

Observaciones

20

ANÁLISIS DE VARIANZA Grados de libertad

Suma de cuadrados

Promedio de los cuadrados

F

Regresión

3

920.6167597

306.8722532

Residuos

17

9.67979E-29

5.69399E-30

Total

20

920.6167597

Coeficientes Intercepción

Error típico

Estadístico t

Valor crítico de F 8.0841E+31

Probabilidad

-20

6.77413E-15

-2.95241E+15

Y

0

0

65535

Z

5

1.19758E-15

4.17508E+15

W

0

1.47349E-15

0

Análisis de los residuales

1.1981E-249

Inferior 95%

5.5738E-254

Superior 95%

Inferior 95.0%

Superior 95.0%

-20

-20

-20

0

0

0

0

1.5412E-256

5

5

5

5

1

-3.10879E-15

3.10879E-15

-3.10879E-15

3.10879E-15

#¡NUM!

-20

Resultados de datos de probabilidad

Observación

Pronóstico X 1

Residuos

Residuos estándares

Percentil

5.046540727

-6.21725E-15

-1.169104844

2

18.2923368

-3.55271E-15

3

16.60847804

0

4

10.37125767

5

X 2.5

5.046540727

-0.668059911

7.5

5.048066652

0

12.5

8.675954466

-3.55271E-15

-0.668059911

17.5

9.74181341

16.84194464

-7.10543E-15

-1.336119822

22.5

9.971465194

6

9.971465194

-7.10543E-15

-1.336119822

27.5

10.37125767

7

28.00485244

-3.55271E-15

-0.668059911

32.5

13.99838252

8

13.99838252

-3.55271E-15

-0.668059911

37.5

14.18759728

9

26.15466781

-3.55271E-15

-0.668059911

42.5

16.60847804

10

20.52171392

-3.55271E-15

-0.668059911

47.5

16.83507797

11

8.675954466

-8.88178E-15

-1.670149777

52.5

16.84194464

12

26.67500839

-7.10543E-15

-1.336119822

57.5

17.0639668

13

24.10611286

0

0

62.5

18.2923368

14

18.58149968

-3.55271E-15

-0.668059911

67.5

18.58149968

15

14.18759728

-5.32907E-15

-1.002089866

72.5

20.52171392

16

9.74181341

-3.55271E-15

-0.668059911

77.5

23.45530564

17

5.048066652

-5.32907E-15

-1.002089866

82.5

24.10611286

18

23.45530564

-3.55271E-15

-0.668059911

87.5

26.15466781

19

17.0639668

-3.55271E-15

-0.668059911

92.5

26.67500839

20

16.83507797

-1.06581E-14

-2.004179733

97.5

28.00485244

Sólo queda, como pueden ver, interpretar los resultados dentro del marco teórico correspondiente. Para finalizar expondremos una forma de transformar variables, cuado la misma es sencilla, sin necesidad de usar el Visual Basic. El segundo modelo que se pide analizar es: X=aY+bZ2+cW. Como el Excel sólo permite en la herramienta Análisis de datos (Regresión) trabajar con columnas adyacentes, transformamos en la hoja 1 la variable o variables de interés tal como se muestra en las siguientes figuras.

35

Fig. 64

Fig. 65

36

Fig. 66

Ahora en una nueva hoja (hoja 2) procedemos a copiar las columnas de interés como son: A, B, E y D, quedando registrada la información de esta manera, Fig. 67

37

Procedemos desde esta hoja (hoja2) igual que cuando se trabajo el primer modelo, tomando la previsión de activar la casilla Constante igual cero. Los resultados numéricos se muestran a continuación, Fig. 68

Igual que en el primer caso sólo queda interpretar los resultados, la máquina hace todos los cálculos. Se recomienda revisar la ayuda (help) de Excel si es necesario complementar la información aquí suministrada, o si requiere el uso de otras utilidades como por ejemplo pruebas de hipótesis, generación de números aleatorios, análisis de varianza etc.

Cualquier sugerencia que sirva para mejorar este material se puede realizar a través del correo [email protected]

38

BIBLIOGRAFÍA

Levin Richard, Rubin David. Estadística para Administración y Economía, Séptima edición, Editorial PEARSON Prentice Hall. México. Ayuda del software Excel.

39