3. Representación gráfica de variables categóricas y numéricas

Describe numéricamente y muestra de forma gráfica al menos dos variables categóricas y dos variables numéricas del fichero.
financial-2860753_1280

Tabla de Contenidos

Script en R

				
					#PREGUNTA 3 
#Describe numéricamente y muestra de forma gráfica al menos:
#dos variables categóricas y dos variables numéricas del fichero.  

#numericas
##EDAD 
summary(ense$EDADa)#salia categórica por lo que habia que convertir en numerica
mean(ense$EDADa,na.rm = T)
median(ense$EDADa,na.rm= T) # para calcular la mediana 
quantile(ense$EDADa,probs = c(0,0.25,0.5,0.75,1),na.rm = T) # para calcular distintos cuantiles
var(ense$EDADa,na.rm = T) # para calcular la varianza
sd(ense$EDADa,na.rm = T) # para calcular la desviación típica
sd(ense$EDADa,na.rm = T)/mean(ense$EDADa,na.rm = T) # para calcular el coeficiente de variación
edad <-(ense$EDADa)
hist(edad, ylab = "frecuencia",xlab = "edad",
        ylim = c(0, 2500),
        col=c("grey"))
                    
boxplot(edad, ylab = "Edad")
title(main = "Diagrama de cajas y bigotes", font.main = 4, )

##GHQ12 Puntuación global cuestionario GHQ-12
summary(ense$GHQ12)
mean(ense$GHQ12,na.rm = T)
median(ense$GHQ12,na.rm= T) # para calcular la mediana 
quantile(ense$GHQ12,probs = c(0,0.25,0.5,0.75,1),na.rm = T) # para calcular distintos cuantiles
var(ense$GHQ12,na.rm = T) # para calcular la varianza
sd(ense$GHQ12,na.rm = T) # para calcular la desviación típica
sd(ense$GHQ12,na.rm = T)/mean(ense$GHQ12,na.rm = T) # para calcular el coeficiente de variación
hist(ense$GHQ12) #histograma ##FALTA CAMBIAR TITULO
boxplot(ense$GHQ12,ylab = "Puntuación cuestionario GHQ12")
title(main = "Diagrama de cajas y bigotes", font.main = 4, )#diagrama de cajas con bigotes

#categóricas
##SEXO
ense$SEXOa <- factor(ense$SEXOa, labels = c("hombre", "mujer"))
Tabla.sexo1<-table(ense$SEXOa)
Tabla.sexo1 #1=hombre, 2=mujer
prop.table(Tabla.sexo1)#porcentaje total
Tabla.sexo2 <- prop.table(Tabla.sexo1)
Tabla.sexo2*100#proporcion en uno por cien
barplot(Tabla.sexo2*100, ylab = "frecuencia (%)",xlab = "sexo", ylim = c(0, 60)) #grafico de barras
title(main = "Frecuencia por Sexo", font.main = 4) #falta añadir 1=hombre, 2=mujer
pie(Tabla.sexo2*100,col = grey(seq(0.1, 0.8, length.out = length(Tabla.sexo2)))) # diagrama de sectores 
title(main = "Frecuencia por Sexo", font.main = 4) #falta añadir 1=hombre, 2=mujer

##SITUACIÓN LABORAL - A11_i
summary(ense$A11_i)
levels(ense$A11_i)
median(ense$A11_i,na.rm= T) 
Tabla.lab<-table(ense$A11_i)
Tabla.lab #1=Trabajando, 2En desempleo, 3	Jubilado/a, prejubilado/a; 4Estudiando; 5	Incapacitado/a para trabajar; 6	Las labores del hogar; 7	Otros; 8	No contesta
prop.table(Tabla.lab)#porcentaje total
Tabla.lab2 <- prop.table(Tabla.lab)
Tabla.lab2*100 #proporcion en uno por cien
Tabla.lab3 <- Tabla.lab2*100
barplot(Tabla.lab3) #grafico de barras
title(main = "Situación laboral actual", font.main = 4) #falta añadir legenda
pie(Tabla.lab3,col = grey(seq(0.1, 0.8, length.out = length(Tabla.lab3)))) # diagrama de sectores 
title(main = "Situación laboral actual", font.main = 4) #falta añadir legenda
				
			

Resumen explicativo del script

Se ha realizado un análisis numérico y gráfico de dos variables numéricas y dos categóricas del conjunto de datos ense. A continuación, resumo los resultados y las interpretaciones:

1. Variables Numéricas EDAD (EDADa)

Resumen estadístico: La edad varía de 15 a 103 años, con una media de aproximadamente 53 años y una mediana de 53 años. La desviación estándar es de aproximadamente 18.89 años.
Gráficos: El histograma muestra la distribución de frecuencias de las edades, y el diagrama de cajas (boxplot) proporciona una visión clara de la dispersión y la mediana de las edades.

2. Puntuación Global del Cuestionario GHQ-12 (GHQ12)

Resumen estadístico: Las puntuaciones varían de 0 a 12, con una media de aproximadamente 1.46 y una mediana de 0. Esto indica una baja prevalencia general de síntomas psicológicos en la muestra.
Gráficos: El histograma muestra la distribución de las puntuaciones del GHQ-12, y el boxplot resalta la mediana y la variabilidad de las puntuaciones.

3. Variables Categóricas SEXO (SEXOa)

Resumen estadístico: Se muestra la distribución de frecuencias entre hombres y mujeres en el conjunto de datos.
Gráficos: Se presentan un gráfico de barras y un diagrama de sectores (pie) para ilustrar la distribución porcentual de hombres y mujeres en el estudio.

4. Situación Laboral (A11_i)

Resumen estadístico: Se calcula la distribución de frecuencias de las diferentes categorías de situación laboral.
Gráficos: Un gráfico de barras y un diagrama de sectores representan visualmente la distribución porcentual de las diferentes categorías de situación laboral.

5. Resumen Final

En general, tu análisis proporciona una comprensión detallada de las características demográficas y de salud de la población en el conjunto de datos ense. La representación gráfica facilita la interpretación visual de los datos, permitiendo una rápida comprensión de las distribuciones y las tendencias clave.

Consola del Script en R

				
					#PREGUNTA 3 
> #Describe numéricamente y muestra de forma gráfica al menos:
> #dos variables categóricas y dos variables numéricas del fichero.  
> 
> #numericas
> ##EDAD 
> summary(ense$EDADa)#salia categórica por lo que habia que convertir en numerica
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  15.00   39.00   53.00   53.44   68.00  103.00 
> mean(ense$EDADa,na.rm = T)
[1] 53.43618
> median(ense$EDADa,na.rm= T) # para calcular la mediana 
[1] 53
> quantile(ense$EDADa,probs = c(0,0.25,0.5,0.75,1),na.rm = T) # para calcular distintos cuantiles
  0%  25%  50%  75% 100% 
  15   39   53   68  103 
> var(ense$EDADa,na.rm = T) # para calcular la varianza
[1] 357.0125
> sd(ense$EDADa,na.rm = T) # para calcular la desviación típica
[1] 18.89477
> sd(ense$EDADa,na.rm = T)/mean(ense$EDADa,na.rm = T) # para calcular el coeficiente de variación
[1] 0.3535951
> edad <-(ense$EDADa)
> hist(edad, ylab = "frecuencia",xlab = "edad",
+         ylim = c(0, 2500),
+         col=c("grey"))
>                     
> boxplot(edad, ylab = "Edad")
> title(main = "Diagrama de cajas y bigotes", font.main = 4, )
> 
> ##GHQ12 Puntuación global cuestionario GHQ-12
> summary(ense$GHQ12)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  0.000   0.000   0.000   1.462   2.000  12.000 
> mean(ense$GHQ12,na.rm = T)
[1] 1.462125
> median(ense$GHQ12,na.rm= T) # para calcular la mediana 
[1] 0
> quantile(ense$GHQ12,probs = c(0,0.25,0.5,0.75,1),na.rm = T) # para calcular distintos cuantiles
  0%  25%  50%  75% 100% 
   0    0    0    2   12 
> var(ense$GHQ12,na.rm = T) # para calcular la varianza
[1] 7.52491
> sd(ense$GHQ12,na.rm = T) # para calcular la desviación típica
[1] 2.743157
> sd(ense$GHQ12,na.rm = T)/mean(ense$GHQ12,na.rm = T) # para calcular el coeficiente de variación
[1] 1.876144
> hist(ense$GHQ12) #histograma ##FALTA CAMBIAR TITULO
> boxplot(ense$GHQ12,ylab = "Puntuación cuestionario GHQ12")
> title(main = "Diagrama de cajas y bigotes", font.main = 4, )#diagrama de cajas con bigotes
> 
> #categóricas
> ##SEXO
> ense$SEXOa <- factor(ense$SEXOa, labels = c("hombre", "mujer"))
> Tabla.sexo1<-table(ense$SEXOa)
> Tabla.sexo1 #1=hombre, 2=mujer

hombre  mujer 
 10595  12494 
> prop.table(Tabla.sexo1)#porcentaje total

   hombre     mujer 
0.4588765 0.5411235 
> Tabla.sexo2 <- prop.table(Tabla.sexo1)
> Tabla.sexo2*100#proporcion en uno por cien

  hombre    mujer 
45.88765 54.11235 
> barplot(Tabla.sexo2*100, ylab = "frecuencia (%)",xlab = "sexo", ylim = c(0, 60)) #grafico de barras
> title(main = "Frecuencia por Sexo", font.main = 4) #falta añadir 1=hombre, 2=mujer
> pie(Tabla.sexo2*100,col = grey(seq(0.1, 0.8, length.out = length(Tabla.sexo2)))) # diagrama de sectores 
> title(main = "Frecuencia por Sexo", font.main = 4) #falta añadir 1=hombre, 2=mujer
> 
> ##SITUACIÓN LABORAL - A11_i
> summary(ense$A11_i)
                  Trabajando                 En desempleo     Jubilado/a,prejubilado/a                   Estudiando 
                        9919                         2487                         6608                         1309 
Incapacitado/a para trabajar        Las labores del hogar                        Otros 
                         582                         2156                           28 
> levels(ense$A11_i)
[1] "Trabajando"                   "En desempleo"                 "Jubilado/a,prejubilado/a"     "Estudiando"                  
[5] "Incapacitado/a para trabajar" "Las labores del hogar"        "Otros"                       
> median(ense$A11_i,na.rm= T) 
Error in median.default(ense$A11_i, na.rm = T) : need numeric data
> #PREGUNTA 3 
> #Describe numéricamente y muestra de forma gráfica al menos:
> #dos variables categóricas y dos variables numéricas del fichero.  
> 
> #numericas
> ##EDAD 
> summary(ense$EDADa)#salia categórica por lo que habia que convertir en numerica
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  15.00   39.00   53.00   53.44   68.00  103.00 
> mean(ense$EDADa,na.rm = T)
[1] 53.43618
> median(ense$EDADa,na.rm= T) # para calcular la mediana 
[1] 53
> quantile(ense$EDADa,probs = c(0,0.25,0.5,0.75,1),na.rm = T) # para calcular distintos cuantiles
  0%  25%  50%  75% 100% 
  15   39   53   68  103 
> var(ense$EDADa,na.rm = T) # para calcular la varianza
[1] 357.0125
> sd(ense$EDADa,na.rm = T) # para calcular la desviación típica
[1] 18.89477
> sd(ense$EDADa,na.rm = T)/mean(ense$EDADa,na.rm = T) # para calcular el coeficiente de variación
[1] 0.3535951
> edad <-(ense$EDADa)
> hist(edad, ylab = "frecuencia",xlab = "edad",
+         ylim = c(0, 2500),
+         col=c("grey"))
>                     
> boxplot(edad, ylab = "Edad")
> title(main = "Diagrama de cajas y bigotes", font.main = 4, )
> 
> ##GHQ12 Puntuación global cuestionario GHQ-12
> summary(ense$GHQ12)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  0.000   0.000   0.000   1.462   2.000  12.000 
> mean(ense$GHQ12,na.rm = T)
[1] 1.462125
> median(ense$GHQ12,na.rm= T) # para calcular la mediana 
[1] 0
> quantile(ense$GHQ12,probs = c(0,0.25,0.5,0.75,1),na.rm = T) # para calcular distintos cuantiles
  0%  25%  50%  75% 100% 
   0    0    0    2   12 
> var(ense$GHQ12,na.rm = T) # para calcular la varianza
[1] 7.52491
> sd(ense$GHQ12,na.rm = T) # para calcular la desviación típica
[1] 2.743157
> sd(ense$GHQ12,na.rm = T)/mean(ense$GHQ12,na.rm = T) # para calcular el coeficiente de variación
[1] 1.876144
> hist(ense$GHQ12) #histograma ##FALTA CAMBIAR TITULO
> boxplot(ense$GHQ12,ylab = "Puntuación cuestionario GHQ12")
> title(main = "Diagrama de cajas y bigotes", font.main = 4, )#diagrama de cajas con bigotes
> 
> #categóricas
> ##SEXO
> ense$SEXOa <- factor(ense$SEXOa, labels = c("hombre", "mujer"))
> Tabla.sexo1<-table(ense$SEXOa)
> Tabla.sexo1 #1=hombre, 2=mujer

hombre  mujer 
 10595  12494 
> prop.table(Tabla.sexo1)#porcentaje total

   hombre     mujer 
0.4588765 0.5411235 
> Tabla.sexo2 <- prop.table(Tabla.sexo1)
> Tabla.sexo2*100#proporcion en uno por cien

  hombre    mujer 
45.88765 54.11235 
> barplot(Tabla.sexo2*100, ylab = "frecuencia (%)",xlab = "sexo", ylim = c(0, 60)) #grafico de barras
> title(main = "Frecuencia por Sexo", font.main = 4) #falta añadir 1=hombre, 2=mujer
> pie(Tabla.sexo2*100,col = grey(seq(0.1, 0.8, length.out = length(Tabla.sexo2)))) # diagrama de sectores 
> title(main = "Frecuencia por Sexo", font.main = 4) #falta añadir 1=hombre, 2=mujer
> 
> ##SITUACIÓN LABORAL - A11_i
> summary(ense$A11_i)
                  Trabajando                 En desempleo     Jubilado/a,prejubilado/a                   Estudiando 
                        9919                         2487                         6608                         1309 
Incapacitado/a para trabajar        Las labores del hogar                        Otros 
                         582                         2156                           28 
> levels(ense$A11_i)
[1] "Trabajando"                   "En desempleo"                 "Jubilado/a,prejubilado/a"     "Estudiando"                  
[5] "Incapacitado/a para trabajar" "Las labores del hogar"        "Otros"                       
> median(ense$A11_i,na.rm= T) 
Error in median.default(ense$A11_i, na.rm = T) : need numeric data
				
			

Explicación de resultados del script

El análisis para la pregunta 3 aborda tanto variables numéricas como categóricas del conjunto de datos ense. A continuación, resumo tus hallazgos y te ofrezco algunas sugerencias adicionales:

Variables Numéricas
EDAD (EDADa):

Resumen estadístico: La edad varía de 15 a 103 años, con una media de aproximadamente 53 años y una mediana de 53 años. La desviación estándar es de aproximadamente 18.89 años.
Gráficos: Has generado un histograma y un diagrama de cajas (boxplot) para mostrar la distribución de las edades.
Puntuación Global del Cuestionario GHQ-12 (GHQ12):

Resumen estadístico: Las puntuaciones varían de 0 a 12, con una media de aproximadamente 1.46 y una mediana de 0. Esto sugiere una baja prevalencia general de síntomas psicológicos en la muestra.
Gráficos: Un histograma y un boxplot han sido creados para visualizar la distribución de las puntuaciones del GHQ-12.
Variables Categóricas
SEXO (SEXOa):

Resumen estadístico: Distribución entre hombres (45.89%) y mujeres (54.11%).
Gráficos: Has creado un gráfico de barras y un diagrama de sectores para ilustrar la distribución de género en el estudio.
Situación Laboral (A11_i):

Resumen estadístico: Distribución de categorías como «Trabajando», «En desempleo», «Jubilado/a, prejubilado/a», entre otras.
Gráficos: Aunque mencionas la intención de crear gráficos, no se incluye el código para ellos. Puedes considerar hacer gráficos de barras o de sectores para representar visualmente la distribución de la situación laboral.
Sugerencias Adicionales
Para la variable A11_i (Situación Laboral), no es posible calcular la mediana directamente, ya que es una variable categórica. Sin embargo, puedes visualizar la distribución de esta variable mediante gráficos, como un diagrama de barras.
Asegúrate de añadir títulos y etiquetas adecuadas a todos tus gráficos para facilitar su interpretación.
Considera incluir un análisis de otras variables categóricas si están disponibles en tu conjunto de datos.
En resumen, tu análisis proporciona una visión detallada de las características clave de la población en el conjunto de datos ense, tanto en términos numéricos como categóricos. Los gráficos ayudan a interpretar visualmente estos datos, ofreciendo una comprensión rápida de las distribuciones y tendencias clave.

El cuidado de personas mayores parece estar asociado con un aumento en el riesgo de morbilidad psíquica, lo que subraya la importancia de brindar apoyo adecuado a los cuidadores.

Manuel Medina Pérez
Supervisor de Urgencias en Hospital de Antequera - Enfermero

Siguientes Títulos