-
Notifications
You must be signed in to change notification settings - Fork 0
/
2_Data Frames y Estadisticas Descriptivas.R
64 lines (44 loc) · 1.87 KB
/
2_Data Frames y Estadisticas Descriptivas.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
# En esta ayudantia trabajaremos con el conjunto de datos
# de Fisher. Aprenderemos a:
# - Usar data frames
# - Obtener estadisticas descriptivas
# - Generar histogramas
# Forma 1 (desde R) -----------------------------------------------------
data("iris") # Cargar la base de datos de R
head(iris, 10) # Vemos las primeras 10 observaciones
# Forma 2 (desde archivo Excel) -----------------------------------------
library(readxl) # Libreria para leer excel
# Leemos excel
IrisData <- read_excel("D:/DEMAT/6to semestre/Ayudantia/Semana 1/FishersIrisData.xls")
View(IrisData) # Para visualizar TODOS los datos
head(IrisData, 10) # Vemos las primeras 10 observaciones
# Extraer una parte del conjunto de datos -------------------------------
# Escoger UNA variable
X <- iris[, 1] #[nada, no. de columna]
# Escoger varias variables
X1 <- iris[, c(1,5)] #[nada, vector de columnas]
# Escoger varias observaciones observaci?n y una variable
X2 <- iris[1:50, 1] #[vector de filas, no. de renglones]
# Escoger varias observaciones observaci?n y varias variables
X3 <- iris[1:50, c(1,5)] #[vector de filas, vector de columnas]
# Obtener un subconjunto
versicolor <- subset(iris, Species == "versicolor")
# subset(data, Nombre de la columna == Valor)
# Estad?sticas descriptivas ---------------------------------------------
n <- length(X) # Tama?o de X
mean(X) # Promedio
var(X)*(n-1)/n # Varianza | Para la desv. estandar sacar raiz
median(X) # Mediana
min(X) # Min
max(X) # Max
summary(X) # Para obtener resumen
# Histograma-------------------------------------------------------------
# Con R
hist(X, main = "Histograma Longitud Sepalo",
xlab = "Longitud", ylab = "Frecuencia",
col = "purple")
# Con ggplot2
#install.packages(ggplot2)
library(ggplot2)
p <- ggplot(iris, aes(x=Sepal.Length)) +
geom_histogram(binwidth = 0.5)