[1] 2
[1] 3
[1] 27
[1] 22026.47
[1] 3.141593
2024-08-19
numeric, character, logical
vector
factor, faltantes, date, time
matrix
, data.frame
R
es quizas el más poderoso ambiente computacional para análisis de datos.
Con R
puedes:
Las funcionalidades se amplian gracias a miles de paquetes (plug-ins)
Cuando tengas duda, pruébalo! (Norman Matloff’s)
Estas aprendiendo un lenguaje, tendras que dedicar mucho tiempo para alcanzar un buen nivel en R, pero vale la pena.
Tolerancia a la frustración es un requisito. Al principio muchas cosas fallarán y volveran a fallar, hasta que luego empezaran a funcionar.
R
]
Script (izquierda arriba):
Acá es donde revisas y editas los scripts.Consola (izquierda abajo):
acá se ejecutan los comandos de R. Las salidas de R (outputs) aparecen acá.Global Environment (derecha arriba):
variables almacenadas, funciones, y otros objetos de R aparecen acá.Misc (derecha abajo):
Una variedad de pestañas que ayudan a buscar archivos, ver los gráficos, ver ayuda, etc.RStudio también tiene varias personalizaciones que ayudan a un mejor uso::
Appearance
para cambiar tipo de letra y colorCode
selecciona el cuadro que dice “Soft-wrap R source files” para ajustar el texto al ancho del panel.Display
selecciona el cuadro que dice “Highlight selected line” y “Highlight R function calls”. Proporciona destacado de linea y funciones.Ejemplo de script:
#
se utilizan para documentar funciones y su contenido.<-
=
para argumentos en una funcióntodo lo que hay en
R
es un objeto y todo lo que pasa en R es fruto de unafunción
funciones
ejecutan acciones sobre los argumentos
.
nombre_funcion(argumentos)
argumentos
son los datos de entrada - valores, expresiones, texto, etc.
Usa la función ls()
para ver todos los objetos definidos. Notar que ls()
no toma ningun argumento!
Tipos de datos:
- Numéricos: integer y double
- Caracter
- Lógicos
- Complejos
- Raw
Siempre entre comillas: '
o "
No es lo mismo:
¿Qué pasa en este caso?
Ejemplo:
Estructuras de datos:
- vectores
- matrices
- arrays
- data.frame
- listas
Hay dos tipos de vectores en R:
Vectores atómicos
: homogéneos
Listas
: hetereogéneos
Almacena el mismo tipo de dato (numeric, character, logical)
¿Qué pasa si mezclamos diferentes tipos?
Importante
:
- Jerarquia de Coerción: logical -> integer -> double -> character
¿Qué pasará con?
[1] "character"
Constantes integradas en R
[1] "a" "b" "c" "d" "e" "f" "g" "h" "i" "j" "k" "l" "m" "n" "o" "p" "q" "r" "s"
[20] "t" "u" "v" "w" "x" "y" "z"
[1] "January" "February" "March" "April" "May" "June"
[7] "July" "August" "September" "October" "November" "December"
Para ver cuántos elementos tiene un vector usamos length
Regular expresion (regex) pueden utilizarse para buscar texto por un patrón usamos grep
.
[1] "January" "February" "March" "April" "May" "June"
[7] "July" "August" "September" "October" "November" "December"
[1] 1 2 3 5
Para más información sobre regex vaya a regexr.com
Los vectores pueden
tener atributos (metadata)
El análisis de datos faltantes es muy importante en análisis de datos
Las funciones as.________, convierten un tipo de dato a otro
–
En escencia es un vector con attributos. Representa una variable nominal/categorica. Usados para test estadísticos.
[1] a a b c c c
Levels: a b c
Estructuras de datos:
- vectores
- matrices
- arrays
- data.frame
- listas
vector
tiene una dimensión, la matrix
tiene 2
Es uno de los objetos más destacados, nace del mundo de software de análisis estadístico.
Cada columna corresponde a una variable y cada fila a una observación.
Puede almacenar columnas con diferentes tipos de datos
¿Cómo creamos un data.frame?
id <- 1:6
nombres <- c('Paulina','Idania','Patricia','Natalia','Alejandro','Alvaro')
sexo <- c('F','F','F','F','M','M')
num_letras <- nchar(nombres)
df <- data.frame(id,nombres,sexo,num_letras)
df
id nombres sexo num_letras
1 1 Paulina F 7
2 2 Idania F 6
3 3 Patricia F 8
4 4 Natalia F 7
5 5 Alejandro M 9
6 6 Alvaro M 6
Ejemplo
Aplicar la función log
a cada elemento del vector v1.
IMSD1025|2-2024