domingo, 17 de junio de 2018

Comandos de R

data() conjuntos de datos disponibles. Se listan los ficheros de datos que suministra o incorpora el programa.
attach(fichero) carga en memoria las variables del data frame.
detach(fichero) descarga de la memoria las variables del data.
frame ls() Lista de los objetos que están en memoria.
rm(objeto) Elimina el objeto en memoria.
attributes(data.frame) Lista de los objetos en memoria.
 help.start() Con esta ayuda en html es posible realizar búsquedas.
getwd() Directorio de trabajo.
setwd(); Cambia el directorio, como setwd(’’C:/data’’)
na.omit(x) elimina las observaciones con datos ausentes (NA) is.na(x) devuelve TRUE cuando encuentra valor omitido (NA)
which(is.nan(x)) devuelve los indices de los valores con TRUE para (NA)
tapply(variable, factor, func) aplica la función func a las variables Var por factores
apply(data.frame, op, func) aplica una función a las filas si op=1 o a las columnas si op=2, del data.frame
table(f1,f2) calcula la tabla de frecuencias para factores f1,f2
split (Variable, Factor ) descompone la variable seg´un los factores.

Aritméticos
+ Adición
- Substracción
* Multiplicación
/ División
^ Potencia
%/ % División Entera

Comparativos
== Igual
a!= Diferente de
< Menor que
> Mayor que
<= Menor o Igual que
>= Mayor o Igual que

Lógicos
& Y lógico
! NO lógico
| O lógico
is.na(x) Ausente?

Funciones Matemáticas
sqrt(x) Raíz de x
exp(x) Exponencial de x
log(x) Logaritmo natural de x
log10(x) Logaritmo base 10
length(x) Número de elementos
sum(x) Suma los elementos de x
prod(x) Producto de los elementos
sin(x) Seno
cos(x) Coseno
tan(x) Tangente
round(x,n) redondea a n dígitos
cumsum(x) calcula las sumas acumuladas x1, x1 + x2, x1 + x2 + x3, x1 + x2 + . . . + xn


Funciones Estadística
mean(x) Media
sd(x) Cuasidesviación
var(x) Varianza
median(x) Mediana
quantile(x,p) Quantiles
cor(x,y) Correlación
max(x) El máximo
min(x) El mínimo
range(x) Retorna el máximo y mínimo
sort(x) Ordena las componentes de x
which(condición) los índices que cumplen la condición
summary Resumen de las variables
choose(n, k) n´umero combinatorio de n sobre k


cdef la función cdef(x) representa la función de distribución empírica. sample(x,size,replace=FALSE,prob) Obtiene una muestra de tamaño size de x, con o sin reemplazamiento, pudiendo tener los elementos de x probabilidades distintas a la uniforme (por defecto).

ks.test(x, Fx, param, alt=’two.sided’) Para realizarlo sólo se necesita: vector de valores ordenados de la variable x, Fx es la ’p’ función de distribución continua, como por ejemplo la normal ’pnorm’, exponencial ’pexp’, la distr. t ’pt’, etc), especificar los parámetros param de la distribución. especificar la hipótesis alternativa, con 3 opciones : two.sided,less,greater.

prop.test(x,n,p=0.5,alternative=”two.sided”, conf.level=0.95,correct=FALSE) Para realizarlo sólo se necesita: proporcionar el n´umero de éxitos, x, proporcionar el n´umero de pruebas, n, especificar la hipótesis nula (p = p0) especificar la hipótesis alternativa, con 3 opciones : two.sided,less,greater. especificar el nivel de confianza (1 − α), indicar si se aplica la corrección por continuidad de Yates o no. Como ejemplos: prop.test(x, n, conf.level=0.95) prop.test(x, n, p=0, alt=’two.sided’) prop.test(x=c(x1,x2), n=c(n1,n2), alt=’two.sided’)

t.test(x, alternative=”two.sided”, mu=0, conf.level=0.95) Para realizarlo sólo se necesita: proporcionar el vector de datos, x, especificar la hipótesis alternativa. Por defecto se tiene alternative = ”two.sided”(contraste bilateral) pero se puede elegir alternative = ”less”(contraste unilateral a la izquierda) o alternative = ”greater”(contraste unilateral a la derecha), especificar la hipótesis nula (µ = µ0) especificar el nivel de confianza conf.level (1 − α),

Histograma, diagrama de caja, diagrama de tallo y hojas 
hist(x)
boxplot(x)
stem(x)




Comandos de R

data() conjuntos de datos disponibles. Se listan los ficheros de datos que suministra o incorpora el programa. attach(fichero) carga en m...