lunes, 28 de junio de 2010

LaTeX Lab y Google

Fuente: Tomado de http://cactusdigital.net/imagenes/latex-google-docs1.jpg

Fuente: Tomado de http://cactusdigital.net/imagenes/latex-google-docs2.jpg


Si se creo un editor de ecuaciones de $\LaTeX$ en Googledocs, porque no crear un editor de texto en $\LaTeX$ en Google. Esa es la nueva propuesta de trabajo (ver aquí). LaTeX Lab es una interfaz gráfica en Google Docs del conocido editor de texto $\LaTeX$. Nosotros editamos el documento de $\LaTeX$ en la nube y podemos visualizar el resultado del mismo archivo con posibilidad de publicarlo inmediatamente. Excelente opción.

Ver también: : Como escribir en $\LaTeX$, Ventajas del editor de texto $\LaTeX$, PowerPoint con formulas en $\LaTeX$

Googledocs y LaTeX

Fuente: Tomado de http://divisbyzero.files.wordpress.com/2009/09/picture-12.png

Hoy en día la computación en la nube ha sido bastante útil. Google ha sido uno de los pioneros en este campo (ya es costumbre de este gigante informático de ser pionero en todo). Básicamente el trabajo en la nube consiste en editar, publicar, diseñar, todo desde Internet. No son necesarios los programas de ofimática, ya que está disponible en la red, editores de texto, de presentaciones y hojas de cálculo. Googledocs permite trabajar en este sentido y ha sido excelente.

Imagínese realizar documentos de Word y tenerlos en Internet y editarlos desde cualquier lugar del mundo. Ahora para nosotros los usuarios de $\LaTeX$ está alternativa de uso puede utilizarse para realizar los documentos en este campo. Googledocs ha permitido trabajar documentos con un editor de ecuaciones en $\LaTeX$. Así como lo leen ahora es posible tener archivos de Word en internet, publicarlos si desean y utilizar un editor de ecuaciones en $\LaTeX$ (ver aquí). Me parece increíble, espero les guste.

Ver también: Como escribir en $\LaTeX$, Ventajas del editor de texto $\LaTeX$, PowerPoint con formulas en $\LaTeX$

Excel y el software R (RExcel)

Fuente: Tomado de http://www.statconn.com/bilder/monitor.jpg

Hoy en día las personas poco a poco han encontrado en el software R un programa de estadística bastante interesante y muy útil para cada uno de los campos en los que se ha trabajado. Algunos se quejan de que este software no es muy amigable y es un error épico, simplemente por el costo del aprendizaje del lenguaje  y la documentación de este mismo. Personalmente no encuentro sentido a estos comentarios posiblemente son usuarios que se han familiarizado mucho con el entorno de MS Excel  y cuando encuentran un programa que no se le parece entonces no les gusta. No quiero polemizar porque a mi gusto R es un software baste útil, muy intuitivo,  académico y es un software de uso libre (ver aquí).

Hace poco tuve la oportunidad de comentar la posibilidad de utilizar una interfaz de R (R-coomander)  bastante sencilla de utilizar. Esta interfaz tiene un parecido peculiar al programa MS Excel cosa que llama mucho la atención a estos usuarios y ha sido bastante funcional puesto se le han integrado paquetes útiles en muchos campos de la estadística. Leyendo un post bastante interesante existe una forma de utilizar el programa R y el programa Excel llamado RExcel. Básicamente consiste en trabajar datos bajo la plataforma de MS Excel e importar los cálculos realizados en R. Incluso se puede trabajar los comandos del R-coomander bajo Excel con esta conexión. Quien logra realizar esto es Erich Neuwirth bajo la plataforma de VBA, esto para los usuarios de Visual pueden encontrarlo bastante útil.

Se puede descargar un paquete completo del programa R y el RExcel llamada RAndFriends en la pagina de statconn, quienes desean ver la aplicación de este mismo puede ver el video narrado por el propio creador y un libro bajo la colección Use R! cuyos autores Richard M. Heiberger y Erich Neuwirth lo han llamado R through Excel.

Bueno espero les interese a todos y comiencen a ver el potencial que este programa tiene, usuarios y los no tanto.

Larga vida al Software R!!!

Ver también: Creación de paquetes con R, Tiempo de lectura rapida y comprensión de archivos con R,

domingo, 20 de junio de 2010

Relación entre la ley de cosenos y correlación de variables



Existen varias conexiones que se pueden dar entre las Matemáticas y la Estadística. Una de ellas la describe Jhon Cook en su blog, sobre una relación existente entre la probabilidad y la geometría. Más específicamente entre las desviaciones estándar entre variables independientes y el Teorema de Pitagoras, la correlación entre variables aleatorias dependientes  y la ley de cosenos. Esto debe ser que la correlación es un coseno según Cook.

A continuación vamos a describir la relación que se encuentran.

Variables independientes


En primer lugar, vamos a empezar con dos variables aleatorias independientes \(X\) e \(Y\). Las desviaciones estándar de \(X\) e \(Y\) son tomadas como los lados de un triángulo rectángulo (ver Figura 1)

Tomado de http://www.johndcook.com/sdpythag.png

En la Figura 1, la Desviación Estándar (\(sd\)) es la raíz cuadrada de la varianza. La figura nos indica que la fórmula de la Varianza es
\[\text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y)\]

el cual la formula es análoga al Teorema de Pitágoras
\[c^2 = a^2 + b^2.\]

Variables dependientes


Ahora supongamos que las variables son dependientes. Si \(X\) e \(Y\) están correlacionadas, la fórmula de la varianza es análoga a la ley de los cosenos (ver Figura 2).

Tomado de http://www.johndcook.com/sdlawofcos.png


La generalización de la fórmula anterior para la varianza entre variables dependientes es
\[\text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y) + 2\text{Cov}(X, Y).\]
\(\text{Cov}(X, Y)\)  es la covarianza de \(X\) e \(Y\). La ley de los cosenos es análoga
\[c^2=a^2+b^2-2ab\cos(\theta).\]

\(a\), \(b\) y \(c\) son las Desviaciones Estándar de \(X\), \(Y\) y \(X +Y\), respectivamente, entonces el \(\cos (\theta) =-\rho\) donde \(\rho\) es la correlación entre \(X\) e \(Y\) se define como
\[\rho(X,Y)=\frac{\text{Cov}(X,Y)}{\text{Sd}(X)\text{Sd}(Y)}.\]

Cuando \(\theta\) es \(\pi/2\) las variables aleatorias son independientes. Cuando \(\theta\) es mayor, las variables se correlacionan positivamente. Cuando \(\theta\) es menor, las variables tienen una correlación negativa. Dicho de otra manera, como \(\theta\) aumenta de \(0\) a \(\pi\), los aumentos de correlación \(-1\) a \(1\).

La analogía anterior es un poco torpe,  debido al signo menos.Reformulemos la formula anterior utilizando el ángulo suplementario \(\varphi =\pi-\theta\). Deslice la línea que representa la desviación estándar de \(Y\) sobre el extremo izquierdo de la línea horizontal que representa la desviación típica de \(X\) (Ver Figura 3).

Tomado de http://www.johndcook.com/sdsupplement.png

El \(\cos(\varphi) =\rho=\text{Corr} (X, Y)\).

Cuando \(\varphi\) es pequeño, los dos segmentos de línea están apuntando en casi la misma dirección y las variables aleatorias son altamente correlacionados positivamente. Si \(\varphi\) es grande, cerca a \(\pi\), los dos segmentos de línea están apuntando en direcciones opuestas y cerca de las variables aleatorias son altamente correlacionados negativamente.

Explicación de la conexión


El origen de la conexión entre la correlación y el teorema del coseno esta en el espacio producto entre \(X\) e \(Y\) el cual el producto interno \(\langle X,Y\rangle\) estadísticamente es \(\text{E} (XY)\). Entonces
\[\langle X+Y, X+Y\rangle=\langle X,X\rangle +\langle Y,Y\rangle +2\langle X,Y\rangle.\]

En un espacio con producto interno,
\[\langle X,Y\rangle=\left \| X \right\|\left\| Y \right\|\cos\varphi ,\]

donde la norma de un vector \(\left\| X \right\|\)  es la raíz cuadrada del producto escalar del vector por sí mismo. La ecuación anterior define el \(\varphi\) ángulo entre dos vectores. Se podría justificar esta definición al ver que está de acuerdo con la geometría plano ordinario en el plano que contiene los tres vectores \(X\), \(Y\) y \(X + Y\).

Ver también: Teorema del Límite Central.