El monstRuo de las galletas estadísticas

El profesor, con una caja de galletas en la mano, entra en una clase de 15 o más estudiantes y saca del bolsillo una baraja de cartas inglesa, nueva, envuelta en su plástico original sin abrir. El profesor pide a un estudiante voluntario que abra el envoltorio para pasar a quitar los comodines y barajar las cartas varias veces, delante de los alumnos. A continuación, los estudiantes son requeridos para ponerse en fila.

Van a jugar a un juego. Los estudiantes, por turnos, tomarán una carta de la parte superior de la baraja. Si la carta es negra, el afortunado habrá ganado una galleta. Si la carta es roja, el desafortunado estudiante se sentará en su sitio con las manos vacías. ¡Que empiece el juego!

El primer estudiante saca una carta: roja. Se oyen burlas y mofas, y el estudiante vuelve a su puesto. Está decepcionado, por supuesto, pero no demasiado. Después de todo se la jugaba al 50% y no ha ocurrido. Bueno, no pasa nada.

El segundo estudiante saca otra carta: roja otra vez. Se vuelven a oír mofas y burlas, y el segundo alumno se sienta en su sitio. También está decepcionado, pero de nuevo, no mucho, porque es probablemente su día de mala suerte. Vayamos con el siguiente.

El estudiante saca… ¡roja otra vez! Hay algunos listillos que levantan la voz indignados (para armar barullo, más que nada) pero hay otros que no se han molestado – están pensando. Es la tercera carta roja consecutiva, lo cual es posible, por supuesto, pero ¿qué es lo que está pasando aquí? No están seguros. Se concentran en la siguiente carta… saldrá negra, ¿no?

El cuarto saca su carta: roja. Hmmm. . . ahora hay quejas y refunfuños en lugar de mofas. Algunos del final de la fila se encogen de hombros y comienzan a sentarse en sus puestos, quejándose de que el profesor no quiere darles ni una galleta. Aunque aún quedan estudiantes en la fila, de pie, salivando, esperando a que salga la inevitable primera carta negra.

El quinto candidato saca una carta: roja. Ahora la cosa ya no tiene gracia. Mientras el resto de los estudiantes que quedaban se sientan en su puestos, la protesta continúa, y la clase entera demanda sus galletas.

Así comienza uno de los capítulos del lbro «Introduction to Probability and Statistics using R«, del profesor G. Jay Kerns. ¿Por qué lo traigo aquí a colación? Porque el profesor Jay ha publicado el libro bajo licencia GFDL. Y es uno de los libros de introducción a la probabilidad y estadística más asequibles que he visto hasta ahora. Todos los ejemplos que muestra son interesantes y además, vienen con un apartado del estilo: «¿Cómo se hace / calcula esto en R?» (como sabréis los lectores de este blog, R es un lenguaje y entorno de programación para análisis estadístico y gráfico, con licencia GPL) que hace que los conceptos se te queden grabados (la práctica es lo que tiene…)

¿Queréis seguir leyendo el ejemplo de las cartas? Sigamos…

Ten en mente el experimento anterior cuando leas las siguientes secciones de este capítulo (cap. 10 del libro) sobre «Test de hipótesis». Cuando termines de leer el capítulo, vuelve aquí y lee la introducción de nuevo. Toda la jerga matemática que se usa está relacionada con los párrafos anteriores. Mientras tanto, te ayudaré a empezar a pensar en estos términos:

Hipótesis Nula: es una baraja de cartas (baraja inglesa) normal, barajada a conciencia.

Hipótesis Alternativa: o bien es una baraja trucada, o bien el profesor ha barajado con trampas.

Datos observados (muestra de la población): una secuencia de cartas sacadas de la baraja, 5 rojas consecutivas (!)

Si fuera un juego de cartas ordinario, bien barajado, la probabilidad de sacar 0 negras de una muestra de tamaño 5 (sin reemplazamiento) de una baraja de 26 cartas negras y 26 rojas, sería:

> dhyper(0, m = 26, n = 26, k = 5)
[1] 0.02531012

Hay dos temas muy importantes que quedan por tratar. El primero: al final todos los alumnos tuvieron su galleta. El segundo, los estudiantes, agresiva e invariablemente intentan siempre que el profesor enseñe las cartas de la baraja para comprobar si estamos hablando de una baraja normal o no. Nunca lo han conseguido 😉

¿Os gusta? Pues atentos a la jugada: aparte del PDF, el código fuente del libro, en LaTeX, también está disponible. ¿Salivais igual que los candidatos a ganar galletas? Pues leed esto, la traca final:

El profesor G. Jay Kerns, ha grabado en vídeo todas sus clases de introducción a la probabilidad y estadística usando R. TODAS. Y ha dejado los apuntes, vídeos (en distintos tamaños, incluído WebM, y versiones, incluída .3gp, para que puedas atender esas video-lecciones en tu móvil) y anotaciones disponibles para su descarga en la la web de su Universidad, bajo licencia GFDL.

Damas y caballeros, me quito el sombrero ante este señor. Chapeau!

Y por supuesto, aunque me lo he descargado en PDF y fotocopiado, ya he comprado una copia del libro en Lulu.com. Los 31 dólares mejor invertidos desde hace muuuuucho tiempo.

Estadísticas de contribuciones a LibreOffice

El hacker de Novell Cedric Bosdonnat ha publicado, usando el log que genera git con los commits de los contribuyentes de LibreOffice, un par de gráficos que muestran una tendencia muy interesante. Sobre todo el primero de ellos es revelador:

En el eje X se muestran las semanas del año, comenzando por la 37, hasta la 42 (actual). En el eje Y se muestra el número de desarrolladores que han contribuído de alguna forma a LibreOffice (bien en el core o bien en temas de localización). En la semana 38 se observa un punto de inflexión. Hasta ese momento los datos son iguales a los de OpenOffice.org, bajos. Pero a partir de la semana 38, cuando se anuncia LibreOffice, el número de contribuyentes comienza a aumentar, en especial el de *nuevos* colaboradores. A pesar de ser un muy buen dato, espero que mejore aún más, dado que las cifras, en valores absolutos, son bajas. Como dice Michael Meeks (uno de los principales hackers de LibreOffice), una buena forma de comenzar sería hincándole el diente a alguno de estos «Easy Hacks»

Microsoft crea un vídeo contra OpenOffice.org

¡Por fin! Ya empezaba a pensar que OpenOffice.org no le hacía nada de pupa a los de Redmond.

Aquí está el vídeo con las críticas (por cierto, buen montaje… valga la redundancia };-)

La parte en la que no he podido dejar de reírme es en la que una profesora afirma que sus alumnos han tenido peores notas por usar OpenOffice.org. Ya sabéis chicas y chicos, o pasáis por el aro o tendréis peores notas. ¡Habráse visto! ¡A quién se le ocurre salirse del pensamiento único! ¡Y en una escuela! Con lo bien que estamos todos con Microsoft Office, MS Windows, MS SQL Server y MS LoQueSea, cachis la mar.

Update: obviamente el ridículo de MS ha sido tal que han eliminado el vídeo de YouTube. Demasiado tarde, ya ha copias circulando por la red. Incluso con la misma calidad que el original !.

Cambiar el fondo de un PDF

Truco enviado por el profesor Gorka Prieto a la lista ITSAS:

Por si a alguien más le ha pasado que tiene que imprimir un PDF con fondo
oscuro (estos profes que dan las transparencias con cualquier formato … ;P)
y quiere ponerle un fondo blanco:

$ convert -density 300 input.pdf -fill "rgb(255,255,255)" -opaque
"rgb(29,5,114)" output.pdf

Enviar email con curl y GMail

Hago copy&paste de una entrada recibida hoy en CommandLineFu.com (una de las webs más útiles para el administrador de sistemas Linux, btw…)
curl -n --ssl-reqd --mail-from "<user@gmail.com>" --mail-rcpt "<user@server.tld>" --url smtps://smtp.gmail.com:465 -T file.txt
Sí, yo he pensado lo mismo, ¡aaargh! ¡cuántas veces necesité esto y me lié con el comando mail, la configuración de Sendmail, postfix, qmail o the kitchen sink…
El comando anterior requiere una versión de curl>=7.21  . Para guardar las credenciales, usad el fichero .netrc