Capítulo 1: Cómo sacar información relevante de una maraña de datos
Cólera en Londres - Media, mediana y moda - Florence Nightingale, Varianza y descición típica / Dos teclas - Cuartiles y percentiles - Porcentajes - Paradoja de Simpson - Caso de la panadería - Evolución de la altura de los españoles - Resumen del partido en elpais.com - Gráficos construidos con word - Relación entre peso y potencia en coches - Vino y muertes por enfermedad cardiaca - Al Gore frente a Patrick J. Buchanan - Trucos con las escalas - El desastre del Challenger

Capítulo 2: Cálculo de probabilidades: criterios para movernos un un mundo de incertidumbre
Historia del cálculo de probabilidades - Galileo y su estudio sobre los dados - Fermat, Pascal y el Caballero de Méré - Experimentos para estimar probabilidades - Francis Galton y el quincunx - Muertos por coz de caballo - Goles en la liga española - El perímetro torácico de los soldados - Ley de Stigler de los epónimos - Falsos positivos - El problema del cumpleaños - Compartir cumpleaños - La combinación ganadora sale dos veces - Números seguidos en la lotería primitiva

Capítulo 3: Conocer el todo mirando una parte
Peces en el lago - Taxis en una ciudad - Proporción de hogares con internet - El partido A aventaja al partido B - La pregunta del millón (tamaño de muestra) - Los zurdos viven menos (¿o no?) - Landon frente a Roosevelt - Sorteos polémicos para ir al servivio militar - Encuestas informales - ¿Sí o sí? Influencia de las preguntas - Sondeos electorales - Manteniendo la confidencialidad

Capítulo 4: Cómo razonamos para tomar decisiones. Eso que llamamos "contraste de hipótesis"
La historia de la catadora de té - Ronald A. Fisher - La significación del coeficiente de correlación - Distribución de la correlación de tres puntos - ¿Estaban equilibrados los dados? - Poca discrepancia (polémica con Mendel) - Fronteras para el p-valor

Capítulo 5: ¿Es mejor? ¿Es más eficaz? Cómo diseñar pruebas para responder a estas preguntas
La vacuna contra la poliomielitis - Aspirina e infarto - Tabaco y cáncer de pulmón - William S. Gosset - Cucharilla y cava - Melón en su punto - Aspirina y duración de las flores - Duración de las pilas - Bolsas de agua para espantar moscas

Referencia de los libros que aquí se citan



Capítulo 1: Cómo sacar información de una maraña de datos

Epidemia de cólera en Londres en 1854
La mejor presentación y discusión que conozco está en Tufte (1997) pp. 27-37.
Información abundante sobre John Snow, vida y obra:
http://www.ph.ucla.edu/epi/snow.html       [Arriba]


Media, mediana y moda
Sobre esto no hay mucho que añadir. En "55 Respuestas…" las dos primeras preguntas tratan sobre la mediana y sobre la media aritmética. Se pueden leer en Google books   [Arriba]

Florence Nightingale
La wikipedia contiene mucha información (especialmente la versión en inglés) y enlaces a otras fuentes más especializadas. He utilizado el libro "Florence Nightingale: Measuring Hospital Care Outcomes" que contiene una recopilación de textos de FN y comentarios sobre su obra, de los cuales me ha parecido especialmente interesante el de Duncan Neuhauser: "Florence Nightingale: A Passionate Statisitician".  Puede leerse en  Google Books   [Arriba]

Varianza y desviación típica /Dos teclas para la desviación típica
Más sobre estos temas, también en tono de divulgación se puede ver en el libro de las 55 Respuestas, preguntas 3 y 4. También en Google books  [Arriba]

Cuartiles y percentiles
Las tablas de percentiles de crecimiento de la OMS y otras similares están en: http://www.who.int/growthref/en/   [Arriba]

Porcentajes
La perla de que el 65% de los jóvenes está formado por el 50% de los chicos y el 15% de las chicas la encontraron Sara Fontdecaba y María Montón en el trabajo que realizaron sobre el uso de la estadística en la prensa (Recorte). Está resumido en el libro que publicamos en la FME "Estadística en Acción".   [Arriba]

Paradoja de Simpson
Un clásico en los textos de divulgación. Ver, por ejemplo: J.A. Paulos: "Un matemático lee el periódico", pag. 181. Un caso muy citado es el de la presunta discriminación de las mujeres en el acceso a la Universidad de Berkeley en 1973, donde hubo 8442 solicitudes de hombres y 4321 de mujeres, siendo los admitidos el 44% de los hombre y solo el 33% de las mujeres. Está explicado en un artículo de la revista Science.  [Arriba]

Caso de la panadería
Esta idea de producir con dos máquinas y dos operarios y que el problema esté solo en una de las máquinas para poner de manifiesto las posibilidades de los histogramas y del análisis estratificado de los datos tiene su origen en un ejercicio incluido en un texto de control de calidad, pero es un texto antiguo al que he perdido la pista. El ejemplo era de una panadería, pero podría ser una fábrica de embutidos o de cualquier otra cosa.   [Arriba]

Evolución de la altura de los españoles
Es típico que en las clases de estadística se pongan ejemplos sobre la distribución de las alturas. El gráfico está sacado de un artículo de la revista "Estadística Española" editada por el INE y de libre acceso en internet. [Arriba]

Resumen del partido en Elpais.com
Me gusta esta forma de resumir la marcha del partido. Creo que combina bien la sencillez con la cantidad de información. Un buen ejercicio sería intentar mejorar la información que se da sin complicar el gráfico ni dificultando su interpretación (seguramente no es fácil). Se podría añadir qué equipo tienen la posesión del balón en cada momento y en qué campo están jugando. Esta temporada (2010-11) utilizan otro tipo de representación. Creo que la anterior era mejor.   [Arriba]

Gráficos construidos con Word
Es muy cómodo realizar gráficos directamente con Word o Excel, pero me gustan más los gráficos limpios, claros y planos.  Casi todos los que hay en el libro se han construido con el paquete de software estadístico Minitab.   [Arriba]

Relación entre precio y potencia en coches
Los datos en formato Excel están aquí   [Arriba]

Vino y muertes por enfermedad cardiaca
Artículo del New York Times, tal como salió en la edición impresa: vista general, tabla. El texto del artículo también se puede leer en la web del NYT, pero no está la tabla de datos.
El famoso cardiólogo Valentín Fuster en "La Ciencia de la Salud" Planeta, Booket, pág. 184, dice: "A medida que hemos ido investigando cómo afectan las bebidas alcohólicas a la salud cardiovascular, hemos descubierto que los beneficios más importantes no se deben a componentes selectos del vino tinto como los taninos o el resveratrol sino al propio alcohol".  Al final parece que da lo mismo vino tinto que vino blanco, o que un poquito de whisky.
[Arriba]

Al Gore frente a Patrick J. Buchanan
David S. Moore, uno de los personajes más conocidos en este mundo de la innovación en la enseñanza de la estadística (y autor de libros de texto de mucho éxito) es el autor de la introducción de "Statistics: A Guide to the Unknown" de Roxy Peck et al. Es una introducción cortita (o se me hizo corta) que gira en torno a cinco ideas clave, una de las cuales es la conveniencia de representar los datos gráficamente. Como ejemplo utiliza este de los votos de Al Gore frente a los de Patrick Buchanan en las elecciones del 2000 en el Estado de Florida. Me pareció impresionante. No hacen falta muchas palabras para explicar que ahí pasó algo raro. 
Los datos los obtuve de http://uselectionatlas.org/RESULTS/index.html : ir al año 2000, en Results for an Individual State seleccionar Florida y en esta página ir a Results for and Individual County. También hay información muy interesante en la Wikipedia, pero no están los votos de Buchanan (y yo no me he atrevido a ponerlos). En formato Excel, los datos para construir el gráfico están aquí
[Arriba]

Trucos con las escalas
El libro clásico sobre cómo manejar y presentar los datos para que la gente saque la conclusión que uno quiere, es el de Darrell Huff: "How to Lie with Statistics" del que se han vendido miles de ejemplares desde que salió en 1954 y que todavía se puede comprar (ver en Amazon). Otro libro interesante es el de Stephen K. Campbell: "Equívocos y falacias en la interpretación de estadísticas".  [Arriba]

El desastre del Challenger
Una explicación muy clara, completa y bien documentada está en el texto de Tufte: "Visual Explanations".  Artículos publicados en revistas especializadas de estadística:  Risk Analysis of the Space Shuttle: Pre-Challenger Prediction of Failure ; Problems in Extrapolation Illustrated With Space Shuttle O-Ring Data . El físico Richard Feynman participó en la comisión que investigó el accidente y en uno de sus libros, publicado en español: "El placer de descubrir" incluye un capítulo (el 7) con su informe particular sobre este tema. [Gracias a Josep Ginebra por facilitarme estas referencias] [Arriba]


Capítulo 2: Cálculo de probabilidades: criterios para moverse en un mundo de incertidumbre

Historia del cálculo de probabilidades
Daniel Peña, en el primer capítulo de su libro "Fundamentos de Estadística" presenta la mejor síntesis que he leído (3 páginas) sobre la historia del cálculo de probabilidades. Una  buena referencia es: "A History of Probability and Statistics and Their Applications before 1750" de Anders Hald.  [Arriba]

Galileo y su estudio sobre dados
Un resumen bien explicado se encuentra en el texto de Langley (pág. 20). El libro de F.N. David contiene una explicación más detallada del contexto histórico (cap. 7) y la traducción (al inglés) del informe de Galileo (en el anexo 2).  [Arriba]

Fermat, Pascal y el Caballero de Méré
Me gustó como está explicado en la Enciclopedia Británica, buscando "early probability" (creo que cuando la consulté era gratis pero ahora -Sep. 2010- veo que hay que introducir el número de tarjeta de crédito incluso para el periodo de prueba gratuito de 30 días). También está explicado (en francés), en las primeras páginas del artículo:
http://smf4.emath.fr/Publications/Gazette/2003/97/smf_gazette_97_45-71.pdf  
[Arriba]

Experimentos para estimar probabilidades
La primera noticia sobre los experimentos de Kerrich y de Wollf y sus resultados la tuve en el libro de M.G. Bulner: "Principles of Statistics" (pág. 18). El artículo de Peter K. Dunn: "We Can Still Learn About Probability by Rolling Dice and Tossing Coins" publicado en Teaching Statistics, explica como experimentos sencillos (lanzar dados o monedas) puede ayudar a entender el concepto de probabilidad y, haciendo referencia a un texto de David Moore, cita también los experimentos y resultados de Buffon y K. Pearson.  [Arriba]

Francis Galton y el Quincunx
La vida y la obra de Galton, así como el contexto histórico en que se desarrollaron, está muy bien explicado en el libro de Stigler: "The History of Statistics" (cap. 8).
Se puede comprar un quincux y otro material para la enseñanza de la estadística en http://www.qualitytng.com/. En la Escuela de Ingenieros Industriales de Barcelona lo usamos desde hace ya bastantes años. Despierta expectación entre los estudiantes y se pueden realizar varias actividades (ej: visualizar el aumento de variabilidad por sobreajuste) pero, en general, las campanas no salen tan bonitas como aparecen en la foto (si se tienen 100 o 200 datos  -bolas- no hay que esperar que el perfil del histograma sea una campana perfecta).
En internet se pueden encontrar muchos applets que simulan el funcionamiento del quincunx. Uno que me gusta: http://www.jcu.edu/math/isep/Quincunx/Quincunx.html  
[Arriba]

Muertos por coz de caballo
La explicación de cómo se interpreta la frecuencia acumulada queda mucho clara si se tienen los datos desglosados por año y regimiento, tal como aparecen en la publicación original de Bortkiewicz. La tabla de la parte superior contiene los muertos por regimiento y año. En el regimiento G (primera fila) no murió nadie en el año 75, murieron 2 en el 76, otros 2 en el 77… En total hay 144 casillas que tienen un cero (una rayita), 91 casillas que tienen un 1, 32 casillas que tienen un 2…
Para tener el valor medio de muertos por casilla hay que ver que el total de muertos es: 1×91+2×32+3×11+4×2=196. Como hay 280 casillas, el número medio de muertos por casilla es 196/280=0,7. Con este valor medio y aplicando la fórmula de la distribución de Poisson se tiene que:
-Probabilidad de 0 muertos = 0,4966
-Probabilidad de 1 muerto = 0,3476 ; etc.
Una vez se tienen las probabilidades, multiplicando por 280 se tienen los valores esperados.
Cuando escribí el libro busqué los datos originales pero no los encontré. Reproduje la tabla tal como la vi en el texto de Bulmer, ahora veo que es muy parecida a la que aparece en el original (parte central de la página). Hay algo que no entiendo (mi alemán = 0): lo que parece la columna de valores esperados no coincide con los resultados que se obtienen. No sé si se está calculando otra cosa o hay algún error de cálculo o de redondeo. El texto completo se puede descargar aquí.   
[Arriba]

Goles en la liga española
Cuando escribí esto la última temporada de la que se tenían los datos completos era la 2008-09. El mejor resumen de resultados lo encontré en La Vanguardia del 1 de junio del 2009. También se tiene una buena aproximación si en vez de goles por equipo se toma como variable los goles por partido. Los datos y gráficos obtenidos, en formato Minitab, están aquí.   [Arriba]

El perímetro torácico de los soldados
Las aportaciones de Quetelet y su estudio sobre el torax de los soldados están en el libro de Ian Hacking: "La domesticación del azar", cap. 13. La cita que se reproduce está en la página 164.   [Arriba]

Ley de Stigler de los Epónimos
Stigler lo explica en el capítulo 14 de su libro: "Statisitcs on the Table".  Hay una lista de ejemplos en la wikipedia: http://en.wikipedia.org/wiki/List_of_examples_of_Stigler%27s_law   [Arriba]

Falsos positivos
Este es un ejemplo que aparece en muchos libros de divulgación, por ejemplo en el "El hombre anumérico" de Paulos (pag. 105), que también incluye en el planteamiento la posibilidad de falso negativo.  [Arriba]

El problema del cumpleaños
Esta es una carta que tiene en la manga el profesor de estadística para impresionar a sus alumnos (primero debe conseguir que vayan a clase unos 30, o más). Ojo, no hay que mostrarse demasiado seguro si no se tienen más de 40 estudiantes.
Puede utilizarse una hoja de Excel para obtener por simulación -sin necesidad de macros- la probabilidad de coincidencia (dos o más celebren su cumpleaños el mismo día). La versión para un grupo de 23 está aquí (con Excel 2007).  
[Arriba]

Compartir cumpleaños
Las alineaciones se publican en los diarios (y se pueden consultar por internet). Las fechas de nacimiento de los jugadores se pueden encontrar en las página web de los clubes, aunque alguna no está y hay que buscar por otros lados pero se acaba encontrando (a veces en la Wikipedia). Tampoco hay problema para encontrar en internet la fecha de nacimiento de los árbitros (se puede empezar poniendo su nombre en Google).  [Arriba]

La combinación ganadora sale dos veces
Los resultados de todos los sorteos están en: http://www.onlae.es/primitiva/historicoTodosLosSorteos.aspx
En formato Excel, hasta el 31-12-2009, están aquí. Verá que este archivo contiene varias hojas, la segunda es para ver si hay combinaciones repetidas y la tercera para dibujar el gráfico de probabilidad de coincidencia en función del número de sorteos.  
[Arriba]

Números seguidos en la primitiva
Enfoque estadístico: Analizar las combinaciones que han salido y contar en cuantas hay números repetidos. Está en la segunda hoja del archivo Excel comentado anteriomente.
Por simulación: También con Excel de una forma sencilla.
Analíticamente: Solución manuscrita del profesor Ramón Companys. 
[Arriba]


Capítulo 3: Conocer el todo mirando una parte

Peces en el lago
Descubrí esto en: http://ts.rsscse.org.uk/gtb/johnson3.pdf  y, como en otros muchos casos, la pista me la dio Roberto Behar.
Desde el punto de vista estadístico el tema es tratado con detalle por C.J. Kreps en "Ecological Methodology" (cap. 2). "Ecological Census Techniques", editado por W.J. Sutherland, trata también estos temas, con menos detalle en los métodos estadísticos pero incluyendo la descripción de sistemas de captura de distintos tipos de animales para poder aplicar estas técnicas (no solo se aplican a peces).
El libro "Ecología con números" de Josep Piñol y Jordi Martínez-Vilalta (profesores de la UAB) también comenta, aunque de forma breve (pág. 49) la estimación del tamaño de poblaciones mediante estas técnicas, pero lo más interesante es que incluye un CD con applets, uno de las cuales simula este proceso. Se puede acceder a través de internet. Están en:
http://www.ecologiaconnumeros.uab.es/Llibre/indexApplets.htm . La de marcaje y recaptura es la 3.1. 
[Arriba]

Taxis en una ciudad
Está inspirado en: http://ts.rsscse.org.uk/gtb/johnson.pdf . Al igual que el anterior sobre cómo contar los peces de un lago está en  http://ts.rsscse.org.uk/gtb/contents.html. Hay artículos muy interesantes en esta lista.
En Barcelona se edita una revista para taxistas (Revista Taxi): http://www.taxibarcelona.cat/tabid/965/Default.aspx  que incluye una lista del número de licencia de los taxistas que han encontrado objetos olvidados por los viajeros. Esta lista se puede considerar una muestra aleatoria de los números de licencia y a partir de ella (basta con un subconjunto de la muestra) hacer los cálculos. 
[Arriba]
 
Proporción de hogares con internet
La página web del INE (www.ine.es) es una gran fuente de información y de tablas de datos que pueden ser consultadas y también descargadas para trabajar con ellas. Ver INEbase: http://www.ine.es/inebmenu/indice.htm. La estimación del INE es que en 2009 el 54% de los hogares españoles tenían conexión a internet.
Es interesante leer el informe metodológico sobre la realización de las encuestas: http://www.ine.es/metodologia/t25/t25304506609.pdf  
[Arriba]

El partido A aventaja al partido B
El PP aventaja al PSOE en 3,6 puntos: http://www.elpais.com/articulo/espana/PP/aventaja/PSOE/36/puntos/elpepuesp/20091003elpepunac_7/Tes
Un titular correcto:
http://www.lavanguardia.es/premium/publica/publica?COMPID=53423164276&ID_PAGINA=22088&ID_FORMATO=9&turbourl=false
Seguro que el margen de error es de más de 1 punto:
http://www.lavanguardia.es/premium/publica/publica?COMPID=53572140113&ID_PAGINA=22088&ID_FORMATO=9    
[Arriba]

La pregunta del millón (tamaño de muestra)
Hoja de Excel para calcular tamaños de muestra. Aquí  [Arriba]

Los zurdos vivien menos (¿o no?)
Portada del The Washington Post y detalle de la noticia
El artículo publicado en 1993: http://ajph.aphapublications.org/cgi/reprint/83/2/265  
[Arriba]

Landon frente a Roosevelt
Una explicación detallada y clara de por qué falló la encuesta está en el artículo de Peverill Squire: "Why the 1936 Literary Digest Poll Failed". Es fácil encontrar en internet información sobre este tema.  [Arriba]

Sorteos polémicos servicio militar
Sobre el sorteo para el reemplazo de 1970 en EEUU hay comentarios en muchos libros, por ejemplo en "El hombre anumérico" (pág.: 199) o, con más detalle, en "Las matemáticas en la vida cotidiana" (pág. 195). Sobre el sorteo en España, el diario El País publicó la noticia y los detalles del problema probabilístico: aquí [Arriba]

Encuestas informales
Curiosa encuesta   [Arriba]

¿Si o si? Influencia de las preguntas
La encuesta que planteábamos está basada en la que comenta J.A. Paulos en "Un matemático lee el periódico" (pag. 32-33) sobre un cuestionario usado (creo, la redacción no está clara) por Ross Perot, que fue candidato a la presidencia de los EEUU.  [Arriba]

Sondeos electorales
Son interesantes los artículos:
Pedro Delicado y Frederic Udina: "¿Cómo y cuando fallan los sondeos electorales?" Revista de Investigaciones Sociológicas, Nº 96 (2001), pp. 123-152:  http://dialnet.unirioja.es/servlet/articulo?codigo=758575
Fermín Bouza: "Comunicación Política: Encuestas, Agendas y Procesos Cognitivos Electorales". Praxis Sociológica, nº 3 (1998), pp. 49-58: http://www.ucm.es/info/socvi/BOUZA/NUEVA1/Textos/Comupoli.pdf  
[Arriba]

Manteniendo la confidencialidad
El profesor Pedro Delicado organizó una encuesta informal para estimar la proporción de estudiantes que habían copiado alguna vez en la FME (en el contexto de las actividades que se realizan el día del Forum de la FME, con un carácter más bien lúdico). Como se trata de una pregunta "indiscreta", a los entrevistados se les hizo sacar primero una carta de una baraja... etc.
Seguramente la estimación que salió no era muy fiable por el ambiente en que se desarrollo la encuesta, pero sin duda sirvió para que los estudiantes que participaron entendieran que es posible mantener la confidencialidad de las respuesta incluso ante el que las anota. El prof. Delicado también preparó dos hojas explicando cómo realizar la estimación.
[Arriba]



Capítulo 4: Cómo razonamos para tomar decisiones (eso que llamamos "contraste de hipótesis")

La historia de la catadora de té
Solo insistir en lo excelente del libro de David Salzburg: "The Lady Tasting Tea" que empieza con esta anécdota de Fisher y la catadora de té, pero que va mucho más allá repasando la historia de la estadística en el siglo XX.
El texto escrito por Fisher sobre el contraste de hipótesis en torno a la historia de la catadora de té (en "The Design of Experiments") también se encuentra en la recopilación de textos clásicos de las matemáticas editada por James Newman: "The World of Mathematics" (4 volúmenes en la asequible editorial Dover). Esta colección fue traducida al español y publicada por editorial Grijalbo con el título: "Sigma. El Mundo de las matemáticas" (6 volúmenes) agotada, pero suele encontrarse en las bibliotecas. 
[Arriba]

Roland A. Fisher
La biografía más citada de Fisher es la que escribió su hija Joan Fisher Box (estuvo casada con el estadístico George Box), pero está agotada y los precios de los ejemplares de segunda mano son muy altos.
El libro de David Salsburg explica muchas cosas sobre Fisher, además de la historia de la catadora de té. También la wikipedia (mejor en inglés) contiene una biografía muy completa y enlaces a otras fuentes de información. 
[Arriba]

La significación del coeficiente de correlación
Me gusta esta forma de introducir el contraste de hipótesis, construyendo la distribución de referencia por simulación. Si se hace una macro con Minitab (u otro paquete de software estadístico, como R) se evita tener que programar el cálculo del coeficiente de correlación. La macro de Minitab para calcular 10.000 valores (se puede cambiar) del coeficiente de correlación para dos conjuntos de 35 valores independientes tiene este aspecto [Arriba]

Distribución de la correlación de 3 puntos
Descubrí esta curiosidad en un libro ya antiguo, pero que tiene cosas interesantes que no he visto en otros sitios. Alder y Roessler: "Introduction to Probability and Statistics". Puede comprobarse con la macro anterior poniendo tamaño de muestra igual 3.  [Arriba]

¿Estaban equilibrados los dados?
Otra forma de introducir el contraste de hipótesis es jugando a detectives. Una macro de Minitab para realizar 10.000 simulaciones de los resultados obtenidos al lanzar 20.000 veces un dado y determinar la máxima discrepancia está aquí. En FreeBasic (www.freebasic.net) un programa que hace lo mismo, pero mucho más rápido, tiene este aspecto [Arriba]

Poca discrepancia… (polémica Fisher-Mendel)
Había pensado ponerme a analizar los datos a fondo para sacar mis propias conclusiones pero he desistido. El tema es más complicado de lo que pensaba, y no solo es un problema de estadística sino que también entran en consideración aspectos relacionados con la genética y la botánica, que no conozco en absoluto.
Un libro reciente (2008) que ofrece un panorama muy completo de esta controversia, es el de Allan Franklin et al.: "Ending the Mendel-Fisher Controversy". Dice la contraportada: "This volume contains an overview of the controversy; the original papers of Mendel and Fisher; four of the most important papers on the debate; and new updates, by the authors, of the latter four papers. Together, these voices argue for an end to the controversy-making this book the definitive last word on the subject." Las conclusions son estas. Nada que añadir.  
[Arriba]

Fronteras para el p-valor
También existe controversia con esto de los valores frontera (o valores críticos, o lo que llamamos "nivel de significación" o error tipo I). Algunos autores de prestigio (como George Box) desdeñan el uso de estos valores críticos. La idea es que el análisis estadístico aporta el p-valor, que es una medida de la compatibilidad de nuestros datos con la hipótesis nula, y ahí se queda. Si el p-valor es pequeño lo razonable será rechazar la hipótesis nula, mientras que si es grande no se rechazará. Lo que significa pequeño o grande no es algo que esté en el ámbito del análisis estadístico sino que es de la incumbencia del que debe tomar la decisión, que deberá atender al p-valor y a otros aspectos como las consecuencias que tiene el equivocarse al tomar la decisión.   [Arriba]



Capítulo 5: ¿Es mejor? ¿Es más eficaz? Cómo diseñar pruebas para responder a estas preguntas

La vacuna contra la poliomielitis
Prácticamente todo está sacado del libro de J.M. Tanur et al.: "La Estadística: Una guía de lo desconocido", capítulo 1: "El mayor experimento de la historia en el campo de sanidad púbica: la gran vacuna de Salk contra la poliomielitis (1954)", escrito por Paul Meier. Algunos detalles sobre la poliomielitis y la situación actual de la enfermedad los leí en la wikipedia.
Lamentablemente este libro está agotado desde hace tiempo. Creo que en inglés también está agotado pero se puede comprar de segunda mano. No confundir con el de Roxy Peck et al., con el mismo título y estilo, también muy bueno, pero que no es el mismo. 
[Arriba]

Aspirina e infarto
Este estudio está explicado en algunos libros de texto, como el de Mendenhall et al.: "Introductions to Probability & Statistics". Pp. 379-380. También en AAVV: "Las matemáticas en la vida cotidiana" Pag.: 160.
Informe preliminar: http://www.nejm.org/doi/full/10.1056/NEJM198801283180431
Informe final: http://www.nejm.org/doi/pdf/10.1056/NEJM198907203210301
Noticia en el NYT: http://www.nytimes.com/1988/01/27/us/heart-attack-risk-found-to-be-cut-by-taking-aspirin.html  
[Arriba]

Tabaco y cáncer de pulmón
AAVV: "Las matemáticas en la vida cotidiana" Pag.: 164
También en Snedecor y Cochran, Pág. 13  
[Arriba]

William S. Gosset
De nuevo "The Lady Tasting Tea" es una referencia amena y bien documentada sobre el Sr. "Student" (Cap. 3). Además, como no, la wikipedia (en inglés) es una buena fuente de información, con enlaces a su artículo 'The Probable Error of a Mean', donde explica la famosa distribución t de Student, y a otro de S.L. Zabel: "On Student's 1908 Aricle 'The Probable Error of a Mean'" publicado en JASA con motivo del centenario de la aparición del primero y en el que se hace un repaso a la vida de Gosset, a sus aportaciones y al entorno en que se desarrollaron.  [Arriba]

Cucharilla y cava
Esta debe estar en el "top ten" de las leyendas urbanas. Nunca he hecho el experimento con cava pero sí con Fanta de naranja (pero cuidando todos los detalles, por supuesto).Los catadores fueron mis alumnos de la diplomatura de estadística de la UPC y constatamos que no hay diferencia entre dejar la botella abierta con o sin cucharilla.
En un librito titulado "Hierro en las espinacas… y otras creencias" se incluye un pequeño apartado sobre este tema, firmado por Hervé This. Después de una introducción al tema, dice:
"En 1995, el equipo de físico-químicos del Centro Interprofesional de los Vinos de Champaña, en Épernay, llevó a cabo una obra de utilidad pública al desarrollar un programa de investigación serio y completo: tras haber vaciado parcialmente muchas botellas de la misma cosecha descorchadas al unísono determinaron las variaciones de la presión del gas en el curso del tiempo. Algunas botellas abiertas no tenían cucharilla; otras la incluían de plata o de metales distintos; otras, a su vez, estaban cerradas por un tapón hermético y un cuarto lote, por una cápsula.
Gracias al estudio en cuestión este problema acuciante ha quedado por fin resuelto: la cucharilla en el cuello de la botella no sirve para nada, mientras que los tapones -herméticos, naturalmente- conservan la presión del champan
".
Al final se incluye una referencia al estudio mencionado: "Champagne et petite cuiller", informe "Science et gastronomie", en "Pour la Science", marzo de 1995. Pero todavía no lo he conseguido. 
[Arriba]

Melón en su punto
Cuando se dice que si la prueba se hace dos veces la probabilidad de que acierte por azar es del 4%, se supone que se repite todo desde el principio, con cinco melones diferentes. Aquí un problema añadido respecto a la catadora de té es que las diferencias entre el mejor melón y los otros puede ser grande o pequeña.   [Arriba]

Aspirina y duración de las flores
En internet hay muchos comentarios sobre este tema, a favor y en contra, pero no he encontrado ninguna referencia a un estudio serio que dirima la cuestión (quizá para los expertos está tan claro que no hace falta estudio).
Un comentario que me parece sensato es: http://www.gardenguides.com/video-59477-aspirin-preserve-cut-flowers.html  
[Arriba]

Duración de las pilas
Construí un aparato para medir la duración de las pilas mucho más complicado que el representado en el libro. Básicamente consistía en una linterna que iluminaba una célula fotoeléctrica. Mientras duraba la pila se iluminaba la CF y se mantería cerrado el circuito que alimentaba el despertador, cuando la pila se acababa la linterna dejaba de iluminar, se abría el circuito y se paraba el despertador (también de agujas, por supuesto). Pero hubieron problemas no previstos (lo habitual): la bombilla de la linterna se fundía continuamente, seguramente por estar metida en una caja cerrada, sin ventilación, y la temperatura subía mucho alrededor de la bombilla. La caja, de madera, no era totalmente opaca… Un estudiante (Daniel Alcaide, de la diplomatura de estadística) me sugirió ese otro sistema, sin necesidad de caja ni de célula fotoeléctrica…
En la comparación de las pilas, el único aspecto a considerar no es la duración media, sino la variabilidad en su duración.  
[Arriba]

Bolsas de agua para espantar moscas
También hay mucha controversia en internet pero no he encontrado referencias a estudios serios. Tenemos una tarea pendiente. Curiosidad: "Bolsas de plástico" de diseño con explicación del por qué funcionan: http://www.josedelao.info/Jose_de_la_O/anti-fly.html (parece que va por la segunda edición).  [Arriba]




Referencia de los libros que aquí se citan

Alder, Henry L. y Roessler, Edward B.: "Introduction to Probability and Statistics". W. H. Freeman, 1968 (la primera edición es de 1960)

Autores Varios: "Las matemáticas de la vida cotidiana". Addison-Wesley/AUB, 1999

Behar, R. y Grima, P.: "55 Respuestas a dudas típicas de estadística". Díaz de Santos, 2004

Bouvet, Jean-François: "Hierro en las espinacas ...y otras creencias". Suma de Letras S.L. (colección Punto de Lectura), 2000

Bulmer, M.G.: "Principles of Statistics". Dover, 1979 (reedición del original publicado en 1967).

Campbell, Stephen K.: " Equívocos y falacias en la interpretación de estadísticas". Limusa, 1974

David, F.N.: "Games, Gods and Gambling. A History of Probability and Statistical Ideas". Dover 1998 (reedición del original publicado en 1962)

Feynman, Richard P.: "El placer de descubrir". Ed. Crítica, 2001

Fisher, Ronald A.: "The Design of Experiments".  Oliver and Boyd, 1951 (sexta edición)

Franklin, A. et al.: "Ending the Mendel-Fisher Controversy". University of Pittsburgh Press, 2008

Fuster, Valentin: "La ciencia de la salud". Planeta, booket, 2006.

Hald, Anders: "A History of Probability and Statistics and Their Applications before 1750" Wiley, 2003

Huff, Darell: "How to Lie with Statistics".  W.W. Norton & Company, 1954

Ian Hacking: "La domesticación del azar". Gedisa editorial, 1991.

Krebs, Charles J.: "Ecological Methodology". Addison-Wesley, 1999

Langley, Russell: "Practical Statistics Simply Explained". Dover, 1971 (reedición del original publicado en 1968).

Paulos, John Allen: "El hombre Anumérico". Tusquets, Metatemas, 1990

Paulos, John Allen: "Un matemático lee el periódico". Tusquets, Metatemas, 1997

Peck, R. et al.: "Statistics: A Guide to Unknown" fourth edition. Thompson, 2006.

Peña, Daniel: "Fundamentos de Estadística" Alianza, 2001

Piñol, J. y Martinez-Vilalta, J.: "Ecología con números". Lynx, 2006

Salsburg, David: "The Lady Tasting Tea. How Statistics Revolutionized Science in the Twentieth Century". W. H. Freeman, 2002

Stephen M. Stigler: "Statistics on the Table". Harvard University Press, 1999

Stephen M. Stigler: "The History of Statistics". Belknap Press of Harvard University Press, 1986

Sutherland, Wiliam J. (editor): "Ecological Census Tecniques". Cambridge, 2006

Tanur, Judith M.: "La Estadística: Una guía de lo desconocido". Alianza Editorial, 1989. Original en inglés: "Statisitcs: A Guide to the Unknown". Brooks/Cole, 1989 (creo que también agotado pero se puede comprar muy barato de segunda mano. No confundir con el de Roxy Peck et al.)

Tufte, Edward R.: "Visual Explanations". Graphics Press, 1997.

Varios autores: "Florence Nightingale: Measuring Hospital Care Outcomes". Editado por: Joint Commission on Accreditation of Healthcare Organizations (USA), 1999.  
[Arriba]




Aquí se incuyen referencias, comentarios y material adicional.

Puede ser de interés para personas que deseen profundizar en algún tema, en particular para profesores que lo quieran utilizar como material didáctico y quieran tener un conocimiento más detallado.
Principal > Más sobre "La certeza absoluta y otras ficciones"