Sobre el Libro
Análisis de datos bayesianos (Bayesian Data Analysis) es un libro de 675 páginas escrito por Andrew Gelman, John B. Carlin, Hal S. Stern, David B. Dunson, Aki Vehtari, Donald B. Rubin. Fue publicado por la editorial Chapman and Hall/CRC en el año 2013 en su tercera edición.
Descripción del Libro
Ganador del premio De Groot 2016 de la Sociedad Internacional de Análisis Bayesiano.
Ahora en su tercera edición, este libro clásico es ampliamente considerado el texto principal sobre métodos bayesianos, elogiado por su enfoque práctico y accesible para analizar datos y resolver problemas de investigación. Análisis de datos bayesianos, tercera edición sigue adoptando un enfoque aplicado al análisis utilizando métodos bayesianos actualizados. Los autores, todos líderes en la comunidad estadística, introducen conceptos básicos desde una perspectiva analítica de datos antes de presentar métodos avanzados. A lo largo del texto, numerosos ejemplos elaborados extraídos de aplicaciones e investigaciones reales enfatizan el uso de la inferencia bayesiana en la práctica.
Nuevo en la tercera edición:
- Cuatro nuevos capítulos sobre modelado no paramétrico.
- Cobertura de antecedentes poco informativos y antecedentes que evitan los límites.
- Discusión actualizada de la validación cruzada y los criterios de información predictiva.
- Supervisión mejorada de la convergencia y cálculos efectivos del tamaño de la muestra para la simulación iterativa.
- Presentaciones de Hamiltoniano Montecarlo, Bayes variacional y propagación de expectativas.
- Código de software nuevo y revisado.
El libro se puede utilizar de tres formas diferentes. Para los estudiantes de pregrado, introduce la inferencia bayesiana a partir de los primeros principios. Para los estudiantes de posgrado, el texto presenta enfoques actuales efectivos para el modelado y cálculo bayesiano en estadística y campos relacionados. Para los investigadores, proporciona una variedad de métodos bayesianos en estadística aplicada. Los materiales adicionales, incluidos los conjuntos de datos utilizados en los ejemplos, las soluciones a los ejercicios seleccionados y las instrucciones del software, están disponibles en la página web del libro.
Reseñas del Libro
«La segunda edición fue revisada en JASA por Maiti (2004) … ahora estamos 10 años después con un libro de texto aún más impresionante que realmente representa lo que debería ser el análisis de datos bayesianos. … esta tercera edición genera la pregunta ¿Qué hay de nuevo en comparación con la segunda edición? Bastante … este es verdaderamente el libro de referencia para un curso de posgrado sobre estadística bayesiana y no solo análisis de datos bayesianos».
―Christian P. Robert, Revista de la Asociación Estadounidense de Estadística, septiembre de 2014, vol. 109
Alabanza por la segunda edición:
… es simplemente el mejor libro moderno completo centrado en el análisis de datos disponible actualmente. … Hay suficiente material adicional importante aquí que aquellos con la primera edición deberían considerar seriamente actualizar a la nueva versión. … cuando los estudiantes o colegas me preguntan con qué libro deben comenzar para llevarlos lo más lejos posible en el camino hacia el análisis de sus propios datos, Gelman et al. ha sido mi respuesta desde 1995. La segunda edición hace que esta sea una opción aún más sólida.
―Lawrence Joseph, Hospital General de Montreal y Universidad McGill, Estadística en Medicina, Vol. 23, 2004
Estoy muy emocionado de tener este libro en la mano para complementar el material del curso y ofrecer a los colaboradores y clientes de investigación en nuestro laboratorio de consultoría métodos más sofisticados para resolver sus problemas de investigación.
―John Grego, Universidad de Carolina del Sur, EE. UU.
… fácilmente el libro más completo, erudito y reflexivo sobre el tema, y creo que hará mucho para promover el uso de métodos bayesianos.
―David Blackwell, Universidad de California, Berkeley, EE. UU.
Sobre los autores
Andrew Gelman es profesor de estadística y profesor de ciencia política en la Universidad de Columbia. Ha publicado más de 150 artículos en teoría estadística, métodos y computación, y en áreas de aplicación que incluyen análisis de decisiones, muestreo de encuestas, ciencias políticas, salud pública y políticas. Sus otros libros son Bayesian Data Analysis (1995, segunda edición 2003) y Teaching Statistics: A Bag of Tricks (2002).
Donald B. Rubin es profesor de estadística John L. Loeb en la Universidad de Harvard, donde ha sido profesor desde 1983 y director de departamento durante trece de esos años. Ha sido autor o coautor de casi cuatrocientas publicaciones (incluidos diez libros), tiene cuatro patentes conjuntas y ha realizado importantes contribuciones a la teoría y metodología estadísticas, particularmente en inferencia causal, diseño y análisis de experimentos y encuestas por muestreo, tratamiento de datos faltantes, y análisis de datos bayesianos. Rubin ha recibido la Medalla Samuel S. Wilks de la Asociación Estadounidense de Estadística, el Premio Parzen a la Innovación Estadística, el Fisher Lectureship y el Premio George W. Snedecor del Comité de Presidentes de Sociedades de Estadística. Fue nombrado Estadístico del Año por los capítulos de Boston y Chicago de la Asociación Estadounidense de Estadística. Es uno de los autores más citados en matemáticas y economía con casi 150.000 citas hasta la fecha.
Tabla de Contenido
- Parte I: Fundamentos de la inferencia bayesiana.
- Parte II: Fundamentos del análisis de datos bayesianos.
- Parte III: Computación avanzada.
- Parte IV: Modelos de regresión.
- Parte V: Modelos no lineales y no paramétricos.
A continuación se muestra un extracto del libro:
1 Probabilidad e inferencia
1.11 Los tres pasos del análisis de datos bayesianos
Este libro se ocupa de métodos prácticos para hacer inferencias a partir de datos utilizando modelos de probabilidad para cantidades que observamos y para cantidades sobre las que deseamos aprender. La característica esencial de los métodos bayesianos es su uso explícito de la probabilidad para cuantificar la incertidumbre en inferencias basadas en el análisis de datos estadísticos.
El proceso de análisis de datos bayesianos se puede idealizar dividiéndolo en los siguientes tres pasos:
- Establecimiento de un modelo de probabilidad total: una distribución de probabilidad conjunta para todas las cantidades observables y no observables en un problema. El modelo debe ser coherente con el conocimiento sobre el problema científico subyacente y el proceso de recopilación de datos.
- Condicionamiento de datos observados: cálculo e interpretación de la distribución posterior apropiada – la distribución de probabilidad condicional de las cantidades no observadas de interés final, dados los datos observados.
- Evaluar el ajuste del modelo y las implicaciones de la distribución posterior resultante: ¿qué tan bien se ajusta el modelo a los datos, si las conclusiones sustantivas son razonables y qué tan sensibles son los resultados a los supuestos del modelo en el paso 1? se puede modificar o ampliar el modelo y repetir los tres pasos.
Se han realizado grandes avances en todas estas áreas en los últimos cuarenta años, y muchos de ellos se revisan y utilizan en ejemplos a lo largo del libro. Nuestro tratamiento cubre los tres pasos, el segundo involucra la metodología computacional y el tercero un delicado equilibrio de técnica y juicio, guiado por el contexto aplicado del problema. El primer paso sigue siendo un gran obstáculo para gran parte del análisis bayesiano: ¿de dónde vienen nuestros modelos? ¿Cómo hacemos para construir especificaciones de probabilidad apropiadas? Proporcionamos algunas pautas sobre estos temas e ilustramos la importancia del tercer paso en la evaluación retrospectiva del ajuste de los modelos. Junto con las técnicas mejoradas disponibles para calcular distribuciones de probabilidad condicionales en el segundo paso, los avances en la realización del tercer paso alivian hasta cierto punto la necesidad de asumir la especificación correcta del modelo en el primer intento. En particular, se puede examinar y explorar la dependencia tan temida de las conclusiones de las distribuciones previas «subjetivas».
Una de las principales motivaciones del pensamiento bayesiano es que facilita una interpretación de sentido común de las conclusiones estadísticas. Por ejemplo, se puede considerar directamente que un intervalo bayesiano (de probabilidad) para una cantidad desconocida de interés tiene una alta probabilidad de contener la cantidad desconocida, en contraste con un intervalo frecuentista (de confianza), que se puede interpretar estrictamente sólo en relación con una cantidad desconocida. secuencia de inferencias similares que podría haber hecho en la práctica repetida. Recientemente, en la estadística aplicada, se ha puesto un mayor énfasis en la estimación de intervalos en lugar de la prueba de hipótesis. y esto proporciona un fuerte impulso al punto de vista bayesiano, ya que parece probable que la mayoría de los usuarios de intervalos de confianza estándar les den una interpretación bayesiana de sentido común. Uno de nuestros objetivos en este artículo es indicar hasta qué punto están justificadas las interpretaciones bayesianas de procedimientos estadísticos simples comunes.
En lugar de argumentar los fundamentos de la estadística (ver la nota bibliográfica al final de este capítulo para referencias a debates fundacionales), preferimos concentrarnos en las ventajas pragmáticas del marco bayesiano, cuya flexibilidad y generalidad le permiten hacer frente a problemas complejos. La característica central de la inferencia bayesiana. la cuantificación directa de la incertidumbre. significa que, en principio, no hay ningún impedimento para ajustar modelos con muchos parámetros y complicadas especificaciones de probabilidad multicapa. En la práctica, los problemas son de configuración y computación con modelos tan grandes, y una gran parte de este libro se centra en técnicas recientemente desarrolladas y aún en desarrollo para manejar estos desafíos computacionales y de modelado. La libertad para configurar modelos complejos surge en gran parte del hecho de que el paradigma bayesiano proporciona un método conceptualmente simple para hacer frente a múltiples parámetros. como discutimos en detalle desde el Capítulo 3 en adelante.
Fin del extracto.