¿Cómo se relacionan las estadísticas con la especificación del modelo?

Primero, disipemos la noción de que incluso en física cualquier cosa es perfectamente predecible en el mundo real. Vaya lo suficiente hacia el lado derecho del punto decimal y encontrará diferencias de una situación a otra. El universo tiembla. Las variables cambian de valor. ¿Cuál será la temperatura mañana? ¿O una hora a partir de ahora? Mida el tiempo que tarda una bola en rodar por una pendiente, hasta el milisegundo, y hágalo en un laboratorio con condiciones controladas minuciosamente, y encontrará que los tiempos fluctúan. Ahora hazlo afuera, en un campo de hierba en un día ventoso y lluvioso. Para el caso, considere el famoso problema de los tres cuerpos.

Todos los modelos son incorrectos, como nos recuerda George Box, pero algunos modelos son útiles. Ningún modelo puede incluir todas las variables y sus niveles, por lo que eliminamos los que tienen solo efectos triviales y trabajamos con lo que queda. Y aun así, puede ser abrumador. Luego debemos preguntarnos si un modelo complicado vale la pena y si un modelo simple será suficiente. Después de todo, en la mayoría de los modelos, algunas variables tienen efectos de gran tamaño, por lo que incluir más simplemente refina un poco el modelo. Si nos atenemos a un modelo simple, ¿dará resultados suficientemente buenos para poder usarlos, sabiendo de antemano que habrá una variación considerable? A menudo la respuesta es sí. Y a menudo es posible que un modelo simple funcione bien para grupos de personas, pero no funcione para individuos. Si no necesita predecir comportamientos individuales, entonces un modelo simple es suficiente.

También puede identificar qué variables pueden hacer excepciones a su regla. La teoría del salario en la economía funciona así. Para la mayoría de los casos, sabemos cómo los salarios responden a los cambios en la oferta y la demanda, y podemos predecir esos cambios con una precisión notable. Pero habrá excepciones, y las conocemos principalmente a través de una larga experiencia.

La física y la estadística son comunes en los modelos matemáticos, pero cada uno tiene sus propias raíces.

La física es la descripción científica de las leyes universales que determinan nuestro mundo, es una ciencia exacta .

Las estadísticas son un poco más complejas de definir. Yo diría que es una ciencia que desarrolla reglas para investigar el mundo, sin poder proporcionar una prueba científica detrás.

Un modelo estadístico siempre está influenciado por elecciones subjetivas . Las conclusiones siempre pueden ser contradichas.

Puede elegir más o menos variables, una forma infinita de funciones (lineales, no lineales, redes neuronales …) varios métodos de estimación están disponibles. En la práctica nunca encontrarás el modelo perfecto. El mejor es el que mejor se ajuste al conjunto de datos observados.

Ejemplo : la relación entre altura y peso. La correlación positiva se puede probar, pero ¿cuánto es exactamente? Imposible decirlo, solo se puede aproximar .

Es muy frustrante y entiendo lo que quieres decir: ¡ el mundo no es lineal !

Pero las estadísticas no son matemáticas, es solo una herramienta de medición que intenta explicar fenómenos aleatorios o inobservables.