¡Leer! ¡Leer! ¡Leer!
Todos pensamos que lo sabemos, pero el aprendizaje es un proceso sin fin.
Uno no simplemente se “convierte” en un científico de datos. No sucede durante la noche o al recibir un título. Se necesita tiempo, esfuerzo, estudio, preguntas y mucho aprendizaje.
¡Aquí hay 10 libros que debes leer para el aprendizaje automático y la ciencia de datos!
- Después de engañar a mi novio, aprendí mi lección. Le prometí que lo haría mejor, así que me dijo que lo hiciera mejor. ¿Cómo puedo mejorarlo realmente y mostrarle que realmente me importa?
- ¿Cuáles son los diez libros sobre superación personal que cambian tu forma de pensar o que cambian tu vida?
- He estado en una rutina en la mayoría de los aspectos de mi vida. ¿Qué debo hacer para salir de mi zona de confort y desafiarme a mí mismo?
- ¿Puedo tener algún consejo para permanecer enfocado?
- Cómo cambiar tu vida en lugar de no hacer nada y drogarte todo el día
1. Think Stats: Probabilidad y estadística para programadores
Por Allen B. Downey
Think Stats es una introducción a Probabilidad y estadísticas para programadores de Python.
Think Stats hace hincapié en técnicas simples que puede utilizar para explorar conjuntos de datos reales y responder preguntas interesantes. El libro presenta un estudio de caso utilizando datos de los Institutos Nacionales de Salud. Se alienta a los lectores a trabajar en un proyecto con conjuntos de datos reales.
2. Programación probabilística y métodos bayesianos para hackers
Por Cam Davidson-Pilon
Una introducción a los métodos bayesianos y la programación probabilística desde el punto de vista computacional / comprensión-primero, matemática-segunda.
El método bayesiano es el enfoque natural de la inferencia, pero está oculto para los lectores detrás de los capítulos del análisis matemático lento. El texto típico sobre la inferencia bayesiana involucra dos o tres capítulos sobre teoría de la probabilidad, luego ingresa en lo que es la inferencia bayesiana. Desafortunadamente, debido a la complejidad matemática de la mayoría de los modelos bayesianos, al lector solo se le muestran ejemplos simples y artificiales. Esto puede dejar al usuario con un sentimiento de “inferencia” bayesiano. De hecho, esta fue la propia opinión previa del autor.
3. Comprender el aprendizaje automático: de la teoría a los algoritmos
Por Shai Shalev-Shwartz y Shai Ben-David
El aprendizaje automático es una de las áreas de más rápido crecimiento de la informática, con aplicaciones de gran alcance. El objetivo de este libro de texto es introducir el aprendizaje automático y los paradigmas algorítmicos que ofrece, de una manera basada en principios. El libro proporciona una explicación teórica de los fundamentos subyacentes del aprendizaje automático y las derivaciones matemáticas que transforman estos principios en algoritmos prácticos. Luego de una presentación de los conceptos básicos, el libro cubre una amplia gama de temas centrales no tratados en los libros de texto anteriores. Estos incluyen una discusión de la complejidad computacional del aprendizaje y los conceptos de convexidad y estabilidad; paradigmas algorítmicos importantes que incluyen el descenso de gradiente estocástico, redes neuronales y aprendizaje estructurado de salida; y conceptos teóricos emergentes como el enfoque de PAC-Bayes y los límites basados en la compresión.
4. Los elementos del aprendizaje estadístico.
Por Trevor Hastie, Robert Tibshirani y Jerome Friedman
Este libro describe las ideas importantes en estas áreas en un marco conceptual común. Si bien el enfoque es estadístico, el énfasis está en los conceptos más que en las matemáticas. Se dan muchos ejemplos, con un uso liberal de gráficos en color. Debe ser un recurso valioso para los estadísticos y cualquier persona interesada en la minería de datos en la ciencia o la industria. La cobertura del libro es amplia, desde el aprendizaje supervisado (predicción) hasta el aprendizaje no supervisado. Los muchos temas incluyen redes neuronales, máquinas de vectores de soporte, árboles de clasificación y potenciación, el primer tratamiento integral de este tema en cualquier libro.
5. Introducción al aprendizaje estadístico con aplicaciones en R
Por Gareth James, Daniela Witten, Trevor Hastie y Robert Tibshirani
Este libro proporciona una introducción a los métodos de aprendizaje estadístico. Está dirigido a estudiantes de pregrado de nivel superior, estudiantes de maestría y doctorado. Alumnos de las ciencias no matemáticas. El libro también contiene varios laboratorios de R con explicaciones detalladas sobre cómo implementar los diversos métodos en entornos de la vida real, y debe ser un recurso valioso para un científico de datos en ejercicio.
6. Fundamentos de la ciencia de datos.
Por Avrim Blum, John Hopcroft y Ravindran Kannan
Si bien las áreas tradicionales de la informática siguen siendo muy importantes, cada vez más investigadores del futuro participarán en el uso de computadoras para comprender y extraer información útil de datos masivos que surgen en las aplicaciones, no solo cómo hacer que las computadoras sean útiles en problemas específicos bien definidos. Con esto en mente, hemos escrito este libro para cubrir la teoría que probablemente será útil en los próximos 40 años, al igual que una comprensión de la teoría de autómatas, algoritmos y temas relacionados dio a los estudiantes una ventaja en los últimos 40 años.
7. Guía del programador para la minería de datos: el antiguo arte de Numerati
Por ron zacharski
Esta guía sigue un enfoque de aprender haciendo. En lugar de leer el libro de forma pasiva, lo aliento a que realice los ejercicios y experimente con el código Python que proporciono. Espero que participe activamente en la prueba y programación de técnicas de extracción de datos. El libro de texto se presenta como una serie de pequeños pasos que se construyen unos sobre otros hasta que, al momento de completar el libro, haya sentado las bases para comprender las técnicas de extracción de datos.
8. Minería de conjuntos de datos masivos
Por Jure Leskovec, Anand Rajaraman y Jeff Ullman
El libro se basa en el curso CS246 de Stanford Computer Science: conjuntos de datos masivos de minería (y CS345A: minería de datos).
El libro, al igual que el curso, está diseñado a nivel de licenciatura en ciencias de la computación sin requisitos previos formales. Para apoyar exploraciones más profundas, la mayoría de los capítulos se complementan con referencias de lecturas adicionales.
9. Aprendizaje profundo
Por Ian Goodfellow, Yoshua Bengio y Aaron Courville
El libro de texto Deep Learning es un recurso destinado a ayudar a los estudiantes y profesionales a ingresar en el campo del aprendizaje automático en general y del aprendizaje profundo en particular. La versión en línea del libro ya está completa y seguirá disponible en línea de forma gratuita.
10. Anhelo de aprendizaje automático
Por Andrew Ng
AI, Machine Learning y Deep Learning están transformando numerosas industrias. Pero construir un sistema de aprendizaje automático requiere que tomes decisiones prácticas:
- ¿Debes recopilar más datos de entrenamiento?
- ¿Debería utilizar el aprendizaje profundo de extremo a extremo?
- ¿Cómo lidias con tu conjunto de entrenamiento que no coincide con tu conjunto de prueba?
- y muchos más.
Históricamente, la única manera de aprender cómo tomar estas decisiones de “estrategia” ha sido un aprendizaje de varios años en un programa o empresa de posgrado. Estoy escribiendo un libro para ayudarte a adquirir rápidamente esta habilidad, para que puedas mejorar en la creación de sistemas de inteligencia artificial.
Gracias por la A2A!
PS ¡Todos los libros mencionados arriba son GRATIS!