¿Qué recomendaría a un lego que lea / estudie / vea / aprenda para poder hablar con conocimiento sobre ciencia de datos, análisis e ingeniería?

Algunos recursos que tienen una serie de conceptos introductorios explicados:

NoSQL Distilled fue el primer libro que leí sobre sistemas de bases de datos no tradicionales. El libro es realmente pequeño y fácil de seguir.

La ciencia de datos a escala es una especialización de Coursera centrada en la ciencia de datos en sistemas distribuidos. Fue construido especialmente para los usuarios menos tecnológicos, según el autor.

El aprendizaje estadístico es un curso en línea de Stanford sobre la aplicación estadística de los algoritmos de aprendizaje. Es intensivo en matemáticas, pero incluso si no entiende la parte de matemáticas, comprenderá los componentes básicos del aprendizaje automático, el significado, las tareas principales (regresión, clasificación y agrupamiento) y las técnicas principales (ingeniería de características, selección de modelos, evaluación). , etc). El enlace cambia a menudo, google “Stanford StatLearning” si el enlace está muerto.

Lee el libro, mira los videos del curso y toma notas. Dudo que hacer los ejercicios te ayude porque no los vas a aplicar. Habrá más que aprender más adelante, pero creo que estos deberían ser una buena base.

No te preocupes por mantenerlo anónimo, lo estás haciendo bien.

En tu caso, probaría el curso de Andrew Ng Coursera. Si lo encuentra demasiado difícil, encontraría cursos de Coursera / Edx sobre Cálculo (antes del cálculo, si fuera necesario), álgebra lineal y estadísticas, e intentaré nuevamente después de revisarlos.

Tenga en cuenta que hay asignaciones de codificación. Yo sugeriría pasar por los videos y los problemas de no codificación. Si sientes que comprendes lo suficiente, entonces no hay necesidad de hacer la codificación. Si sientes que no lo entiendes, entonces te recomendaría una introducción a la codificación utilizando cursos de Python en Coursera / Edx / Udacity.