Usted mencionó que tendría de 15 a 20 horas por semana para el desarrollo profesional. Eres afortunado eso es una gran cantidad de tiempo si se utiliza correctamente. Recomendaría varias cosas para acelerar sus habilidades en los próximos uno o dos años, enumerados en orden de prioridad pero en paralelo:
1) Vaya a la base de datos de aprendizaje automático de la UCI (con el título de Google) y pruebe muchos de los problemas. Establecer una meta para producir resultados razonables en 100 conjuntos de datos en dos años. Al principio, tomará más de lo requerido una semana por conjunto de datos, pero lo hará más rápido a medida que aprende, y al desarrollar sus propias herramientas para automatizar algunas tareas. Comience con las regresiones en Excel como una línea de base, y para conocer las limitaciones a las que se enfrenta la mayoría de las personas, luego concéntrese en R y cualquier complemento que desee probar.
2) Obtenga un mentor que se siente con usted para almorzar dos o tres veces al mes. Este mentor debe ser un científico de datos, un estadístico o un ingeniero con experiencia significativa en aprendizaje automático. Hable sobre los problemas y lo que se necesita para resolverlos. Muestre a su mentor los resultados de su proyecto UCI y sus métodos, y obtenga retroalimentación.
3) Lee como el infierno. Documentos académicos de aprendizaje automático, páginas de Wikipedia sobre conceptos y frases que no ha escuchado, libros sobre todo lo relacionado razonablemente con la teoría y la práctica de la ciencia de datos.
- ¿Por qué mi CGPA es bajo? ¿Cómo puedo mejorarlo?
- ¿Ir a una dieta de información mejora la productividad de uno?
- ¿Alguien tiene algunos ejercicios simples de escritura creativa?
- ¿Cómo puedo aprender a hacer psicoterapia conmigo mismo?
- ¿Cómo encuentro las preguntas más populares en Yahoo! Respuestas?
4) Tomar cursos en línea en temas relacionados.
Muévase rápido, no se deje atrapar por hacer pequeñas mejoras incrementales o intente mejorar los resultados publicados. Simplemente realice esta gran cantidad de proyectos en conjuntos de datos relativamente pequeños de UCI para que esté expuesto a una amplia variedad de problemas. Olvida lo “grande” en “big data” hasta más tarde. En este momento, necesita desarrollar su percepción intuitiva para resolver problemas, y cómo los diversos métodos de aprendizaje automático y estadístico difieren tanto en el enfoque como en los resultados. No se deje atrapar por la teoría académica, la adhesión religiosa a un solo método o lo último y nuevo. Solo resuelva los problemas y preste atención a cómo las diferentes medidas de éxito tienen implicaciones para el uso práctico de los resultados.
Durante los próximos dos años, minimice la cantidad de algoritmos y enfoques que desarrolle por sí mismo; el único desarrollo que debe hacer es utilizar scripts para el procesamiento previo de datos y la automatización de tareas repetitivas. Después de los dos años, sabrás si debes inventar y desarrollar algo. Se paciente; construye tu fundación primero
Y siempre escriba una pequeña declaración de problemas al comienzo de cada proyecto, y una declaración al final sobre cómo esto podría beneficiar a alguien, y calcule la magnitud del beneficio y cuántas personas en todo el mundo experimentarán ese beneficio en comparación con la regresión estándar. Como ejercicio mental, pregúntese cuánto podría cobrar por ese beneficio si la gente comprara su modelo. Este proceso te ayudará a mantenerte enfocado en los aspectos prácticos de tus habilidades. También lo ayudará a aprender a definir las métricas de éxito correctamente para cualquier conjunto de datos.
Haga esto durante dos años y avanzará sus habilidades de ciencia de datos más rápido que el 99% de los nuevos profesionales, y tendrá un cuerpo de trabajo asesino como un apéndice a su currículum.
Has hecho una gran elección de carrera. Ahora supera a tus compañeros. Buena suerte.