¿Cómo puede uno llegar a ser realmente bueno en ingeniería de características?

La mejor manera de ser realmente bueno en ingeniería de características es por experiencia y práctica.

Recomiendo simplemente practicar en las competiciones de Kaggle . Para aquellos de ustedes que no han oído hablar de Kaggle, Kaggle es una plataforma para ejercicios y competiciones de modelado predictivo, y tiene algunos recursos fantásticos para científicos de datos nuevos y aspiracionales.

Las competiciones Kaggle son particularmente adecuadas para la ingeniería de características, ya que los datos ya están limpios (generalmente) para usted, y usted se enfoca en las partes más divertidas de la ingeniería de características, la extracción de características, el ajuste de modelos y la selección de modelos. Definitivamente recomiendo las competiciones de “inicio” o “patio de recreo” para comenzar, ya que las competiciones por dinero son generalmente demasiado complicadas para ser un buen ejercicio instructivo.

Algunas de las habilidades complementarias de la ingeniería de características incluyen la visualización , para ayudarlo a comprender las relaciones entre varias características y el conocimiento del dominio , de modo que pueda probar hipótesis basadas en su propio conocimiento del tema. También recomendaría aprender a realizar el análisis de componentes principales , ya que es muy relevante para la ingeniería / selección de características.

Buena suerte y echa un vistazo a este cuaderno para ver buenos ejemplos de ingeniería de características: http://nbviewer.jupyter.org/gith…

También revise esta pregunta relacionada: ¿Cuáles son algunas de las mejores prácticas en ingeniería de características?