¿Cuáles son las principales razones de la popularidad del aprendizaje profundo?

Desde una perspectiva académica, todo se reduce a la respuesta de Chris:

Tres razones: precisión, eficiencia y flexibilidad.

Desde una perspectiva empresarial:

  1. Permite nuevas aplicaciones, debido a una mayor precisión.
    1. Tener un reconocimiento de imagen “suficientemente bueno” habilita aplicaciones relacionadas con imágenes, como la búsqueda de imágenes basada en la imagen, no etiquetas en la imagen. Teníamos métodos previamente, pero no lo suficientemente buenos para ser comercialmente atractivos.
    2. Tener un reconocimiento de voz suficientemente bueno, tal vez en entornos ruidosos, permite, por ejemplo, aplicaciones móviles que podrían tener reconocimiento de voz en el núcleo de su flujo de trabajo. Nuevamente, tuvimos reconocimiento de voz, pero no lo suficientemente bueno como para confiar en él como una función principal.
    3. Muchas aplicaciones más sofisticadas, como el aprendizaje multimodal, es tener diferentes tipos de entrada (por ejemplo, imagen, texto) y hacer cosas interesantes al tener una representación común para ambos tipos.
  2. Hace que el desarrollo de sistemas relevantes sea más rentable, principalmente debido a la transferibilidad de los algoritmos y la menor necesidad de conocimiento de dominio (sin ingeniería de características).
    1. La búsqueda de imágenes de aprendizaje profundo de Baidu, dirigida por Andrew Ng, contó con una base de código cinco veces reducida de la implementación anterior.
    2. El fundador (?) De Kaggle, en una popular charla de TED, destacó que un grupo de personas logró desarrollar un conjunto diverso de sistemas de LD en solo un par de años, para mostrar el enorme valor agregado que un pequeño grupo de personas puede tener ( para los cuerpos, lea $).
    3. Recuerdo una conversación en Google de Andrew Ng, donde señalaba que un solo grupo de investigación (DL) logró obtener los mejores resultados en varios conjuntos de datos de evaluación comparativa en diferentes dominios (imagen, habla, video), superando a los equipos que llevaban años de experiencia en algunos de estos dominios.
  3. La mejor parte es que normalmente obtiene ambas ventajas en el mismo cuadro: menor costo de desarrollo Y mayor precisión que permite nuevas ideas.

Tres razones: precisión, eficiencia y flexibilidad.

Los avances en hardware han hecho posible abordar problemas con redes neuronales profundas en un tiempo razonable.

Ahora que es una solución viable, el aprendizaje profundo ha establecido muchos registros nuevos para una clasificación precisa en conjuntos de datos de referencia en los últimos años. Aquí hay una lista no exhaustiva que compilamos de las hazañas del aprendizaje profundo: la precisión del aprendizaje profundo

En la competencia de ImageNet del 2013, todos los competidores utilizaron alguna variación de una red neuronal profunda, lo que significa que el algoritmo compite principalmente consigo mismo. Otros no se acercan en muchas situaciones.

El aprendizaje profundo extrae automáticamente las características mediante las cuales se clasifican los datos, a diferencia de los algoritmos de aprendizaje automático más tradicionales, que requieren un tiempo y un esfuerzo intensos por parte de los científicos de datos. Las características que logra extraer son más complejas que las creadas a mano, debido a la jerarquía de características posible en una red profunda; también son más flexibles y menos frágiles, porque la red puede continuar aprendiendo sobre datos no supervisados.

El aprendizaje profundo es una variación de las técnicas de redes neuronales que son una tecnología antigua. sin embargo, el surgimiento de especificaciones de hardware permitió la posibilidad de crear y probar grandes redes neuronales en tiempo eficiente y luego se desarrollan diferentes algoritmos para garantizar la convergencia de la precisión de la capacitación y las pruebas.
De modo que, en mi humilde opinión, el aprendizaje profundo está logrando las promesas de las redes neuronales artificiales de los 80.
En otro punto, el aprendizaje profundo depende de aprender las características del objeto en lugar de extraerlas. Por eso es muy útil cuando no sabes qué conjunto de características puede describir con precisión tus objetos.