Desde una perspectiva académica, todo se reduce a la respuesta de Chris:
Tres razones: precisión, eficiencia y flexibilidad.
Desde una perspectiva empresarial:
- Permite nuevas aplicaciones, debido a una mayor precisión.
- Tener un reconocimiento de imagen “suficientemente bueno” habilita aplicaciones relacionadas con imágenes, como la búsqueda de imágenes basada en la imagen, no etiquetas en la imagen. Teníamos métodos previamente, pero no lo suficientemente buenos para ser comercialmente atractivos.
- Tener un reconocimiento de voz suficientemente bueno, tal vez en entornos ruidosos, permite, por ejemplo, aplicaciones móviles que podrían tener reconocimiento de voz en el núcleo de su flujo de trabajo. Nuevamente, tuvimos reconocimiento de voz, pero no lo suficientemente bueno como para confiar en él como una función principal.
- Muchas aplicaciones más sofisticadas, como el aprendizaje multimodal, es tener diferentes tipos de entrada (por ejemplo, imagen, texto) y hacer cosas interesantes al tener una representación común para ambos tipos.
- Hace que el desarrollo de sistemas relevantes sea más rentable, principalmente debido a la transferibilidad de los algoritmos y la menor necesidad de conocimiento de dominio (sin ingeniería de características).
- La búsqueda de imágenes de aprendizaje profundo de Baidu, dirigida por Andrew Ng, contó con una base de código cinco veces reducida de la implementación anterior.
- El fundador (?) De Kaggle, en una popular charla de TED, destacó que un grupo de personas logró desarrollar un conjunto diverso de sistemas de LD en solo un par de años, para mostrar el enorme valor agregado que un pequeño grupo de personas puede tener ( para los cuerpos, lea $).
- Recuerdo una conversación en Google de Andrew Ng, donde señalaba que un solo grupo de investigación (DL) logró obtener los mejores resultados en varios conjuntos de datos de evaluación comparativa en diferentes dominios (imagen, habla, video), superando a los equipos que llevaban años de experiencia en algunos de estos dominios.
- La mejor parte es que normalmente obtiene ambas ventajas en el mismo cuadro: menor costo de desarrollo Y mayor precisión que permite nuevas ideas.
- ¿Qué motiva a las personas a trabajar en la economía del intercambio y cómo muchas personas trabajan en múltiples negocios / conjuntos de habilidades?
- Siento que quiero probar nuevos deportes, pero me temo que es demasiado tarde para comenzar un deporte completamente nuevo. ¿Debería hacerlo de todos modos y arriesgarme a estar en una clase de niños pequeños o simplemente hacer ejercicio de otra manera?
- Cómo sentir cuando todo sale mal en tu vida.
- ¿Cuándo te diste cuenta que la vida no va a ser fácil?
- ¿Qué pensarían las computadoras de los humanos si pudieran volverse conscientes de sí mismos?