¿Cómo determina una cámara si un objeto está enfocado o no?

Muy muy interesante pregunta! Me alegro de haber encontrado esto.

Hay muchas maneras de averiguar si un objeto está enfocado o no. Pero la forma más intuitiva es observar los bordes.

Antes de seguir, eche un vistazo a la imagen de abajo.


Sí, como has notado correctamente, es la Torre Eiffel de París. La imagen derecha es la imagen enfocada correctamente, mientras que la imagen izquierda está desenfocada. OK, fuera de foco de una manera bastante mala, o artística. Depende de cómo alguien quiera mirarlo.

Tomemos un ejemplo más fácil, algo que es muy intuitivo. Imagina que estamos captando una pequeña mancha de luz, que normalmente ocuparía solo un píxel en nuestro sensor. En aras de la facilidad, asumamos la condición de iluminación, y todos los demás aspectos son perfectos para el escenario.

Si la lente está enfocada correctamente por la lente, entonces, como he mencionado, la partícula ocupa solo un píxel en la imagen resultante. Sin embargo, si está fuera de foco, podría abarcar varios píxeles.

Aquí está el resultado de la simulación de lo que acabo de explicar.
Como podemos observar, la intensidad se difumina y se extiende a través de varios píxeles una vez que la lente está fuera de foco.

Hasta ahora tan bueno. ¿Cómo se las arregla realmente la cámara?

Introduzca el dominio de la frecuencia.

Cuando configuramos el modo de nuestra cámara en el modo de enfoque automático, una vez que apuntamos una cámara hacia un objeto, la cámara realiza varias operaciones internamente para verificar la frecuencia bidimensional de la imagen. Luego, según los sistemas mecánicos, la lente se ajusta de tal manera que la frecuencia se maximiza. Tenga en cuenta que cuanto más nítida es una imagen, es decir, menor es el desenfoque, mayor es la frecuencia de la imagen. (Se puede calcular muy fácilmente usando softwares como Matlab o Octave).

La cámara puede usar varios métodos de varias maneras para realizar el enfoque automático. Hay muchos trabajos de investigación que abordan este problema. Aquí está un ejemplo de tal papel.
Un algoritmo paramétrico no lineal para el enfoque automático basado en contraste.

Espero haber respondido la pregunta.

El enfoque automático toma imágenes a diferentes distancias focales y toma la que tiene el desenfoque mínimo. Así que la clave es determinar el brillo de una imagen.
Además de la excelente respuesta de Suraj K en el dominio de la frecuencia, hay un enfoque fácil en el dominio espacial. No sé si este método se está aplicando en cámaras digitales modernas, pero da buenos resultados para nuestro sistema de captura de documentos basado en dispositivos móviles. El método es como sigue :

El enfoque / fuera de foco está determinado por la fuerza de los bordes. Si el objeto tiene bordes afilados, se considera que está enfocado. Los bordes afilados se pueden encontrar aplicando un operador ‘laplaciano’ en el dominio espacial.

Detección del borde laplaciano

Verifique la intensidad más alta o la enésima más alta de la imagen resultante. Si la imagen original estaba desenfocada, el operador laplaciano da un valor muy bajo para los píxeles del borde. Variando el enfoque de la lente de la cámara y calculando los valores de la imagen laplaciana para cada enfoque, se puede determinar el mejor punto focal.

Hay un montón de sensores de imagen (más de dos) en cada cámara. Tomemos un ejemplo de una cámara con dos sensores de imagen. Cuando los sensores de imagen de ambas cámaras son idénticos y coinciden exactamente, la cámara “aprueba” que el objeto esté enfocado.

Los sensores de enfoque automático de la cámara comprueban el contraste del sujeto, la continuidad de las líneas y la detección de fase más comúnmente (la luz se hace viajar a través de dos caminos diferentes y la cámara mide la diferencia de fase en los dos)

Más información, por favor consulte – Mantenerse enfocado