Hombre, están en todas partes. Aquí hay un pequeño ejemplo de la visión por ordenador. Aquí hay un edificio:
Aquí está el mismo edificio, desde un ángulo diferente:
- ¿Cómo manejo el bajo BP en mi vida rutinaria?
- Mirando hacia atrás en 2015, ¿por qué estás más agradecido?
- Ciencia: ¿Qué es más importante, el aire o la luz solar?
- Cómo alejarse de ser absorbido por las tecnologías de hoy y la descarada falta de apreciación de esta generación.
- ¿Los amuletos de la buena suerte realmente hacen que nuestra vida sea mejor?
Digamos que uno de esos edificios es una imagen de “referencia”. Es una imagen en una base de datos que tiene todo tipo de información asociada con el edificio: su ubicación, su historial, su diseño, etc. Digamos que la otra imagen es una imagen adquirida. No se sabe nada de esa imagen a priori , pero desea escribir un programa que reconozca que se trata de dos imágenes del mismo edificio, tomadas desde ángulos diferentes.
Bueno, ¿qué significa tener dos imágenes de la misma cosa tomadas desde diferentes ángulos? En términos generales, significa que están relacionados por una transformación lineal. Entonces, en un nivel muy alto y abstracto, reconocer la relación entre estas dos imágenes es solo identificar si existe una cierta transformación lineal.