Un fotomosaico es una imagen creada con miles de pequeñas fotografías. La idea se popularizó después de que a Robert Silvers le publicaran en la revista Newsweek, el 22 de diciembre de 1997, una fotografía de Lady Di hecha con una enorme cantidad de fotos de flores.
Silvers, que estudio en el MIT, creó un sistema para hacer fotomosaicos y de hecho, ha publicado algunos libros sobre el tema. El «ciber-artista» no explica cómo lo hace (aunque tiene una patente que con el tiempo fue puesta en tela de juicio y hasta donde entendemos, la misma ha sido invalidada).
Robert Silvers le ha hecho a personajes célebres imágenes de fotomosaicos. Por ejemplo, amigos de Bill Gates le solicitaron un mosaico del exCEO de Microsoft para regalárselo cuando cumpliera 40 años de edad.
El precio de dicho fotomosaico fue de unos 40 mil dólares. Este mosaico está hecho con billetes de diversas denominaciones y de diferentes países e incluso, muchas veces son fragmentos de los billetes.
Un fotomosaico es básicamente un mosaico de fotografías en el que se debe sustituir cada región de color por una foto determinada.
Uno de los problemas básicos es encontrar la imagen más adecuada para una particular región de la imagen que estamos procesando.
Lo que básicamente se hace es sacar el color promedio de una región y después comparar ese rojo, verde y azul promedio con el rojo, verde y azul promedio de todas las imágenes que se pueden tener en una biblioteca.
Esto equivale a usar la ecuación de la distancia en tres dimensiones de la geometría analítica y hallar la distancia mínima entre el color que nos interesa y una imagen.
Poder localizar la imagen adecuada requiere de revisar todas las imágenes y hacer el cálculo de esa ecuación de la distancia. Típicamente, cuando se tienen unas 5 mil imágenes, hay que hacer este cálculo unas 12.5 millones de veces, lo cual es bastante ineficiente, computacionalmente hablando.
Me hicieron un fotomosaico
Si retomamos este tema es porque me acaba de llegar un fotomosaico hecho por Edgar Mendoza, estudiante de la Facultad de Ciencias, quien acaba de terminar el curso de Proceso Digital de Imágenes, que imparto en la carrera de Ciencias de la Computación.
Pero hay ideas, interesantes, como la de usar árboles KD, que es lo que ha hecho Edgar.
Básicamente un árbol KD (llamado también árbol K-dimensional) es equivalente a una búsqueda binaria, la cual es la más eficiente que existe. Edgar me ha dicho que de esta manera se evita la búsquea exhaustiva (a fuerza bruta). La complejidad es nlog(n), lo que mejora enormemente el tiempo de procesamiento.
Edgar usó un banco de imágenes que contiene 77,185 fotogramas correspondientes a las escenas de los videos del canal «manuel morsa» (en donde hablamos de ajedrez. Tomó 1 por cada dos segundos de video).
«Al momento de realizar la búsqueda de la imagen más cercana, se tomaron (para este caso) las 100 imágenes más cercanas, de las cuales se toma entonces una al azar», dijo Edgar.
Además existen varias imágenes en el banco con el mismo promedio de color, para esta situación también se elige una al azar, de forma que se consideran todas las imágenes
Para mejorar un poco el resultado uso, como usted nos recomendó en clase, una máscara de color al 30%, además de difuminar el error de la diferencia entre la imagen seleccionada y la región original con dithering».
Así, el resultado es el que se presenta en la imagen anterior.
Quien quiera ver la imagen final original (que pesa unos 14 MBytes), puede descargarla de este enlace. Notable trabajo por dos razones: primero, por el haber usado la estructura de árboles KD y por otra parte, por tomar los videos y armar una extensa colección de fotogramas de los mismos. Y después hay quien duda que hay talento en nuestro país.
La entrada Cómo construir un fotomosaico eficientemente se publicó primero en unocero.