< style="font-family: Times New Roman,Times,serif;">Investigadores de la Penn State University hanconseguido enseñar a los ordenadores a interpretar imágenes utilizandoun vocabulario de más de 330 palabras en inglés, de manera que puedandescribir una fotografía cualquiera con varios términos y archivarlacon criterios lógicos. Según un comunicado de dicha universidad, estenuevo sistema puede identificar colecciones completas de fotografíason-line cuando son archivadas, lo que supone un gran ahorro de tiempopara los millones de usuarios de Internet que etiquetan a mano lasimágenes que guardan en sus ordenadores. Asimismo, este sistema puedefacilitar la búsqueda de fotografías con la utilización de palabrasclave.><>El sistema ha sido desarrollado porJames Wang, profesor asociado del College of Information Sciences andTechnology de la Penn State University, que se dedica al estudio de larecuperación semántico-sensitiva de imágenes, a la seguridad de losarchivos gráficos y al desarrollo de sistemas de catalogación defotografías con índices lingüísticos aprendidos, entre otrasactividades de investigación.>
<>El sistema,descrito en el artículo Real-Time Computerized Annotation of Picturespor Wang y su colaboradora Jia Li, del departamento de estadística dela misma universidad, aspira a resolver el problema de la catalogaciónautomática de las imágenes digitales. Según ambos autores, desarrollarla capacidad de los ordenadores para realizar este trabajo puede tenermúltiples aplicaciones, como la búsqueda de imágenes en la Web, en lossites de álbumes de fotos emulando a un motor de búsqueda, e inclusopara facilitar la realización de experimentos científicos. Asimismo,podría servir para catalogar colecciones de arte, imágenes de satéliteo fotos de enfermedades concretas.> <>Con lasistematización de avanzados modelos estadísticos y la optimización delas técnicas, los investigadores han conseguido enseñar a losordenadores cientos de conceptos semánticos a partir de imágenes queejemplifican cada uno de dichos conceptos. Así ha surgido el sistemaALIPR (Automatic Linguistic Indexing of Pictures-Real Time),completamente automático. De manera rápida, este sistema puedecatalogar imágenes on-line en tiempo real. Las pruebas que se hanrealizado en sitios de imágenes en Internet han demostrado que permitecatalogarlas con una precisión óptima.>
<>Lamayoría de los buscadores actuales se basan en etiquetados textualespara describir imágenes, pero no todos los conjuntos de texto seanotan. Como resultado, las imágenes que no se catalogan no pueden serencontradas por los buscadores web, al mismo tiempo que muchasdescripciones textuales son confusas respecto a la imagen archivada.Esta herramienta automática puede en cambio presentar muchas másimágenes y con mucha más precisión respecto a criterios de búsqueda.>
<>ALIPRfunciona analizando los píxeles (puntos de una imagen gráfica) de lasimágenes y comparándolos con los datos que el ordenador tienealmacenados en una base de datos pertenecientes a decenas de miles deimágenes de referencia. El ordenador sugiere a partir de dicho archivo15 posibles palabras para catalogar la nueva imagen.>
<>Graciasa la introducción de estas decenas de miles de imágenes, losordenadores han aprendido a reconocer ciertos objetos y conceptos, queautomáticamente atribuyen a las nuevas imágenes que jamás han "visto".Los científicos han conseguido de esta forma que, en el 98% de lasimágenes analizadas, el sistema genere al menos una anotación correctade las 15 palabras seleccionadas. Estas anotaciones las hace el sistemaen una media de un 1,4 segundos.>
<>El sistemapresenta, sin embargo, dificultades en el reconocimiento de fotosborrosas o de bajo contraste o baja resolución, cuando los objetos seven sólo parcialmente o cuando el ángulo de la fotografía presenta unobjeto registrado en el archivo del ordenador, pero desde cualquierotro ángulo. Para tratar de resolver estos problemas, losinvestigadores introducirán cada vez más imágenes en la base de datos,lo que ampliará las posibilidades de reconocimiento.>
<>Teniendoen cuenta que las imágenes son el principal medio de expresión enInternet, habría por tanto que asegurar la búsqueda sencilla y efectivaen toda la cantidad de información gráfica que hay en la Red, que crececontinuamente. La catalogación automática y en tiempo real se hace poreso cada vez más necesaria, aseguran los investigadores.>
<>Lospróximos pasos para mejorar el sistema ALIPR y su exactitudcomprenderán la incorporación de información tridimensional en losprocesos de aprendizaje informático, lo que mejorará el funcionamientodel sistema. Asimismo, se aumentará y mejorará la cantidad de imágenesde archivo que suministran los conceptos semánticos que sirven parareconocer nuevas imágenes. Respecto a las aplicaciones, el sistemaALIPR comenzará a probarse en ciertos dominios, como la biomedicina.También podría ser integrado en otros sistemas de recuperación de datospara mejorar su propia eficacia. El desarrollo de ALIPR ha sidosubvencionado por la National Science Foundation.>