Tecnología OCR Tradicional vs. OCR de Inteligencia Artificial

Cada día hay alrededor de 20 millones de contenedores en el mundo que transitan por miles de puertos y terminales. Los contenedores se pueden usar en diferentes modos de transporte, desde el marítimo hasta el ferroviario y por carretera; por ello recibe su nombre de transporte intermodal.  

Debido a la cantidad de activos que pasan por los puertos a lo largo del día, el OCR (Reconocimiento Óptico de Caracteres) es una tecnología indispensable en los puertos utilizado para rastrear con precisión los códigos alfanuméricos de los contenedores y su posterior redireccionamiento. 

¿Qué es la tecnología OCR? 

El OCR es una tecnología enfocada a la digitalización de textos, aplicable en distintos ámbitos y sectores, los cuales tienen la necesidad de identificar automáticamente símbolos o caracteres de una imagen para luego almacenarlos en forma de datos y transformarlos en información útil.

Para reconocer los caracteres, el software inspecciona la imagen pixel a pixel, buscando formas que coincidan con los rasgos de los caracteres. 

Habitualmente, los puertos han utilizado estos sistemas OCR tradicionales, pero con el paso del tiempo y con el aumento del transporte de activos intermodales, esta tecnología se está quedando limitada y no proporciona resultados suficientemente precisos para la correcta trazabilidad en los puertos. 

El OCR tradicional

Tradicionalmente, estos OCR han sido una tecnología de automatización clave en las instalaciones portuarias. Puertos y terminales han invertido millones de euros en la instalación de arcos equipados con cámaras y sensores para activar la captura de imágenes una vez pasa el vehículo, apoyándose en soluciones heredadas de OCR para la interpretación textual de estas imágenes.  

Sin embargo, no están a la altura de las expectativas. Como consecuencia, los procesos siguen siendo ineficientes en las fases de identificación, seguimiento y control. Además, estas soluciones son caras de incorporar por la gran dependencia que tienen de hardware e infraestructuras. La inversión económica necesaria para implementar estos sistemas es muy elevada, y también los tiempos de instalación, que suponen a los puertos alteraciones en su actividad debido a que requieren una infraestructura significativa.

Es más: a pesar de la importante tendencia existente hacia la digitalización y la robotización, los puertos se están moviendo más lentamente que otros sectores en este proceso. De hecho, el 97% de las terminales portuarias de contenedores no están automatizadas, solo el 1% están totalmente automatizadas y un 2% se consideran semiautomatizadas.

¿Cómo funciona?

Para identificar los caracteres, el software examina la imagen píxel por píxel, buscando formas que coincidan con las características del caracter. Dependiendo de lo complejo o desarrollado que sea el software, buscará coincidencias con los caracteres y fuentes disponibles en el programa, o intentará identificar caracteres analizando sus características para que su reconocimiento no se limite a un número determinado de fuentes.

Aunque actualmente el OCR puede reconocer caracteres, la precisión de las soluciones existentes aún no alcanzan un máximo de precisión al leer las identificaciones de contenedores, vagones y matrículas en movimiento.

¿Qué elementos requiere un OCR tradicional?

Infraestructura metálica de puertas y carriles

Para garantizar que los vehículos y los activos siempre lleguen en una posición predeterminada y una dirección específica, se deben construir e instalar puertas físicas. Solo se rastrearán los activos que pasen por esas puertas.

Sensores de presencia y disparadores del sistema

Los sistemas OCR no entran en funcionamiento hasta que se detecta la presencia de un activo. Estos disparadores de presencia generalmente se implementan mediante el uso de sensores de fotocélula, sensores inductivos, sensores de peso o radar. 

Paneles de iluminación

Las condiciones de iluminación se controlan en las puertas OCR mediante paneles LED, controladores estroboscópicos e iluminación infrarroja. 

Sistemas de medición

Los sistemas de medición láser se utilizan para detectar la posición 3D exacta de los diferentes activos con el fin de orientar el sistema “dónde” y “cuándo” leer. 

Captura de imagen

Una configuración generalmente conformada por 4 a 8 cámaras se activa sincrónicamente para registrar varios campos de visión del equipo (por ejemplo, frontal, posterior, laterales, parte superior de un contenedor). Las cámaras de escaneo de área y escaneo de línea se utilizan para obtener diferentes vistas del equipo. Se necesitan cámaras específicas y de alta gama para cada tipo de lectura: Placas, Contenedores, Vagones, entre otros. 

Unidad central de CPU

Hardware informático que controla todo el sistema y que ejecuta el reconocimiento de caracteres. Necesita alimentación y conexión con la red de área local del puerto. 

Software de OCR

Basado en una primera etapa de detección de caracteres aislados (con componentes conectados o técnicas MSER) ​​y un reconocimiento de letras posterior basado en características de forma y clasificadores estadísticos como árboles de decisión o SVM. Dichas soluciones resultan obsoletas frente a los sistemas de reconocimiento actuales mediante Deep Learning. 

Integración de datos y comunicación con otros sistemas

Los datos y metadatos reconocidos se colocan en un formato estructurado y se integran con el sistema operativo del terminal (TOS). 

Container leído por OCR

Son muchos, los elementos que se necesitan para disponer de un OCR, y aún así comporta una gran cantidad de inconvenientes para los puertos y terminales. Aproximadamente, del 3% al 5% de las identificaciones deben corregirse manualmente, ya que su lectura es carácter a carácter y no de forma global, lo que habitualmente conlleva errores de lectura.

Debido a estos inconvenientes, los puertos que carecen de tecnologías más vanguardistas de identificación automática y captura de datos, finalmente sufren mayores gastos operativos y carencia competitiva.  

Investigaciones recientes muestran que los cuellos de botella anuales representan costes de 4.000 millones de euros en la red de transporte de la UE. Los OCR tradicionales, entre otros factores, contribuyen en este impacto debido a que los camiones deben pararse en los arcos para que el OCR pueda leer los datos. Causando un efecto negativo en la productividad y la satisfacción del cliente. 

Software OCR basado en Inteligencia Artificial 

Para afrontar estos desafíos, se desarrolló el Software de Identificación Inteligente en transporte Intermodal. Una disrupción total del paradigma OCR, que permite la omnipresencia de la trazabilidad en las instalaciones portuarias, al acabar con las barreras financieras y tecnológicas a su adopción.   

Esta tecnología ofrece generalmente las siguientes ventajas

  • Detección y lectura en entornos complejos, con oscuridad, borrosidad o en movimiento a alta velocidad.
  • Varias lecturas a la vez, permitiendo la identificación de códigos distintos en una misma toma. 
  • Reducción de costes de hardware y mantenimiento, prescindiendo de grandes infraestructuras. 
  • Altos porcentajes de precisión, superando el estándar de las soluciones existentes, rozando el 100%.
  • ROI más rápido, haciendo de esta alternativa una solución óptima para todo tipo de puertos.
  • Integración automática de los datos en el sistema de gestión de la información preexistente en el puerto.
Ejemplo de casos de uso frecuentes para un OCR portuario de inteligencia artificial.

Con estas características, el software tiene el potencial de democratizar las soluciones de trazabilidad de carga intermodal para los puertos, terminales y plataformas intermodales de cualquier tamaño. 

Dotar a la inteligencia artificial de tecnologías como el Deep Learning y el Computer Vision es lo que permite al software ser entrenado con cada lectura que realiza. Dando la posibilidad de hacer lecturas de manera general y no carácter a carácter, lo que comporta más precisión que un OCR tradicional.

Habitualmente su uso va dirigido al control de accesos, monitorización en tiempo real de flujos de circulación internos de vehículos o trazabilidad de mercancías en toda la cadena de suministro, aunque los usos del OCR basado en Inteligencia Artificial son muy diversos.

Su arquitectura de redes neuronales única hace que el reconocimiento de activos sea resistente al polvo, la suciedad, el movimiento, el desenfoque, la oclusión parcial, el daño o la rotación, que son problemas de identificación comunes con activos en entornos portuarios.   

         New call-to-action

Si quieres seguir al día de todas las noticias de AllRead, suscríbete a nuestra newsletter. Recibirás regularmente los contenidos y noticias más destacados de nuestro blog en tu correo electrónico. Síguenos también en nuestros perfiles sociales en LinkedIn, Twitter, YouTube, Instagram y Facebook

Categories:

Comments are closed