Fundamentos de Visión Artificial

En esta entrada trataremos de resumir algunos conceptos útiles de visión por computadora que te permitirán adentrarte con más facilidad en este ámbito tan interesante. Veremos algunas herramientas que se usan en todas las plataformas y cómo pueden servirte para desarrollar una aplicación.

Definición

La visión artificial o visión por computadora es un campo de estudio que permite a las computadoras replicar el sistema visual humano. Es un subconjunto de la inteligencia artificial que recolecta información de imágenes digitales o video y los procesa para definir atributos. El proceso completo involucra la adquisición de imágenes, filtrado, análisis, identificación y extracción de información. Este proceso extensivo permite a las computadoras comprender cualquier contenido visual y actuar acorde a él. El principal objetivo de esta rama de la inteligencia artificial es el de enseñar a las máquinas a recolectar información de datos que tienen como unidad elemental el pixel.

Aplicaciones básicas de la visión artificial

Existen algunas aplicaciones bien difundidas que se resuelven mediante visión por computadora. Algunas de estas son:

  • Reconocimiento de palabras o caracteres
  • Automatización de mercados minoristas
  • Inspección en planta
  • Construcción de modelos tridimensionales (fotogrametría)
  • Imagen médica
  • Motion Capture
  • Vigilancia
  • Seguridad automovilística
  • Reconocimiento de huellas digitales y biométrica

Estas aplicaciones han sido estudiadas de forma extensiva y hay múltiples métodos para implementarlas. Aún así, siempre hay innovación y desarrollo que pueden mejorar su efectividad.

Para seguir leyendo…

¿Qué se necesita para aprender visión artificial?

Hay ciertos conocimientos que te premiten comprender el funcionamiento de los algoritmos de visión artificial que necesitas para desarrollar proyectos que la implementen, además de ciertas habilidades. Este es un listado con las más relevantes.

  • Los fundamentos: La probabilidad, la estadística, el álgebra lineal y el cálculo son requisitos previos para adentrarse en esta disciplina. DE forma similar, el conocimiento de algunos lenguajes de programación como Python y MATLAB te permiten comprender mejor los conceptos.
  • Procesamiento Digital de Imágenes: aprender a comprimir imágenes y videos usando formatos como el JPEG y MPEG, el conocimiento de herramientas básicas de procesamiento, como la ecualización del histograma, filtro promediador y más, son necesarias. Una vez que conozcas lo básico del procesamiento y restauración de imágenes puedes adquirir más habilidades específicas.
  • Fundamentos de Aprendizaje Máquina: Conocer las redes neuronales convolucionales, redes neuronales multicapa, maquinas de soporte vectorial, redes neuronales recurrentes, redes generativas y autoencoders son necesarias para empezar con la visión artificial.
  • Conceptos básicos de visión: El siguiente paso es decodificar los modelos matemáticos que se involucran en las imágenes y videos. Una vez que comprendas el reconocimiento de patrones y como funciona el procesamiento de señales puedes involucrarte en aprendizaje más avanzado.

Estos son algunas ideas que se encuentran en la visión por computadora. Te recomendamos sobre todo que adquieras habilidades con Python y algunos algoritmos de aprendizaje máquina, que son la base para implementar los programas.

Referencias:

What is Computer Vision? Know Computer Vision Basic to Advanced & How Does it Work?

Vía: PCMag