Aplicaciones de Deep Learning en visión por computadora y procesamiento de lenguaje natural (PNL)
La Inteligencia Artificial (IA) es una disciplina científica que se ubica en el campo de las nuevas ciencias, se enfoca en dotar a computadoras y máquinas basadas en sistemas informáticos de la capacidad de pensamiento, emulando la inteligencia humana, a partir de la capacidad de aprender de una gran cantidad de datos.
El objetivo de la IA es compilar la inteligencia colectiva de los seres humanos para crear sistemas y máquinas que hasta el presente solo son realizadas por los humanos. Esta disciplina tienen grandes aplicaciones en el mundo actual, especialmente en
- Vehículos de conducción autónoma.
- Traducción de idiomas.
- Detección de fraudes informáticos y con pagos electrónicos.
- Asistentes virtuales.
- Sistemas de recomendación
- Reconocimiento facial.
- Automatización de procesos industriales.
- Selección de contenidos.
La IA es parte de la Data Science, que es una ciencia integral que se encarga de la recopilación y limpieza de grandes volúmenes de datos, la visión por computadora y el uso de diversas técnicas, matemáticas, estadísticas, de programación y de IA, para transformar dichos datos en información valiosa para toma de decisiones y la resolución de problemas.
Procesamiento del lenguaje natural por Gadiel Ringvald
El procesamiento del lenguaje natural (PNL) es la capacidad que tiene un determinado sistema informático para entender el lenguaje humano, escrito y hablado, el PNL es una tecnología asociada al machine learning y un componente esencial de la IA.
El PNL tiene una amplia variedad de aplicaciones en el mundo actual, en industrias y diversos campos como los motores de búsqueda, investigación científica avanzada, investigación médica e inteligencia de procesamiento empresarial.
Esta tecnología posibilita que las computadoras puedan comprender el lenguaje natural, de la forma en que lo hablamos y lo entendemos los humanos, independientemente de que sea oral o escrito. El procesamiento del lenguaje natural emplea IA para recibir información sobre la vida real, procesarla y proporcionar el significado adecuado de una forma que una computadora pueda comprenderlo de forma rápida y fácil.
Así como los seres humanos tenemos distintos sentidos, como la vista para ver y los oídos para oír; las computadoras reciben instrucciones de programas que les permiten leer textos y recopilar y analizar audios.
De forma similar como los humanos utilizamos el cerebro para procesar las señales visuales y auditivas que recibimos, los computadores cuentan con una compleja serie de instrucciones que les permiten procesar sus entradas de información, que luego de ser procesada se convierte en código que es interpretado por un sistema informático.
Deep Learning y visión por computadora por Gadiel Ringvald
El aprendizaje profundo o Deep Learning es parte del Machine Learning, utiliza un conjunto de algoritmos complejos denominados redes neuronales artificiales, las cuales están inspiradas en la forma en que funciona el cerebro humano.
Así como nuestro cerebro tiene neuronas, se han creado neuronas artificiales que conforman una red en el Deep Learning. Cada neurona artificial es una función que toma una combinación de entradas y produce una salida.
El objetivo principal del Deep Learning es lograr que los computadores puedan aprender por cuenta propia y tengan la capacidad para realizar tareas similares a las que realizamos los seres humanos.
Una de las principales aplicaciones del Deep Learning es la visión por computadora o visión artificial, esta disciplina tiene un campo de estudio que abarca la forma en que las computadoras ven y comprenden imágenes de datos digitales y secuencias de video.
La visión por computadora busca emular las tareas complejas que realizan los procesos de la visión humana, que incluyen sentir estímulos visuales que permiten ver y comprender de forma exacta lo que se ha visto. La visión artificial busca automatizar los procesos de la visión humana, para ello utiliza avanzados sensores, sistemas inteligentes y algoritmos de Deep Learning.
Relación de la visión por computadora con el PNL
El procesamiento del lenguaje natural y la visión por computadora se combinan a través de tres procesos claves, que se interrelacionan entre sí.
- Reconocimiento: en un proceso que posibilita determinar y fijar etiquetas digitales a objetos contenidos dentro de una imagen. Algunos ejemplos son el reconocimiento de la escritura a mano, el reconocimiento de objetos 2D y 3D y el reconocimiento de objetos en movimiento.
- Reconstrucción: este proceso permite la representación de escenas en 3D, a partir de imágenes visuales y a través del sombreado digital, la incorporación de múltiples puntos de vista y los datos de profundidad sensorial. El resultado del proceso de reconstrucción es un modelo digital 3D.
- Reorganización: este proceso implica la segmentación de píxeles sin procesar en conjuntos de datos que representan una configuración predeterminada. La reorganización incluye las tareas de visión de bajo nivel, que incluyen detección de bordes, contornos y esquinas. Así como tareas de alto nivel que incluyen procesos de reconocimiento complejo.
La integración de estas dos disciplinas está ayudando a resolver desafíos en muchos campos como la descripción de imágenes médicas con alto nivel de exactitud, conversión del lenguaje de señas, creación de sistemas inteligentes capaces de ver y entender el entorno y sistemas inteligentes capaces de convertir el lenguaje hablado en una imagen digital.
Por Gadiel Ringvald (gadiel.ringvald@gmail.com)