Una de las técnicas básicas de la inteligencia artificial. Los algoritmos utilizan métodos matemáticos y computacionales para aprender información directamente de los datos, sin modelos matemáticos ni ecuaciones predeterminadas, y mejoran su rendimiento de forma «adaptativa».
El Machine Learning (ML) enseña a las computadoras y robots a realizar acciones y actividades de forma tan natural como los seres humanos o los animales: aprendiendo de la experiencia (o mejor dicho, a través de programas de aprendizaje automático).
En esencia, los algoritmos de Machine Learning utilizan métodos matemáticos y computacionales para aprender información directamente de los datos, sin modelos matemáticos ni ecuaciones predeterminadas.
El Machine Learning permite a las computadoras combinar algoritmos y tecnologías avanzadas para tomar mejores decisiones, más rápidamente y con mayor precisión. Una de las principales ventajas del aprendizaje automático es su capacidad para modelar datos y tomar decisiones en tiempo real.
Ejemplo
Por ejemplo, un sistema de Machine Learning puede utilizarse para reconocer las palabras pronunciadas por una persona o escanear imágenes que contienen objetos específicos.
También puede utilizarse para tomar decisiones empresariales complejas, como la gestión de recursos humanos o el análisis predictivo de datos.
Los algoritmos de Machine Learning son una parte importante de la tecnología de IA que las empresas están adoptando para aumentar la productividad, reducir costes y mejorar su capacidad de tomar decisiones.
Los algoritmos de Machine Learning pueden utilizarse para interpretar datos complejos e identificar tendencias, patrones y relaciones que pueden utilizarse para tomar decisiones estratégicas.
Por ejemplo, el uso de algoritmos de Machine Learning en ciberseguridad ayuda a reconocer amenazas como malware, intrusiones informáticas y fraude.
Además, los algoritmos de Machine Learning pueden utilizarse para realizar análisis de grandes volúmenes de datos en muy poco tiempo. Esto también puede ser útil para identificar relaciones entre productos y en la comercialización personalizada.
Los algoritmos de ML mejoran su rendimiento de forma adaptativa a medida que aumentan los ejemplos de los que aprenden. Por lo tanto, vamos a tratar de entender qué es el Machine Learning, cómo funciona y cuáles son sus aplicaciones.
¿Qué es el Machine Learning (Aprendizaje Automático)?
En español, deberíamos traducir Machine Learning (ML) como aprendizaje automático, entendido como la capacidad de las máquinas (entendidas como ordenadores) para aprender sin haber sido explícita y previamente programadas (al menos como en la acepción tradicional de la informática).
El primero en acuñar el término fue Arthur Lee Samuel, científico estadounidense pionero en el campo de la inteligencia artificial, en 1959, aunque a día de hoy la definición más aceptada por la comunidad científica es la que ofreció otro estadounidense, Tom Michael Mitchell, director del departamento de Machine Learning de la Universidad Carnegie Mellon:
«Se dice que un programa aprende de la experiencia E, con referencia a algunas clases de tareas T y con medición del rendimiento P, si su rendimiento en la tarea T, medido por P, mejora con la experiencia E».
Dicho en palabras más sencillas: el ML permite a los ordenadores aprender de la experiencia (que no debe entenderse en el sentido humano, sino que sigue refiriéndose a un programa informático); hay aprendizaje (experiencia) cuando el rendimiento del programa mejora después de realizar una tarea o completar una acción (incluso errónea, partiendo de la base de que el principio de que se aprende de los errores también se aplica a los humanos).
Desde el punto de vista informático, en lugar de escribir el código de programación mediante el cual, paso a paso, se le dice a la máquina qué hacer, al programa sólo se le proporcionan conjuntos de datos que se procesan a través de algoritmos, desarrollando su propia lógica para realizar la función, la actividad o la tarea requeridas (por ejemplo, aprender a reconocer una imagen).
Machine Learning y Aprendizaje Automático: Cómo Funcionan
En principio, el Machine Learning funciona sobre la base de dos enfoques distintos, identificados por el propio Arthur Samuel a finales de la década de 1950, que permiten distinguir el aprendizaje automático en dos subcategorías del ML en función de si se dan al ordenador ejemplos completos para utilizarlos como guía para realizar la tarea requerida (aprendizaje supervisado) o si se deja trabajar al software sin ninguna «ayuda» (aprendizaje no supervisado).
En realidad, como veremos más adelante, existen subconjuntos que permiten realizar una clasificación aún más detallada del Machine Learning precisamente en función de su funcionamiento.
Machine Learning con Aprendizaje Supervisado (Supervised Learning)
En esta categoría de Machine Learning, al ordenador se le dan tanto conjuntos de datos como entrada como información sobre los resultados deseados, con el objetivo de que el sistema identifique una regla general que relacione los datos de entrada con los de salida (es decir, se le dan ejemplos de entradas y salidas para que aprenda el vínculo entre ellas), de modo que pueda reutilizar dicha regla para otras tareas similares.
«En el aprendizaje supervisado, la tarea de resolución se deja al ordenador. Una vez que se entiende la función matemática que llevó a resolver un conjunto específico de problemas, será posible reutilizar la función para responder a cualquier otro problema similar»
Adam Geitgey, desarrollador de software, en su artículo Machine Learning is Fun!
Machine Learning con aprendizaje no supervisado (Unsupervised Learning)
En esta segunda categoría de Machine Learning, al sistema sólo se le proporcionan conjuntos de datos sin ninguna indicación del resultado deseado. El objetivo de este segundo método de aprendizaje es encontrar patrones y modelos ocultos, es decir, identificar una estructura lógica en las entradas sin que estén previamente etiquetadas.
Machine Learning con aprendizaje por refuerzo
El aprendizaje por refuerzo (Reinforcement Learning o RL) es una rama del Machine Learning en la que un agente aprende a tomar decisiones optimizando una señal de recompensa a través de la interacción con el entorno en el que opera.
A diferencia del aprendizaje supervisado, en el que un modelo se entrena en un conjunto de datos con etiquetas correctas, en RL el agente descubre de forma autónoma la estrategia (política) para comportarse a través de la prueba y el error.
Estos son los componentes clave del aprendizaje por refuerzo:
- Agente: La entidad que toma las decisiones, es decir, el sistema que se está entrenando.
- Entorno: El contexto o dominio en el que el agente opera y toma decisiones.
- Estado: Una representación del entorno en un momento determinado.
- Acción: Una intervención que el agente puede realizar para influir en el estado del entorno.
- Recompensa: Una señal que el agente recibe del entorno en respuesta a sus acciones. El objetivo del agente es maximizar la recompensa total a lo largo del tiempo.
- Política: Una estrategia que el agente sigue para decidir qué acciones tomar en función del estado actual del entorno.
El proceso de aprendizaje en RL suele seguir estos pasos:
- El agente observa el estado actual del entorno.
- Basándose en la política actual, el agente elige y realiza una acción.
- El entorno cambia de estado en respuesta a la acción del agente.
- El agente recibe una recompensa (positiva o negativa) del entorno como resultado de la acción realizada.
- El agente actualiza su política en función de la experiencia adquirida (acción realizada, estado siguiente, recompensa recibida).
Para actualizar la política, el agente puede utilizar varios algoritmos de aprendizaje por refuerzo, entre ellos:
- Q-learning: Un método sin modelo que estima el valor de un par estado-acción, sin necesidad de modelar el entorno.
- SARSA (State-Action-Reward-State-Action): Similar a Q-learning, pero actualiza sus valores basándose en la política actual en lugar de en la elección óptima.
- Deep Reinforcement Learning: Combina redes neuronales con RL para manejar entornos con estados de alta dimensionalidad, como juegos o simulaciones complejas.
- Policy Gradient: En lugar de aprender una función de valor, el agente aprende directamente la política que mapea los estados a las probabilidades de acción.
El aprendizaje por refuerzo tiene aplicaciones en diversos campos, como los juegos (por ejemplo, AlphaGo), la robótica, la optimización de sistemas de control, la gestión de carteras financieras y la navegación autónoma.
En definitiva, el sistema (ordenador, software, algoritmo) debe interactuar con un entorno dinámico (que le permita obtener los datos de entrada) y alcanzar un objetivo (alcanzarlo recibe una recompensa), aprendiendo también de los errores (identificados mediante «castigos»). El comportamiento (y el rendimiento) del sistema está determinado por una rutina de aprendizaje basada en la recompensa y el castigo.
Con este tipo de modelo, el ordenador aprende, por ejemplo, a vencer a un oponente en un juego (o a conducir un vehículo) centrando sus esfuerzos en realizar una tarea determinada con el objetivo de alcanzar el máximo valor de recompensa; en otras palabras, el sistema aprende jugando (o conduciendo) y de los errores cometidos, mejorando su rendimiento en función de los resultados obtenidos anteriormente.
Machine Learning con aprendizaje semi-supervisado
El aprendizaje semi-supervisado es una técnica de Machine Learning que se sitúa entre el aprendizaje supervisado y el no supervisado. En este tipo de aprendizaje, el modelo se entrena utilizando un conjunto de datos que incluye tanto ejemplos etiquetados (es decir, con la respuesta correcta proporcionada) como ejemplos no etiquetados. La mayoría de los datos disponibles en la práctica no están etiquetados porque obtener etiquetas precisas puede ser costoso y llevar mucho tiempo. El aprendizaje semi-supervisado aprovecha la gran cantidad de datos no etiquetados para mejorar el rendimiento del modelo incluso cuando hay pocas etiquetas disponibles.
Estas son algunas técnicas comunes en el aprendizaje semi-supervisado:
- Auto-entrenamiento: Comienza entrenando un modelo supervisado con el pequeño conjunto de datos etiquetados y luego utiliza el modelo para etiquetar los datos no etiquetados. Las etiquetas más seguras (es decir, las que tienen mayor probabilidad) se utilizan entonces para volver a entrenar el modelo.
- Co-entrenamiento: Se entrenan dos (o más) modelos por separado en diferentes vistas del conjunto de datos (diferentes características o subconjuntos de características). A continuación, los modelos etiquetan datos no etiquetados entre sí y se entrenan en estas nuevas etiquetas.
- Máquinas de vectores de soporte transductivas (TSVM): Son una variación de las máquinas de vectores de soporte (SVM) tradicionales que intentan encontrar una división que no sólo separe mejor los datos etiquetados en sus respectivas categorías, sino que también coloque los datos no etiquetados lo más lejos posible del límite de decisión.
- Métodos basados en grafos: En estos métodos, los datos se representan como un grafo, con nodos que representan ejemplos y aristas que representan la similitud entre ejemplos. Las etiquetas se propagan entonces a través del grafo desde los nodos etiquetados a los no etiquetados, normalmente en función de su proximidad o similitud.
- Modelos generativos: Estos modelos intentan aprender la distribución subyacente de los datos etiquetados y no etiquetados para generar nuevos ejemplos o etiquetar los existentes.
El aprendizaje semi-supervisado es especialmente útil cuando tenemos un gran volumen de datos no etiquetados disponibles y recopilar etiquetas es costoso o poco práctico. Tiene aplicaciones en muchos campos, como el reconocimiento del lenguaje natural, la visión artificial, la bioinformática y muchos otros campos donde los datos no etiquetados son abundantes pero las etiquetas son costosas de obtener.
En este caso, se trata de un modelo híbrido en el que se proporciona al ordenador un conjunto de datos incompleto para el entrenamiento/aprendizaje; algunas de estas entradas tienen los ejemplos de salida respectivos (como en el aprendizaje supervisado), mientras que otras no (como en el aprendizaje no supervisado). El objetivo final sigue siendo el mismo: identificar reglas y funciones para resolver problemas, así como modelos y estructuras de datos útiles para alcanzar determinados objetivos.
Desde los modelos probabilísticos hasta el Deep Learning
Existen otras subcategorías de Machine Learning que sirven para dar una especie de clasificación práctica porque, de hecho, identifican enfoques prácticos para aplicar los algoritmos de ML (de los que se pueden derivar categorías de aprendizaje de sistemas).
Hablamos, por ejemplo, de los llamados árboles de decisión basados en grafos a través de los cuales se desarrollan modelos predictivos gracias a los cuales es posible descubrir las consecuencias (resultados) de determinadas decisiones (entradas).
Otro ejemplo concreto es el clustering, es decir, los modelos matemáticos que permiten agrupar datos, información, objetos, etc. similares; se trata de una aplicación práctica del Machine Learning detrás de la cual existen diferentes modelos de aprendizaje que van desde la identificación de estructuras (qué define un clúster y cuál es su naturaleza) hasta el reconocimiento de los objetos que deben formar parte de un grupo en lugar de otro.
También existe la subcategoría de los modelos probabilísticos que basan el proceso de aprendizaje del sistema en el cálculo de probabilidades (el más conocido es quizás la red de Bayes, un modelo probabilístico que representa en un grafo el conjunto de variables aleatorias y sus dependencias condicionales).
Por último, están las conocidas redes neuronales artificiales, que utilizan para el aprendizaje determinados algoritmos inspirados en la estructura, el funcionamiento y las conexiones de las redes neuronales biológicas (es decir, las del ser humano). En el caso de las redes neuronales denominadas multicapa, se entra en el campo del Deep Learning (aprendizaje profundo).
Clasificación Naive Bayes (NBC)
La Clasificación Naive Bayes (NBC) es una técnica de Machine Learning que permite clasificar objetos, como documentos de texto, en dos o más clases. Al clasificador, en la fase de entrenamiento (aprendizaje), se le alimenta con un conjunto de datos (una serie de textos) cuya clase de pertenencia está definida (en el caso de que el documento sea un correo electrónico, si es spam o no).
Machine Learning: Las Aplicaciones
Las aplicaciones de Machine Learning son ya muy numerosas, algunas de las cuales han entrado en nuestra vida cotidiana sin que nos demos cuenta.
Pensemos, por ejemplo, en el uso de los motores de búsqueda: a través de una o varias palabras clave, estos motores devuelven listas de resultados (las llamadas SERP – Search Engine Results Page) que son el efecto de algoritmos de Machine Learning con aprendizaje no supervisado (proporcionan como salida información que se considera relevante para la búsqueda realizada en base al análisis de patrones, modelos, estructuras en los datos).
Otro ejemplo común está relacionado con los filtros antispam de los correos electrónicos, que se basan en sistemas de Machine Learning que aprenden continuamente tanto a interceptar mensajes de correo electrónico sospechosos o fraudulentos como a actuar en consecuencia (por ejemplo, eliminándolos antes de que se distribuyan a los buzones personales de los usuarios). Este tipo de sistemas, incluso con mayor sofisticación, se utilizan, por ejemplo, también en el sector financiero para la prevención del fraude (como la clonación de tarjetas de crédito), el robo de datos y la identidad; los algoritmos aprenden a actuar correlacionando eventos, hábitos de los usuarios, preferencias de gasto, etc.; información a través de la cual pueden identificar en tiempo real cualquier comportamiento anómalo que pueda identificar un robo o un fraude.
Ejemplos interesantes de Machine Learning con aprendizaje supervisado provienen del campo de la investigación científica médica, donde los algoritmos aprenden a hacer predicciones cada vez más precisas para prevenir brotes de epidemias o para diagnosticar tumores o enfermedades raras de forma precisa y oportuna.
Y aún más, también en el ámbito del aprendizaje supervisado, existen interesantes aplicaciones de Machine Learning a nivel de reconocimiento de voz o identificación de la escritura.
Como se ha mencionado, los sistemas basados en el aprendizaje por refuerzo son la base del desarrollo de los coches autónomos que, a través del ML, aprenden a reconocer el entorno circundante (con los datos recogidos por sensores, GPS, etc.) y a adaptar su «comportamiento» en función de las situaciones específicas a las que se enfrentan/superan.
Los llamados sistemas de recomendación también aprovechan el Machine Learning aprendiendo del comportamiento y las preferencias de los usuarios que navegan por sitios web, plataformas o aplicaciones móviles; un ejemplo de ello son los que estamos acostumbrados a ver y utilizar en plataformas de comercio electrónico como Amazon o de entretenimiento y acceso a contenidos como Netflix o Spotify.
Ejemplos de Aprendizaje Automático
Estos son algunos ejemplos de Machine Learning e inteligencia artificial que mejoran la eficacia y el rendimiento de los procesos.
Machine Learning «como servicio»
Machine Learning as a Service (MLaaS) define el conjunto de plataformas basadas en la nube capaces de gestionar toda la cadena tecnológica relacionada con la aplicación de herramientas de IA, desde el preprocesamiento de datos hasta el entrenamiento y la evaluación de un modelo de Machine Learning, utilizable también a través de APIs Rest.
Industria 4.0 y ML
El Machine Learning desempeña un papel fundamental en la Industria 4.0 gracias a su capacidad para reconocer patrones en los datos y tomar decisiones autónomas o proporcionar información útil para las decisiones tomadas por el hombre.
Estas son algunas de las formas en que el ML está contribuyendo a la Industria 4.0:
- Mantenimiento predictivo: Los modelos de ML pueden analizar los datos de los sensores instalados en la maquinaria para predecir fallos o necesidades de mantenimiento antes de que se produzcan. Esto reduce el tiempo de inactividad de las máquinas y aumenta la fiabilidad y la longevidad de los activos.
- Optimización de la cadena de suministro: Mediante el análisis de grandes cantidades de datos, el ML puede predecir las tendencias de la demanda, optimizar los niveles de inventario y mejorar la logística.
- Control de calidad: Los sistemas de visión artificial mejorados con ML pueden identificar defectos en los productos con gran precisión y velocidad, superando las capacidades humanas y reduciendo los residuos.
- Personalización masiva: El ML puede facilitar la producción de bienes personalizados a gran escala analizando las preferencias de los clientes y adaptando rápidamente los procesos de producción.
- Robótica avanzada: Los robots industriales pueden equiparse con algoritmos de ML que les permitan aprender y adaptarse a nuevas tareas o entornos, aumentando la flexibilidad de las líneas de producción.
- Optimización de procesos: El ML puede utilizarse para analizar y optimizar los procesos de producción, identificando ineficiencias o sugiriendo mejoras para reducir costes y aumentar la productividad.
- Seguridad en el lugar de trabajo: El ML puede ayudar a mejorar la seguridad en el lugar de trabajo analizando los datos de los accidentes e identificando riesgos potenciales, así como supervisando los entornos de trabajo en tiempo real para detectar situaciones peligrosas.
- Integración vertical y horizontal: El ML facilita la comunicación y la colaboración entre las distintas fases de la producción (vertical) y entre las distintas unidades de producción o empresas (horizontal), contribuyendo a crear sistemas integrados y receptivos.
Para implantar con éxito el Machine Learning en la Industria 4.0, las empresas deben invertir en infraestructuras de datos sólidas, competencias técnicas y adoptar un enfoque estratégico de la transformación digital. La combinación de ML con otras tecnologías como el Internet de las Cosas (IoT), la realidad aumentada (AR), los sistemas ciberfísicos (CPS) y la computación en nube es lo que realmente permite aprovechar todo el potencial de la Industria 4.0.
Estudio de las supertormentas solares con ML
La NASA está estudiando las supertormentas solares utilizando redes neuronales de aprendizaje no supervisado. Las actividades de detección de anomalías y exploración de las condiciones extremas asociadas a las tormentas solares se llevan a cabo en colaboración con AWS Professional Services y Amazon Machine Learning (ML) Solutions Lab.
Cine y ML
La aplicación a la industria cinematográfica de algoritmos entrenados para realizar clasificaciones y predicciones de forma automática permite simplificar las tareas de los profesionales, pero también implica la posibilidad de implementar, de forma eficiente y robusta, procesos de «reconocimiento inteligente» (por ejemplo, contenido, género, autor) útiles para mejorar la experiencia de entretenimiento del espectador (por ejemplo, indexación de contenidos de streaming a la carta y recomendación inteligente).