Las diferencias entre el aprendizaje automático convencional y el aprendizaje automático en tiempo real

  • 28 de junio de 2022
  • IA adaptativa

El primero utiliza el procesamiento de datos por lotes (batch), mientras que el segundo, basado en el modelo de procesamiento de flujo de datos (stream), maneja datos que se van haciendo disponibles a lo largo del tiempo.

No todos los modelos predictivos construidos con Machine Learning son iguales. Hay quienes asumen que el comportamiento de los datos es siempre el mismo y, por lo tanto, se degradan con el tiempo y pierden precisión, y los que se actualizan automáticamente en tiempo real (sobre la marcha) mantienen un alto nivel de precisión a lo largo del tiempo, independientemente de los cambios de comportamiento que puedan producirse.

En este artículo explicaremos las diferencias entre estos dos tipos de algoritmos predictivos y sus aplicaciones prácticas.

Lo que hace el aprendizaje automático es transformar una base de datos masiva, comúnmente denominada «big data», en modelos predictivos, que son modelos matemáticos y estadísticos que predicen el futuro.  Actualmente, la aplicación de estos modelos es cada vez más amplia y estos algoritmos predictivos intentan «adivinar» prácticamente todo: desde acontecimientos —¿qué tiempo hará mañana?— hasta comportamientos humanos —¿qué productos debo ofrecer a mis clientes para aumentar las ventas?—. 

Los modelos convencionales, utilizados por la mayoría de las empresas, se elaboran a partir de un tipo de procesamiento de datos denominado batch, o lote, en español; el segundo se basa en el procesamiento de stream , es decir, flujo de datos.

Los dos términos, «batch» (lote) y «stream» (flujo), ya nos dan una primera pista sobre cómo se alimentan de datos estos dos tipos de modelos predictivos.

En el modelo Batch, también llamado Machine Learning tradicional, los datos se recopilan a lo largo de un período de tiempo y, a continuación, ese lote de información se envía para su procesamiento, análisis y alimentación del algoritmo predictivo. 

En el modelo Stream, también conocido como Machine Learning on-the-fly (o en tiempo real), tan pronto como los datos están disponibles, ya pueden ser procesados. No hay necesidad de almacenarlos durante un largo período, ya que el modelo puede procesarlos en tiempo real.

Esta es la principal diferencia entre las dos tecnologías: una puede actualizarse siempre que los datos estén disponibles y la otra no, ya que necesita recrear el modelo desde cero. Aquí surgen varios retos, como por ejemplo: determinar el momento en el que hay que borrar un modelo y crear uno nuevo, o qué datos se deben utilizar para crear este nuevo modelo. ¿Es positivo, o incluso viable, utilizar todos los datos históricos (¿podemos esperar días o semanas hasta que el nuevo modelo esté listo para su uso?)?

La vertiente Data Stream surgió para procesar, de forma rápida y con un bajo coste computacional, grandes volúmenes de datos que forman un flujo prácticamente interminable. Además, estos algoritmos generan y actualizan modelos a lo largo del tiempo, lo que permite que los modelos se adapten siempre a la realidad de los datos y a su comportamiento, que puede cambiar.

Los modelos por lotes suelen utilizarse en volúmenes más pequeños y funcionan mucho mejor que los streamers cuando ese volumen es bajo, precisamente porque el streamer necesita un gran volumen para converger y formar un modelo predictivo. El procesamiento por lotes también se puede utilizar en grandes volúmenes, pero es probable que haya un proceso de muestreo para que funcionen.

Las diferencias entre el procesamiento de datos por lotes y en flujo continuo no terminan ahí. 

Los modelos predictivos basados en el procesamiento de datos por lotes tardan más en implementarse: las etapas de modelado, selección y preprocesamiento de datos pueden llevar meses; por el contrario, los algoritmos alimentados con flujos de datos pueden crearse rápidamente y trabajar con nuevos datos siempre que estén disponibles.

Los modelos Batch también tienen un ciclo de vida muy corto cuando se aplican a entornos dinámicos, ya que quedan obsoletos rápidamente. Por su parte, los modelos Stream tienen una validez indeterminada, ya que el sistema detecta automáticamente las variaciones y adapta el modelo de forma automática. 

 

El modelo predictivo de 4KST

 

La tecnología de 4KST es única. Con nuestro propio algoritmo, desarrollamos modelos predictivos incrementales y adaptativos a partir de la tecnología Stream.

Es decir, no nos quedamos atrapados en los datos del pasado. Y nuestros modelos son capaces de actualizarse en tiempo real.

Con ello, reducimos el fraude, las devoluciones y la evasión, y realizamos las mejores previsiones de ventas y demanda. Ofrecemos lo que necesita para actuar en un mundo cada vez más dinámico.

Además, nuestros modelos tienen un bajo coste de mantenimiento y se pueden escalar fácilmente.

 4KST cuenta con una gama de soluciones de inteligencia artificial que pueden emplearse en prácticamente todos los segmentos de la economía de forma sencilla, rápida y económica. 

¿Le interesa nuestra tecnología de aprendizaje automático? ¡Visite nuestro sitio web y conozca todos nuestros productos!

Adelántese a la competencia c
.

Optimice sus decisiones estratégicas con las previsiones más precisas del mercado
.


  • Cumplimiento con la LGPD
  • Resolución BCB n.º 85/2021
  • Certificación ISO/ISE 27001:2022