Aprendizaje Automático sobre
Grandes Volúmenes de Datos

Clase 10

Pablo Ariel Duboue, PhD

Universidad Nacional de Córdoba,
Facultad de Matemática, Astronomía y Física
figura escudo.png

None.1 Décima Clase: Teorema CAP

None.1.1 Clase anterior

Material de lectura
Preguntas
Recordatorio
Revisión Map Reduce
Modelo de Programación
Tolerancia a Fallas
Ciclo de vida de una aplicación MR/ML
  1. Ingesta de datos
  2. Creación de modelos
  3. Aplicación de modelos

None.1.2 Teorema CAP

Las 8 falacias del cómputo distribuido
Costo de la Paralelización
Modelo ACID
Teorema CAP
Consistencia
Disponibilidad
Tolerancia a particiones de la red
Modelo de cómputo asíncrono
Teorema CAP asíncrono
Dado el modelo de cómputo asíncrono, no es posible garantizar Consistencia y Disponibilidad
Demostración:
Corolario:
Construcción de Pares
Modelo de cómputo parcialmente asíncrono
Teorema CAP parcialmente asíncrono
En el modelo parcialmente asíncrono tampoco es posible garantizar Consistencia y Disponiblidad en el caso que se pierdan mensajes.
Diferencia importante con el model totalmente asíncrono: si los mensajes no se pierden, es posible garantizar Consistencia y Disponibilidad
Consistencia Eventual
Modelo de sistema centralizado
Teorema CAP revisitado

None.1.3 Aplicaciones Matriciales Distribuidas

Distribución de Matrices Dispersas
Multiplicación de una matriz por un vector