Aprendizaje Automático sobre
Grandes Volúmenes de Datos

Clase 9

Pablo Ariel Duboue, PhD

Universidad Nacional de Córdoba,
Facultad de Matemática, Astronomía y Física
figura escudo.png

None.1 Novena Clase: Map Reduce

None.1.1 Clase anterior

Material de lectura
Preguntas
Recordatorio

None.1.2 Cómputo Distribuido

Cómputo Distribuido
Modelo de Cluster de Máquinas
MapReduce
Teorema CAP
Operaciones Matriciales Distribuidas
Descenso por el Gradiente
Otros Modelos
Paralelizando Algoritmos

None.1.3 Map/Reduce

Objetivo
Modelo de Programación
Ejemplo: Contar Palabras
Ejemplos de Uso en Google
Ejecución
figura execution.png
(fuente: http://research.google.com/archive/mapreduce-osdi04-slides/index-auto-0007.html)
En Paralelo
figura parallel.png
(fuente: http://research.google.com/archive/mapreduce-osdi04-slides/index-auto-0008.html)
Pipelining
Pipelining
figura mrstatus1.png
Pipelining
figura mrstatus2.png
Pipelining
figura mrstatus3.png
Pipelining
figura mrstatus4.png
Pipelining
figura mrstatus5.png
Pipelining
figura mrstatus6.png
Pipelining
figura mrstatus7.png
Pipelining
figura mrstatus8.png
Pipelining
figura mrstatus9.png
Pipelining
figura mrstatus10.png
Pipelining
figura mrstatus11.png
Tolerancia a Fallas
GFS y Localidad de los Datos
Ejemplos