Aprendizaje Automático sobre
Grandes Volúmenes de Datos

Clase 12

Pablo Ariel Duboue, PhD

Universidad Nacional de Córdoba,
Facultad de Matemática, Astronomía y Física
figura escudo.png

None.1 Duodécima Clase: Descomposición LU distribuida

None.1.1 Clase anterior

Material de lectura
Preguntas
Recordatorio
Distribución de Matrices Dispersas
Multiplicación de una matriz por un vector
Ax =  a11 a12 a1n a21 a22 a2n am1 am2 amn x1 x2 xn  =  a11x1 + a12x2 + ⋯ + a1nxn a21x1 + a22x2 + ⋯ + a2nxn am1x1 + am2x2 + ⋯ + amnxn
http://mathinsight.org/matrix_vector_multiplication
Matriz por vector en MR
Multiplicación de Matriz por Matriz
b11 b12 b1p b21 b22 b2p bn1 bn2 bnp  =  b11 b21 bn1 b12 b22 bn2 b1p b2p bnp
http://mathinsight.org/matrix_vector_multiplication
Matriz por Matriz dispersa
Solución de Ax = b

None.2 Descomposición LU distribuida

Temas Claves
Inversión Matricial
Algoritmos clásicos para encontrar la matriz inversa
Descomposición LU
Descomposición LU
figura fig310.png
(adaptado de Xiang Jingen, 2013)
Descomposición LU
figura fig311.png
(adaptado de Xiang Jingen, 2013)
Descomposición LU en una máquina
figura algoritmo5.png
(adaptado de Xiang Jingen, 2013)
Descomposición LU en MR
figura lu.png
(adaptado de Xiang Jingen, 2013)
Descomposición LU en MR
figura fig313.png
(adaptado de Xiang Jingen, 2013)
El algoritmo a vuelo de pájaro
El Algoritmo
figura algoritmo6.png
(adaptado de Xiang Jingen, 2013)
Implementación en MapReduce
Implementación en MapReduce
  1. Nodo master crea archivos de control que son usados como entrada a las tareas map subsecuentes
    • Falsas entradas
  2. Una tarea MapReduce subdivide A de manera recursiva
  3. Se envian tareas MapReduce para L2, U2 y B
    • L1 y U1 son ejecutadas en el master node si A1es lo suficientemente pequeña
Datos
figura fig33.png
(adaptado de Xiang Jingen, 2013)
Ejecución
figura fig34.png
(adaptado de Xiang Jingen, 2013)

None.3 Descenso por el gradiente distribuido

Zinkevich et al., NIPS 2010
Algoritmo en nodo worker
figura algoritmo1.png
(adaptado de Zinkevich et al, 2010)
Algoritmo en nodo central
figura algoritmo2.png
(adaptado de Zinkevich et al, 2010)