Aprendizaje Automático sobre
Grandes Volúmenes de Datos

Clase 8

Pablo Ariel Duboue, PhD

Universidad Nacional de Córdoba,
Facultad de Matemática, Astronomía y Física
figura escudo.png

None.1 Octava Clase: Recomendación

None.1.1 Clase anterior

Material de lectura
Preguntas
Recordatorio
Revisión EM
hML = argmaxh ∈ Hp(D|h)
hML = argmaxh ∈ Hp(di|h)
hML = argmaxh ∈ H(1)/((2πσ2))e − (1)/(2σ²)(di − μ)2
Estimador ML
hML  =  argmaxh ∈ H(1)/((2πσ2))e − (1)/(2σ²)(di − μ)2  =  argmaxh ∈ H(1)/((2πσ2))e − (1)/(2σ²)(di − h(xi))2  =  argminh ∈ Hmi = 1(di − h(xi))2
Ejemplo de EM
μML = argminμmi = 1(xi − μ)2
Calculando los E[zij]
E[zij]  =  (p(x = xi|μ = μi))/(2n = 1p(x = xi|μ = μn))  =  (e − (1)/(2σ²)(xi − μj)2)/(2n = 1e − (1)/(2σ²)(xi − μn)2)
Calculando los μi
μj = (mi = 1E[zij]xi)/(mi = 1E[zij])

None.1.2 Recomendación

Collaborative Filtering
Recomendación basada en Usuarios
Vecindad de Usuarios
Métricas de similitud de Usuarios
Métricas de similitud de Usuarios
Inferencia de Preferencias
Recomendación basada en Ítems
Interpretación Matricial
i1 i2 i3 i4 i5
i1 5 2 1 3 4
i2 3 1 2 3
i3 4 2 2
i4 1 1
i5 7
i1 i2 i3 i4 i5
5 2 1 3 4
Algoritmo Pendiente-uno

None.1.3 Cierra Aprendizaje Automático

Resúmen
Naive Bayes
P(y|f⃗) = (P(f⃗|y)P(y))/(P(f⃗))
yNB = maxyP(f1, ..., fn|y)P(y) = maxyP(f1|y)...P(fn|y)P(y)
NB: de conteos a probabilidades
Árboles de Decisión
figura CART_tree_titanic_survivors.png

(CC-BY-SA Stephen Milborrow, from Wikipedia)
ID3
ID3 (Ejemplos, Clase Objetivo, Features)
Crear un nodo raíz
Si todos los ejemplos son positivos, devolver la raíz con clase +
Si todos los ejemplos son negativos, devolver la raíz con clase -
Si no quedan features, devolver la raíz con clase igual al valor más común
Caso contrario
A ← la feature que mejor clasifica los ejemplos
El feature en la raíz es A
Para cada valor posible vi del feature A
Devolver la raíz
Information Gain
Entropy(S) =  − p + log2(p + ) − p − log2(p − )
Entropy(S) = mi = 1 − pilog2pi
Gain(S, A) = Entropy(S) − v ∈ valores(A)(|Sv|)/(|S|)Entropy(Sv)
K-Means
Recomendación basada en Ítems