Aprendizaje Automático sobre
Grandes Volúmenes de Datos

Clase 2

Pablo Ariel Duboue, PhD

Universidad Nacional de Córdoba,
Facultad de Matemática, Astronomía y Física
figura escudo.png

None.1 Segunda Clase: Modelos

None.1.1 Features

Representando Instancias
Ejemplo: perros
Representaciones diversas
Representando una palabra
Representando un texto
Representando imágenes
Representando imágenes
figura pablo_surf.jpg
Representando árboles
Representando trayectorias
Representando series en tiempo
Representando audio
Para feature engineering

None.1.2 Modelos

¿Qué es un modelo?
“Un ente que aprende que no asume nada acerca de la identidad del concepto objetivo no tiene ninguna base racional para clasificar cosas que nunca vio.”
Mitchel (1997)
El modelo como código objeto
Propiedades de los modelos
Sesgo inductivo
El conjunto de entrenamiento como modelo
El dilema del sesgo vs. varianza
Ejemplo bias-variance dilemma
figura 800px-Test_function_and_noisy_data.png
(CC-BY-SA Anders Sandberg)
Ejemplo bias-variance dilemma
figura 800px-Radial_basis_function_fit,_spread=5.png
(CC-BY-SA Anders Sandberg)
Ejemplo bias-variance dilemma
figura 800px-Radial_basis_function_fit,_spread=1.png
(CC-BY-SA Anders Sandberg)
Ejemplo bias-variance dilemma
figura 800px-Radial_basis_function_fit,_spread=0.1.png
(CC-BY-SA Anders Sandberg)
Modelos Generativos vs. Discriminantes
Modelos Generativos
Modelos Discriminantes
Teorema del No Free Lunch

None.1.3 Evaluación

Evaluando modelos
Precision/Recall
precision = (|correctamenteanotado|)/(|anotado|) = (tp)/(tp + fp)
recall = (|correctamenteanotado|)/(|habiaqueanotar|) = (tp)/(tp + fn)
Métrica F
F = 2⋅(PR)/(P + R)
Fβ = (1 + β²)⋅(PR)/((β²P) + R)
Ejemplo métrica F
figura bio_rules_exp1.png
ROC
Promediado micro y macro
Trampas de evaluación
Concordancia entre anotadores
κ = (P(A) − P(E))/(1 − P(E))
donde P(A) es la concordancia observada yP(E) el la concordancia esperada por chance entre los anotadores si eligieran el mismo número de veces por cada categoría, al azar.
Ejemplo de la Kappa de Cohen
B si B no
A si 20 5
A no 10 15
κ = (0.7 − 0.5)/(1 − 0.5) = 0.4
La computadora como otro anotador
Ejemplo en biología
Métricas de evaluación ad-hoc
figura roc-curve-watson.png
Overfitting
figura overfitting.png
@AcademicSays
Overfitting
figura Overfitting_svg.png
(CC-BY Gringer)
Aprendizaje interrumpido
Cros-validación
¿Cuántos datos? Curvas de aprendizaje
Ejemplo de curva de aprendizaje
Filtering Personal Queries from Mixed-Use Query Logs por A. Bressane Neto, P. Desaulniers, P.A. Duboue, A. Smirnov (Canadian AI, 2014)
figura recall_20.png
Curva de aprendizaje sobre grandes volúmenes de datos
Large Language Models in Machine Translation por T. Brants, A.C. Popat, P. Xu, F.J. Och, J. Dean (EMNLP-CoNLL, 2007)
figura brants-al-fig8.png