Clase 0: Presentación del Curso
Inglés
.altamente recomendada
.Se espera que los estudiantes dominen las siguientes tecnologías:
parejas
(T1, T2, T3, T4) \[NP = 0.35 \cdot P1 + 0.35 \cdot P2 + 0.3 \cdot \bar{T}\] \[ \bar{T} = (T1 + T2 + T3 + T4)/4 \]Si NP > 5
\[NF = NP\]
En caso contrario:
\[NF = 0.7 \cdot NP + 0.3 \cdot E\]
“The process of identifying valid, novel, potentially useful, and ultimately understandable patterns in data.” (Fayyad, Piatetsky-Shapiro & Smith 1996)
“A computer program is said to learn from experience
E
with respect to some class of tasksT
and performance measureP
, if its performance at tasks inT
, as measured byP
, improves with experienceE
.” (Mitchell, 2006)
data types
, por lo que normalmente requiere de algún tipo de preprocesamiento.En este tipo de aprendizaje se enseña por refuerzo. Es decir se da una recompensa si el sistema aprende lo que queremos.
Si el premio es mayor, se pueden obtener aprendizajes mayores.
Un ejemplo de esto es AlphaTensor en el cual un modelo aprendió
una nueva manera de multiplicar matrices que es más eficiente.
Otro ejemplo es AlphaFold donde el modelo aprendió/descubrió
cómo se doblan las proteínas cuando se vuelven aminoácidos.
(Estimar el valor de una casa)
.(Clasificar una imagen como Perro o Gato)
.etiquetas
, es decir, la respuesta esperada del modelo.clase
.Creemos un Sistema de ML que sea capaz de ver una imágen y pronunciar correctamente el uso de la letra C
.
Vamos a Entrenar
un Modelo.
K
asaK
ok
odriloK
ubo¿Qué patrones está aprendiendo el modelo?
Es el proceso en el cuál se permite al modelo aprender. En este proceso se le entregan ejemplos (
Train Set
) para que el modelo de maneraautónoma
pueda aprenderpatrones
que le permitan resolver la tarea dada.
Se refiere al proceso en el que el modelo tiene que demostrar cuál sería su decisión de acuerdo a los patrones aprendidos en el proceso de entrenamiento. Los ejemplos en los que se prueba se le denomina
Test Set
.
K
ollar
K
onejo
K
uk
illo
Bik
ik
leta
Se le llama generalización a la capacidad del modelo de aplicar lo aprendido de manera correcta en ejemplos no vistos.
K
uch
illoCh
ok
olateS
ins
elNo es bueno entrenar con las mismas instancias de de Test
, es decir, con las cuales se evalúa el modelo. ¿Por qué?
K
ollar
K
onejo
K
uch
illo
Bis
ik
leta
Utilizar una métrica que permita
ponerle nota
al modelo.
Supongamos que queremos utilizar nuestro modelo para pronunciar palabras en otro idioma (otro Test Set
).
¿Qué problemas podemos encontrar?
Stomach \(\rightarrow\) Stomak
Archer \(\rightarrow\) Archer
Church \(\rightarrow\) Churk
Archeology \(\rightarrow\) Arch
eology
Chicago \(\rightarrow\) Ch
icago
Muscle \(\rightarrow\) Musk
le
Ich mag Schweinefleisch \(\rightarrow\) Ich
mag Sch
weinefleisk
.
Claramente tenemos un problema. ¿A qué se debe esto?
Se refiere a cuando un modelo no es capaz de generalizar de manera correcta, porque se ajusta
demasiado
bien (llegando amemorizar
) a los datos de entrenamiento. ¿Cómo se puede mitigar este problema?
Se le tiende a llamar sobreentrenamiento
, pero no es del todo correcto para el caso de modelos de Machine Learning. Lo más correcto es que el sobreentrenamiento
provoca overfitting.
Se refiere a cuando un modelo no es capaz de generalizar de manera correcta, pero a diferencia del overfitting
no se ha ajustado
correctamente a los datos. ¿Cómo se vería el underfitting en nuestro ejemplo?