Clase 0: Presentación del Curso



Inglés.altamente recomendada.Se espera que los estudiantes dominen las siguientes tecnologías:
parejas (T1, T2, T3, T4) \[NP = 0.35 \cdot P1 + 0.35 \cdot P2 + 0.3 \cdot \bar{T}\] \[ \bar{T} = (T1 + T2 + T3 + T4)/4 \]Si NP > 5
\[NF = NP\]
En caso contrario:
\[NF = 0.7 \cdot NP + 0.3 \cdot E\]
“The process of identifying valid, novel, potentially useful, and ultimately understandable patterns in data.” (Fayyad, Piatetsky-Shapiro & Smith 1996)
“A computer program is said to learn from experience
Ewith respect to some class of tasksTand performance measureP, if its performance at tasks inT, as measured byP, improves with experienceE.” (Mitchell, 2006)








data types, por lo que normalmente requiere de algún tipo de preprocesamiento.En este tipo de aprendizaje se enseña por refuerzo. Es decir se da una recompensa si el sistema aprende lo que queremos.
Si el premio es mayor, se pueden obtener aprendizajes mayores.
Un ejemplo de esto es AlphaTensor en el cual un modelo aprendió una nueva manera de multiplicar matrices que es más eficiente.
Otro ejemplo es AlphaFold donde el modelo aprendió/descubrió cómo se doblan las proteínas cuando se vuelven aminoácidos.

(Estimar el valor de una casa).(Clasificar una imagen como Perro o Gato).etiquetas, es decir, la respuesta esperada del modelo.

clase.Creemos un Sistema de ML que sea capaz de ver una imágen y pronunciar correctamente el uso de la letra C.
Vamos a Entrenar un Modelo.

Kasa
Kokodrilo
Kubo¿Qué patrones está aprendiendo el modelo?
Es el proceso en el cuál se permite al modelo aprender. En este proceso se le entregan ejemplos (
Train Set) para que el modelo de maneraautónomapueda aprenderpatronesque le permitan resolver la tarea dada.
Se refiere al proceso en el que el modelo tiene que demostrar cuál sería su decisión de acuerdo a los patrones aprendidos en el proceso de entrenamiento. Los ejemplos en los que se prueba se le denomina
Test Set.




Kollar
Konejo
Kukillo
Bikikleta
Se le llama generalización a la capacidad del modelo de aplicar lo aprendido de manera correcta en ejemplos no vistos.

Kuchillo
Chokolate
SinselNo es bueno entrenar con las mismas instancias de de Test, es decir, con las cuales se evalúa el modelo. ¿Por qué?




Kollar
Konejo
Kuchillo
Bisikleta
Utilizar una métrica que permita
ponerle notaal modelo.
Supongamos que queremos utilizar nuestro modelo para pronunciar palabras en otro idioma (otro Test Set).
¿Qué problemas podemos encontrar?
Stomach \(\rightarrow\) Stomak
Archer \(\rightarrow\) Archer
Church \(\rightarrow\) Churk
Archeology \(\rightarrow\) Archeology
Chicago \(\rightarrow\) Chicago
Muscle \(\rightarrow\) Muskle
Ich mag Schweinefleisch \(\rightarrow\) Ich mag Schweinefleisk.
Claramente tenemos un problema. ¿A qué se debe esto?
Se refiere a cuando un modelo no es capaz de generalizar de manera correcta, porque se ajusta
demasiadobien (llegando amemorizar) a los datos de entrenamiento. ¿Cómo se puede mitigar este problema?
Se le tiende a llamar sobreentrenamiento, pero no es del todo correcto para el caso de modelos de Machine Learning. Lo más correcto es que el sobreentrenamiento provoca overfitting.
Se refiere a cuando un modelo no es capaz de generalizar de manera correcta, pero a diferencia del overfitting
no se ha ajustadocorrectamente a los datos. ¿Cómo se vería el underfitting en nuestro ejemplo?
