Segundo examen parcial.

Transcription

Segundo examen parcial.
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
Facultad de Estudios Superiores Acatlán
Diplomado: Técnicas estadísticas y minería de datos.
Módulo IV. Minería de datos.
Utilice los siguientes datos para realizar los ejercicios.
Instancia
1
2
3
4
5
6
7
8
9
A1
+
+
+
+
+
A2
20
70
44
32
81
29
43
83
19
A3
0.1
0.3
0.08
0.41
0.11
0.06
0.21
0.38
0.1
Clase
0
1
1
1
1
0
0
1
1) K-nn.
a) Utilizando las primeras 8 instancias como datos de entrenamiento, cuál es su
predicción para la instancia 9 utilizando K-nn, modo reagrupamiento general.
Realice una propuesta para el valor de k.
b) Con el mismo valor de k trabaje ahora en modo reagrupamiento por clase, cuál es
su predicción.
2) BPNN.
a) Proponga una topología de red neuronal, proponga pesos, tetas iniciales y tasa de
aprendizaje.
b) Realice el pre-procesamiento necesario a las columnas A1, A2 y A3 para trabajar
atributos binomiales.
c) Escoja una de las tuplas, aliméntela a su red, retro-propague el error e indique los
nuevos pesos.
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
Facultad de Estudios Superiores Acatlán
Diplomado: Técnicas estadísticas y minería de datos.
Módulo IV. Minería de datos.
3) Formación de conglomerados
a) Utilizando sólo las columnas A2 y A3 encuentre dos grupos utilizando el algoritmo
de formación de grupos ascendente jerárquico.
b) Ahora utilice el algoritmo de K-medias.
c) Asigne una etiqueta de clase a los grupos que formó que haga sentido de acuerdo a
la columna de clase, utilizando este valor como una predicción, realice una matriz
de confusión y una evaluación de desempeño.