Modelo Bayesiano del Alumno basado en el Estilo de Aprendizaje y

Transcription

Modelo Bayesiano del Alumno basado en el Estilo de Aprendizaje y
IEEE-RITA Vol. 4, Núm. 2, May. 2009
139
Modelo Bayesiano del Alumno basado en el
Estilo de Aprendizaje y las Preferencias
Cristina Carmona Márquez, Gladys Castillo Jordán, Eva Millán Valldeperas
Title— Bayesian Student Model based on Learning Styles and
Preferences
Abstract— Nowadays, modeling user’s preferences is one of
the most challenging tasks in e-learning systems that deal with
large volumes of information. The growth of on-line educational
resources including encyclopaedias, repositories, etc., has made it
crucial to “filter” or “sort” the information shown to the student,
so that he/she can make a better use of it. To find out the
student’s preferences, a commonly used approach is to
implement a decision model that matches some relevant
characteristics of the learning resources with the student’s
learning style. The rules that compose the decision model are, in
general, deterministic by nature and never change over time. In
this paper, we propose to use adaptive machine learning
algorithms to learn about the student’s preferences over time.
First we use all the background knowledge available about a
particular student to build an initial decision model based on
learning styles. This model can then be fine-tuned with the data
generated by the student’s interactions with the system in order
to reflect more accurately his/her current preferences.
Index Terms— Learning Styles, E-Learning, Data Mining,
Bayesian Model.
E
I. INTRODUCCIÓN
N los últimos años se ha desarrollado un gran número de
material educativo diseñado como repositorios de objetos
de aprendizaje (Learning Objects Repositories - LOR), como
por ejemplo MERLOT [1] y ARIADNE [2]. Al usar objetos
de aprendizaje se incrementa la flexibilidad y la posibilidad de
reutilizar el material educativo en distintas instituciones
académicas, editoriales o cualquier otra organización. En los
repositorios, los objetos de aprendizaje se comparten entre
diferentes entornos de aprendizaje y pueden ser accedidos
C. Carmona pertenece al Departamento de Lenguajes y Ciencias de la
Computación, ETSI Informática, Universidad de Málaga, 29071, Málaga,
España (e-mail: [email protected]).
G. Castillo pertenece al Departamento de Matemática, Universidad de
Aveiro, Campus Universitario de Santiago, 3810-193 Aveiro, Portugal (email: [email protected]). Trabajo apoyado por el CEOC (Programa POCTI, FCT)
y co-financiado por EC fund FEDER
E. Millán pertenece al Departamento de Lenguajes y Ciencias de la
Computación, ETSI Informática, Universidad de Málaga, 29071, Málaga,
España (e-mail: [email protected]).
DOI (Digital Object Identifier) Pendiente
tanto por los alumnos como por los profesores. Por un lado,
los alumnos tienen acceso a una gran variedad de objetos de
aprendizaje para poder obtener todo el conocimiento que
necesiten y, por otro lado, los profesores pueden hacer uso de
los materiales de otros autores para su posterior uso en el aula.
En este entorno de enseñanza surgen distintas propuestas para
la definición de objetos de aprendizaje, como el estándar
LOM [3] (Learning Object Metadata) que especifica la
sintaxis y la semántica de los objetos de aprendizaje usando
una serie de atributos que los describen de manera completa y
adecuada.
Uno de los temas clave relacionados con el uso de
repositorios es la recuperación y búsqueda de objetos de
aprendizaje. Para resolver este problema una posibilidad es
filtrar y ordenar los objetos de aprendizaje mostrados al
alumno según su estilo de aprendizaje y sus preferencias. Para
ello es necesario averiguar el estilo de aprendizaje del alumno
utilizando alguno de los instrumentos psicométricos existentes
para después establece reglas que relacionen los estilos de
aprendizaje con los objetos de aprendizaje.
Existen varios sistemas hipermedia educativos que se han
implementado siguiendo esta idea como MANIC [4], AES-CS
[5], INSPIRE [6], iWeaver [7], TANGOW/WOTAN [8],
WHURLE [9] y CS383 [10]. Sin embargo, tal como se dice en
[11], “no existen fórmulas probadas para el uso de los estilos
de aprendizaje en la adaptación”. Esto puede ser debido a que,
en la mayoría de los casos, las suposiciones sobre el estilo de
aprendizaje del alumno, una vez obtenidas, ya no cambian
nunca más con el paso del tiempo. Es más, las reglas que
definen el modelo de decisión tampoco cambian, esto significa
que el modelo se utiliza para la adaptación, pero que no es
capaz de adaptarse él mismo con la llegada de nuevos datos.
Por otro lado, durante la interacción del alumno con el
sistema, éste puede cambiar sus preferencias por otra tipo de
objeto de aprendizaje que ya no se corresponda con el valor
inferido para su estilo de aprendizaje. Este problema se
conoce como “cambio de concepto” (concpet-drift) [12]. En
estos escenarios es interesante contar con modelos de decisión
adaptativos, capaces de ajustarse a las preferencias actuales
del alumno.
La diferencia principal entre nuestro modelo y otros
modelos relacionados es que nosotros intentamos adaptar la
información inicial sobre el estilo de aprendizaje y las
preferencias del alumno observando las interacciones del
usuario con el sistema. En nuestro modelo se utiliza toda la
información disponible para construir un modelo de estilo de
ISSN 1932-8540 © IEEE
140
IEEE-RITA Vol. 4, Núm. 2, May. 2009
aprendizaje (Learning Style Model – LSM) y un modelo de
decisión (Decision Model – DM) para cada alumno.
Para el modelo de estilo de aprendizaje utilizamos una red
bayesiana
[13] que representa el modelo de estilo de
aprendizaje de Felder-Sylverman (FSLSM) [14]. Los valores
iniciales sobre el estilo de aprendizaje se pueden obtener
explícitamente si el alumno contesta al ILSQ [15] (Index of
Learning Styles Questionnaire). Después, las selecciones del
alumno se introducen como evidencias en la red bayesiana,
ejecutándose el mecanismo de propagación de evidencias y
obteniendo nuevos valores para los estilos de aprendizaje. Una
primera versión del modelo de estilo de aprendizaje es la que
aparece en [16].
Para el modelo de decisión utilizamos un clasificador
bayesiano [17] (Bayesian Network Classifier- BNC) que
representa las relaciones entre los estilos de aprendizaje y los
objetos de aprendizaje para decidir si un determinado objeto
puede ser interesante para un alumno o no. El clasificador
inicial se aprende utilizando ejemplos generados
aleatoriamente utilizando una reglas predefinidas. Después,
cuando un alumno selecciona un objeto de aprendizaje (y
también puede dar una evaluación) se incorpora esta
información al modelo para obtener valores actualizados sobre
sus preferencias. Además, nuestro modelo de decisión es
capaz de adaptarse rápidamente a cualquier cambio en las
preferencias del alumno. Esta propuesta es una mejora del
modelo propuesto en [18] y se presentó por primera vez en
[19], donde el estilo de aprendizaje, una vez obtenido, ya no
se actualizaba y donde el modelo de decisión se implementaba
usando un clasificador Naive Bayes (NB).
En la siguiente sección se explica el proceso completo para
seleccionar los objetos de aprendizaje apropiados para un
alumno de entre todos los disponibles. Posteriormente, se
explica brevemente el modelo de estilos de aprendizaje de
Felder-Sylverman (FSLSM) y el diseño del modelo de estilo
de aprendizaje. Finalmente se describe el modelo de decisión
y se concluye con un resumen y unas indicaciones sobre el
trabajo futuro.
aprendizaje seleccionados como apropiados o no apropiados
para el alumno. Para la clasificación se construyen ejemplos
automáticamente, usando los atributos del estilo de
aprendizaje (inferidos del modelo de estilo de aprendizaje) y
los atributos del objeto de aprendizaje. Estos ejemplos se usan
como entrada del modelo de decisión, y dado que utilizamos
un clasificador bayesiano, la salida del modelo será una
probabilidad que indica cómo de apropiado es el objeto de
aprendizaje para el alumno. Para cada ejemplo se obtiene una
probabilidad, por lo que se pueden generar dos listas
ordenadas de objetos de aprendizaje (una para los apropiados
y otra para los no apropiados). Todos los recursos mostrados
al alumno explican el mismo concepto, por lo que si el alumno
selecciona un objeto de aprendizaje, asumimos que le ha
resultado interesante por sus características.
3) Adaptación: Cada vez que el alumno selecciona un
objeto de aprendizaje, es posible etiquetar el ejemplo
correspondiente, por lo que este ejemplo se puede utilizar para
adaptar ambos modelos, el modelo de decisión y el modelo de
estilo de aprendizaje. Para obtener una evaluación aún más
fiable, se propone al alumno que vote el objeto de aprendizaje
seleccionado indicando en qué medida le ha gustado o no.
II. SELECCIÓN DE OBJETOS DE APRENDIZAJE EN UN
REPOSITORIO
El proceso completo para seleccionar los objetos de
aprendizaje apropiados para un determinado concepto según
las características del alumno (nivel de conocimiento, estilo de
aprendizaje y preferencias) y las características del objeto de
aprendizaje se realiza siguiendo los siguientes pasos (Fig. 1):
1) Filtrado: cuando un alumno se identifica en el sistema se
aplican una serie de reglas para filtrar aquellos objetos de
aprendizaje que se corresponden con el idioma definido en el
perfil del alumno.
2) Predicción: cuando un alumno selecciona un concepto,
se filtran los objetos de aprendizaje para obtener aquellos que
explican dicho concepto. Después, se aplica un tercer filtro
para obtener los objetos de aprendizaje que se corresponden
con el nivel de conocimiento del alumno. En este momento, se
utiliza el modelo de decisión para clasificar los objetos de
Fig. 1 Proceso de selección de los objetos de aprendizaje
ISSN 1932-8540 © IEEE
CARMONA, CASTILLO Y MILLÁN: MODELO BAYESIANO DEL ALUMNO
III. ESTILOS DE APRENDIZAJE
El estilo de aprendizaje se puede definir como la forma en
la que las personas recopilan, procesan y organizan la
información. Entre las distintas propuestas para modelar los
estilos de aprendizaje, hemos elegido el modelo de FelderSylverman (FSLSM) ya que es uno de los modelos con mayor
reputación y ha sido implementado con éxito en muchos
sistemas de e-learning. FSLSM clasifica a los alumnos según
cuatro dimensiones:
• Procesamiento (Processing Æ Active / Reflective): Se
considera que las personas activas son capaces de entender la
información solo si han hablado sobre ella, la han aplicado o
han intentado explicárselas a otras personas. En cambio, las
personas reflexivas prefieren pensar sobre el tema antes de
asumir ninguna postura.
• Percepción (Perception Æ Sensing / Intuitive): Las
personas sensitivas aprenden a partir de tareas y hechos que
podrían resolverse mediante métodos bien definidos, sin
sorpresas ni efectos inesperados. Normalmente hace referencia
a estudiantes aficionados a los detalles, con muy buena
memoria de los hechos y aplicaciones prácticas. En el otro
lado, se encuentra los estudiantes intuitivos que prefieren
descubrir posibilidades alternativas y relaciones por si
mismos, trabajando con abstracciones y fórmulas, lo que les
permite comprender nuevos conceptos e innovar rápidamente
realizando nuevas tareas.
• Entrada (Input ÆVisual / Verbal): Las personas visuales
no encuentran dificultades en interpretar imágenes, diagramas,
escalas de tiempo o películas. Al contrario que los estudiantes
verbales cuyo proceso de aprendizaje está dirigido por
explicaciones orales o escritas.
• Comprensión (Understanding Æ Sequential / Global):
Las personas secuenciales estructuran su proceso de
aprendizaje mediante la lógica, la sucesión de pasos
relacionados entre sí para llegar a la solución. Por otro lado,
los estudiantes globales se caracterizan por ver el problema en
su conjunto: a veces son capaces de resolver problemas
complejos aunque no saben cómo han llegado a la solución
Felder&Soloman
propusieron
una
herramienta
psicométrica, el cuestionario ILSQ, que clasifica las
preferencias por una u otra categoría de cada dimensión como
débil, moderado o fuerte. Sin embargo, el uso de tests de este
tipo tiene algunas limitaciones. Primero los alumnos tienden a
responder las preguntas de forma arbitraria. Segundo es
realmente difícil diseñar un test capaz de medir exactamente
cómo aprenden las personas. Por lo tanto, la información
obtenida mediante esos instrumentos incluye cierto grado de
incertidumbre. En la mayoría de los sistemas que utilizan estos
tests, la información sobre el estilo de aprendizaje no se
actualiza tras la llegada de nuevas evidencias de la interacción
del estudiante con el sistema.
Una propuesta que utiliza redes bayesianas para modelar el
estilo de aprendizaje del alumno en lugar de hacerlo mediante
test psicométricos es la que se explica en [21][22]. Al usar una
red bayesiana como modelo de estilo de aprendizaje, las
141
observaciones derivadas del comportamiento del usuario
puedan utilizarse para descubrir el estilo de aprendizaje de
cada usuario de forma automática usando el mecanismo de
inferencia.
Para nuestro modelo de estilo de aprendizaje usamos una
aproximación híbrida. Para cada estudiante, se inicializa una
red bayesiana utilizando las puntuaciones obtenidos en el
ILSQ para las cuatro dimensiones de FSLSM. Posteriormente
se observan las selecciones de los distintos objetos de
aprendizaje por parte del alumno y se almacenan como
evidencias en la red bayesiana. Por lo tanto, cada vez que
llegan nuevas evidencias sobre las preferencias del alumno
(selecciones del alumno y evaluación) se instancia una nueva
evidencia de la red bayesiana, propagándose automáticamente
y actualizando los valores del estilo de aprendizaje. Esto hace
posible refinar los valores iniciales que se obtuvieron de los
alumnos mediante el test ILSQ, a través de las interacciones
de los usuarios, haciendo que el sistema sea cada vez más
fiable.
IV. DISEÑO DE LA RED BAYESIANA
Una red bayesiana [23] se compone de dos partes: la parte
cualitativa (su estructura) y la parte cuantitativa (el conjunto
de parámetros que definen la red). La estructura es un grafo
acíclico dirigido cuyos nodos representan variables aleatorias
y cuyos arcos representan dependencias entre dichas variables.
Los parámetros son probabilidades condicionadas que
representan la fuerza de dichas dependencias. Por tanto, para
modelar el estilo de aprendizaje usando una red bayesiana es
necesario determinar primero las variables de interés y las
relaciones entre dichas variables, es decir, la estructura de la
red. En nuestro modelo tenernos en cuenta tres tipos de
variables:
1) Variables para representar el estilo de aprendizaje del
alumno: para cada dimensión del FSLSM se utiliza una
variable. La lista de variables con el conjunto de valores
posibles es:
• Input = {visual, verbal}
• Processing = {active, reflective}
• Perception = {sensing, intuitive}
• Understanding = {sequential, global}
2) Variables para representar el objeto de aprendizaje
seleccionado: cada vez que el alumno selecciona un objeto de
aprendizaje, el modelo debe anotar los valores de los atributos
seleccionados. En nuestro modelo utilizamos una variable
para cada atributo LOM que está relacionado con los estilos
de aprendizaje. En la Tabla I se muestran los atributos LOM
seleccionados para cada dimensión de los estilos de
aprendizaje y a continuación aparece la lista de variables de la
red bayesiana junto con el conjunto de valores posibles:
• SelectedFormat = {text, image, audio, video, application}
• SelectedLearningResourceType = {exercise, simulation,
questionnaire, figure, index, table, narrative-text, exam,
lecture}
ISSN 1932-8540 © IEEE
142
IEEE-RITA Vol. 4, Núm. 2, May. 2009
• SelectedSemanticDensity = {very-low, low, medium, high,
very-high }
• SelectedInteractivityLevel = {very-low, low, medium, high,
very-high}
• SelectedInteractivityType = { active, expositive, mixed }
• Opción 2: unir las cuatro dimensiones en una única red. En
este caso, el número de parámetros necesarios para la red
bayesiana más grande es de 162000.
Por motivos obvios, se ha elegido la primera opción ya que
la segunda es excesivamente compleja computacionalmente.
3) Una variable para representar la evaluación del alumno
para el objeto de aprendizaje seleccionado: el alumno puede
votar el objeto de aprendizaje con 1, 2, 3, 4 o 5 estrellas.
• SelectedRating = {star1, star2, star3, star4, star5}
TABLA I
RELACIÓN ENTRE LOS ESTILOS DE APRENDIZAJE Y LOS ATRIBUTOS LOM
Dimensión
Input
Processing
Perception
Understanding
Atributos LOM
Technical.Format
Educational.LearningResourceType
Educational.LearningResourceType
Educational.InteractivityType
Educational.InteractivityLevel
Educational.LearningResourceType
Technical.Format
Educational.LearningResourceType
Educational.SemanticDensity
En cuanto a las relaciones entre las variables, consideramos
que el estilo de aprendizaje del alumno determina sus
selecciones. Además, el estilo del aprendizaje del alumno y el
las características del objeto seleccionado determinan la
evaluación del alumno para dicho objeto. Para que el diseño
de la estructura sea lo más claro posible, se modela cada
dimensión por separado. La Fig. 2 muestra la red bayesiana
para modelar la dimensión Input (el resto de las dimensiones
se modelan de forma similar).
Opción 1
Opción 2
Fig. 3 Alternativas para modelar las cuatro dimensiones del estilo de
aprendizaje
Fig. 2 Red bayesiana para modelar la dimensión Input
Para modelar las demás dimensiones del estilo de
aprendizaje se han contemplado dos posibles opciones (Fig.
3):
• Opción 1: se considera cada dimensión por separado, de
forma que se tendrían cuatro redes bayesianas distintas. En
este caso el número de parámetros necesarios para la tabla
de probabilidades condicionadas más grande es de 1350.
Para definir los parámetros de las redes se inicializa la
distribución a priori de los nodos que representan a las
dimensiones de los estilos de aprendizaje con los valores
obtenidos por el alumno en el ILSQ si es que ha realizado el
test. Si no lo ha realizado, se inicializa con una distribución
uniforme.
En cuanto a las tablas de probabilidades condicionadas que
representan las relaciones entre las dimensiones del estilo de
aprendizaje y los atributos LOM, se estiman los valores
usando las tablas definidas por el experto. La Tabla muestra
la tabla definida por el experto para el atributo
LearningResourceType (existe una tabla para cada atributo
LOM).
ISSN 1932-8540 © IEEE
CARMONA, CASTILLO Y MILLÁN: MODELO BAYESIANO DEL ALUMNO
TABLA II
ESTILOS DE APRENDIZAJE Y EL ATRIBUTO LEARNINGRESOURCETYPE
LRT*
1
2
3
4
5
6
7
8
9
VIS
VER
□
■
■
□
□
■
■
□
□
■
□
■
□
■
□
■
■
□
*Los valores para el
3=questionnaire, 4=figure,
9=lecture.
SEN
INT
SEQ
GLO
ACT
REF
■
□
■
□
■
□
■
□
■
□
■
□
□
■
■
□
■
□
■
□
□
■
□
■
■
□
□
■
□
■
■
□
□
■
□
■
□
■
■
□
□
■
■
□
■
□
■
□
□
■
■
□
□
■
atributo LRT son 1=exercise, 2=simulation,
5=index, 6=table, 7= narrative-text, 8=exam y
V. EJEMPLO DE ADAPTACIÓN EN EL MODELO DE ESTILO DE
APRENDIZAJE
En este apartado se presenta un ejemplo de cómo la red
bayesiana es capaz de refinar los valores asociados al estilo de
aprendizaje del alumno a medida que éste interactúa con el
sistema. Por simplicidad, vamos a mostrar sólo los resultados
que se obtienen para la dimensión Input.
Supongamos un alumno que realiza el test ILSQ y obtiene
los siguiente valores para la dimensión Input: visual= 3 y
verbal = 8. El modelo FSLSM clasifica al alumno como
verbal-moderado. El valor inicial de la red se muestra en la
Fig. 4.
143
Las tablas proporcionadas por el experto relacionan los
valores figure e image con la categoría visual de la dimensión
Input y establece que el valor 2star significa que al alumno le
ha gustado el objeto de aprendizaje en un 30%. Una forma de
interpretar esta selección es la siguiente: entre todos los
objetos de aprendizaje mostrados al alumno, éste ha elegido
uno de tipo visual, así que por lo menos al principio ha
mostrado cierta preferencia por esta categoría. Pero finalmente
la evaluación que realiza indica que no le ha gustado mucho.
En la red, cuando estos valores se introducen como evidencias
y se ejecuta el algoritmo de actualización de parámetros, los
valores que se infieren para la dimensión Input muestran un
ligero decremento en el valor de la categoría visual
Supongamos ahora que el mismo alumno selecciona ahora
un objeto de aprendizaje con los valores LRT = lecture,
Format = text y no proporciona ninguna evaluación. En este
caso, la única información disponible es que el alumno ha
seleccionado un objeto de aprendizaje de tipo verbal de entre
todos los objetos disponibles. Dado que no hay evaluación no
se puede determinar en qué medida le ha gustado. La Fig. 6
muestra que cuando esta selección se introduce como
evidencia en la red y se ejecuta el algoritmo de actualización
de parámetros, los valores inferidos para la dimensión Input
muestran un incremento en la categoría verbal.
Fig. 6 Valores para la dimensión Input después de la segunda selección del
alumno
Fig. 4 Valores iniciales para la dimensión Input
Cada vez que el alumno selecciona un recurso, se aplica el
algoritmo de actualización secuencial [13] (sequential update
algorithm) para incorporar la nueva información al modelo.
Supongamos que ahora este alumno selecciona un objeto de
aprendizaje con valores LRT = figure, Format = image y lo
evalúa con 2 estrellas (Fig. 5).
Este ejemplo muestra que cada vez que el alumno hace una
selección, su estilo de aprendizaje se modifica de forma
apropiada, esto es, que la red es capaz de refinar el valor del
estilo de aprendizaje inicial. Si el alumno cambia sus
preferencias, es decir, que empieza a seleccionar objetos de
aprendizaje que no se corresponden con el valor estimado de
su estilo de aprendizaje, la red es capaz de interpretar estas
selecciones y tener en cuenta esta información para actualizar
el modelo.
VI. EL MODELO DE DECISIÓN
Fig. 5 Valores para la dimensión Input después de la primera selección del
alumno
El modelo de decisión se utiliza para determinar si un
determinado objeto de aprendizaje es apropiado para un estilo
de aprendizaje concreto. Este modelo utiliza un clasificador
bayesiano y su comportamiento es muy similar a un sistema
recomendador basado en el contenido. Un sistema
recomendador muestra al usuario la información que le
interesa. Para hacer esto, se compara el perfil del usuario con
ISSN 1932-8540 © IEEE
144
IEEE-RITA Vol. 4, Núm. 2, May. 2009
algunas características de referencia. Estas características
pueden venir en el ítem a recomendar (sistema basado en el
contenido) o en el entorno social del usuario (sistema
colaborativo).
En nuestro modelo, la información sobre el objeto de
aprendizaje (el ítem a recomendar) y sobre el estilo de
aprendizaje del alumno (las características del usuario) es la
entrada del clasificador, que produce como salida una
probabilidad que indica cómo es de apropiado el objeto de
aprendizaje para el alumno (cuanto interesa el ítem al
usuario). Hay dos cuestiones importantes a la hora de definir
el modelo de decisión: la primera es el problema de la
inicialización (cold-start), es decir, obtener los datos para
construir el modelo inicial; la segunda el procedimiento de
adaptación para actualizar el modelo con los nuevos datos.
En nuestro modelo se utilizan una serie de reglas extraídas
de las tablas definidas por el experto (ver Tabla II) para
generar ejemplos de entrenamiento. Estos ejemplos están
formados por 10 atributos: los cuatro primeros representan el
estilo de aprendizaje del alumno, los cinco siguientes
representan las características del objeto de aprendizaje y el
último es la clase. La Tabla III muestra los valores posibles
para cada atributo.
Un posible ejemplo sería 1,4,3,1,6,2,1,2,5,1, que significa
que a un alumno con una preferencia fuerte por visual, una
preferencia moderada por intuitive, una preferencia
equilibrada en la dimensión Understanding y una preferencia
fuerte por active le gusta un objeto de aprendizaje que
implemente la actividad table en el formato image, con un
nivel de interactividad very-low, un tipo de interactividad
expositive y con una densidad semántica very-high.
red bayesiana con una estructura NB1 que permite además que
cada atributo tenga un máximo de k nodos atributos como
padres.
Para definir el modelo inicial hemos realizado varios
experimentos con el fin de obtener el clasificador que mejor se
adapta a los ejemplos de entrenamiento generados con las
reglas del experto. Hemos generado conjunto de datos con
diferente número de instancias (3125, 6250, 9375, 12500,
15625, 18750 y 21875) y de cada tipo generamos 10 muestras.
En cada conjunto de datos están representados todos los
estilos de aprendizaje posibles. Dado que hay 4 atributos para
el estilo de aprendizaje y cada uno puede tener 5 valores, el
número de estilos de aprendizaje distintos es 625. Hemos
generado conjuntos de datos con 5, 10, 15, 20, 25, 30 y 35
ejemplos para cada estilo de aprendizaje. Las características
del objeto de aprendizaje se generan aleatoriamente y el
ejemplo que se obtiene se clasifica utilizando las reglas
extraídas de las tablas del experto. Estos conjuntos de datos se
han utilizado para aprender diferentes modelos: el NB y
distintos k-DBC donde k varía desde 1 hasta 5. Para aprender
los k-DBC se aplica un procedimiento Hill-Climbing junto
con distintas funciones objetivo: BAYES, MDL y AIC.
La Fig. 7 muestra los errores obtenidos con cada modelo y
con cada función objetivo. Estos resultados son el valor medio
de las 10 muestras de los 15625 ejemplos (con conjuntos de
datos más grandes se obtienen resultados muy similares). El
mejor modelo encontrado es un 2-DBC, con k>2 no se mejora
el error de forma significativa.
TABLA III
LOS ATRIBUTOS Y SUS POSIBLES VALORES
Atributo
Input
Perception
Understanding
Processing
Learning
Resource Type
Format
Interactivity
Level
Interactivity
Type
Semantic
Density
Class
Valores
visualStrong(1); visualModerate(2); balanced(3);
verbalModerate(4); verbalStrong(5)
sensingStrong(1); sensingModerate(2); balanced(3);
intuitiveModerate(4); intuitiveStrong(5)
sequentialStrong(1);sequentialModerate(2);
balanced(3); globalModerate(4); globalStrong(5)
activeStrong(1); activeModerate(2); balanced(3);
reflectiveModerate(4); reflectiveStrong(5)
exercise(1); simulation(2); questionnaire(3);
figure(4); index(5); table(6); narrative-text(7);
exam(8); lecture(9)
text(1); image(2); audio(3); video(4);application(5)
very-low(1); low(2); medium(3); high(4); veryhigh(5)
active(1); expositive(2); mixed(3)
very-low(1); low(2); medium(3); high(4); veryhigh(5)
appropriate(1); not_appropriate(2)
Fig. 7 Porcentaje de error para cada k-DBC
En cuanto a la función objetivo, la función AIC es la que
produce el menor error pero el modelo generado es muy
complejo, casi todos los nodos tienen dos padres aparte de la
clase, por lo que finalmente hemos elegido la función BAYES
ya que el modelo es mucho más simple y es la siguiente
función con el mejor error.
La estructura del modelo elegido es la que se muestra en la
Fig. 8. Además de las relaciones entre los atributos y la clase,
hemos encontrado otras dependencias entre los atributos.
Para representar el modelo de decisión vamos a utilizar un
k-DBC [20] (k-Dependence Bayesian Classifier), que es una
1
Un Naive Bayes es una red bayesiana con una estructura simple, donde el
nodo clase es el padre de todos los demás nodos que son atributos
ISSN 1932-8540 © IEEE
CARMONA, CASTILLO Y MILLÁN: MODELO BAYESIANO DEL ALUMNO
Appropriate
Input
Processing Perception Understan..
L.R.T.
Format
I.T.
I.L.
S.D.
Fig. 8 Modelo de decisión inicial
A medida que el alumno interactúa con el sistema, el
modelo inicial se va adaptando utilizan los datos generados
por el usuario. Para construir los ejemplos necesarios para la
adaptación es necesario añadirles la clase correcta, por lo que
necesitamos que el alumno diga cuanto le ha gustado el objeto
de aprendizaje que ha seleccionado. Cada vez que se obtiene
un ejemplo etiquetado (con la clase correcta) se utiliza para
adaptar el modelo. Para la adaptación hay que tener el cuenta
que las observaciones más recientes representan mejor las
preferencias actuales del alumno. Por ello, estamos trabajando
en una adaptación del algoritmo Iterative Bayes (IB) [24] para
clasificadores bayesianos. El algoritmo IB realiza un proceso
de optimización basado en una actualización iterativa de los
parámetros de la red bayesiana. En cada iteración, y para cada
ejemplo, las probabilidades condicionadas correspondientes se
actualizan de forma que se incrementa la probabilidad de la
clase correcta. Dado un ejemplo, se calcula un incremento que
se añade a los contadores correspondientes a la clase predicha
y se substrae de los contadores del resto de las clases. Si el
ejemplo está correctamente clasificado entonces el incremento
es positivo y es igual a 1-P(predicha/X), en otro caso es
negativo. Se ha demostrado experimentalmente que IB reduce
de forma considerable la tase de error, pero su característica
más importante es su habilidad para tratar con escenarios
donde hay cambios de concepto.
Para nuestro modelo proponemos una modificación del
algoritmo IB. La idea principal es utilizar la valoración del
alumno en vez de los valores categóricos de las clases para el
procedimiento de adaptación. Vamos a considerar distintos
valores para los incrementos según las diferencias
cuantitativas entre la clase predicha y la clase observada. Por
ejemplo, si un objeto de aprendizaje se clasifica como
apropiado con una alta probabilidad (5star) y el alumno
finalmente lo evalúa con 4star, entonces tenemos que utilizar
un incremento con un valor mayor que el que se utilizaría si el
alumno lo hubiese votado con 1star.
ventajas de utilizar una red bayesiana es que permite refinar el
valor inicial obtenido con el ILSQ teniendo en cuenta las
selecciones del alumno mientras interactúa con el sistema.
Hemos incluido un ejemplo que ilustra este comportamiento.
Por otro lado, también utilizamos un clasificador bayesiano
adaptativo como modelo de decisión para determinar si un
determinado objeto de aprendizaje es apropiado o no para un
estilo de aprendizaje. Hemos descrito los experimentos
realizados para obtener el modelo inicial, resolviendo así el
problema de la inicialización (cold-start). Para cada alumno
se genera un modelo de decisión inicial que se va adaptando
utilizando las selecciones y votaciones del alumno. Además,
este modelo es capaz de adaptarse a sí mismo, respondiendo
así a los cambios en las preferencias del alumno (conceptdrift). Actualmente estamos trabajando en la adaptación del
algoritmo Iterative Bayes y también en la elaboración de los
experimentos que permitan demostrar que nuestro modelo
funciona correctamente.
REFERENCIAS
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[11]
VII. CONCLUSIÓN
En este trabajo se explica un modelo del usuario adaptativo
enfocado a representar las preferencias del alumno sobre el
material educativo a lo largo del tiempo. Este modelo resulta
muy apropiado para aquellos sistemas de e-learning que
necesitan filtrar grandes volúmenes de información, de forma
que sus usuarios puedan sacar un mejor provecho de los
materiales disponibles.
Para descubrir las preferencias del alumno utilizamos la
información sobre su estilo de aprendizaje, representada en el
modelo de estilo de aprendizaje que es una red bayesiana. Las
145
[12]
[13]
[14]
[15]
MERLOT, http://www.merlot.org. URL last accessed on 01-2008.
ARIADNE, http://www.ariadne-eu.org/. URL last accessed on 01-2008.
IEEE- Learning Technology Standards Committee. “IEEE Standard for
Learning Object Metadata”.
http://ltsc.ieee.org/wg12/files/LOM_1484_12_1_v1_Final_Draft.pdf.
URL last accessed on 01-2008.
Stern, M.K., Woolf, B.P.: Adaptive Content in an Online Lecture
System. Proceedings of the International Conference on Adaptive
Hypermedia and Adaptive Web based Systems, AH2000, (2000) 227238
Triantafillou, E., Pomportsis, A., Demetriadis, S. “The design and the
formative evaluation of an adaptive educational system based on
cognitive styles”. Computers & Education 41, (2003) pp.87-103.
Papanikolaou, K.A., Grigoriadou, M., Kornilakis, H., Magoulas, G. D.
“Personalizing the inter-action in a Web-based educational hypermedia
system: the case of INSPIRE”. User- Modeling and User-Adapted
Interaction 13 (3), (2003) pp.213-267.
Wolf, C. “iWeaver: Towards Learning Style-based e-Learning in
Computer Science Education”. Proceedings of the Fifth Australasian
Computing Education Conference (ACE2003), (2003) pp.273-279.
Paredes, P., Rodriguez, P. “The Application of Learning Styles in Both
Individual and Collaborative Learning”. Proceedings of the sixth IEEE
International Conference on Advanced Learning Technologies
(ICALT'06), (2006) pp.1141-1142.
Brown, E., Stewart, C., Brailsford, T. “Adapting for Visual and Verbal
Learning Styles in AEH”. Proceedings of the sixth IEEE International
Conference on Advanced Learning Technologies (ICALT'06), (2006)
pp.1145-1146.
Carver, C.A., Howard, R.A., Lane, W.D. “Enhancing Student Learning
Trough Hypermedia Courseware and Incorporation of Student Learning
Styles”, IEEE Transactions on Education v.42 nº1, (1999) pp.33-38.
Brusilovsky P., Millán, E. “User Models for Adaptive Hypermedia and
Adaptive Educational Systems”. The Adaptive Web: Methods and
Strategies of Web Personalization, LNCS 4321 (2007) pp.3 – 53
Webb, G., Pazzani, M., Billsus, D.: Machine Learning for User
Modeling. User Modeling and User-Adapted Interaction, v.11 (2001)
19-29
Jensen, F.V., Nielsen T. Bayesian Networks and Decision Graphs.
Springer Verlag New York Inc, (2007)
Felder, R.M., Soloman, B.A. “Learning styles and strategies”, (2003).
URL last accessed on 01-2008. http://www.ncsu.edu/felderpublic/ILSdir/styles.htm
Felder, R.M., Soloman, B.A. “Index of Learning Style Questionnaire
(ILSQ)”. URL last accessed on 01-2008.
http://www.engr.ncsu.edu/learningstyles/ilsweb.html
ISSN 1932-8540 © IEEE
146
IEEE-RITA Vol. 4, Núm. 2, May. 2009
[16] Carmona, C., Castillo, G. and Millán, E.: Designing a Dynamic Bayesian
Network for Modeling Student's Learning Styles. The 8th IEEE
International Conference on Advanced Learning Technologies, ICALT
2008 (2008), 346-350
[17] Friedman, N., Geiger, D. and Goldszmidt, M.: Bayesian Network
Classifiers. Machine Learning, 29 (2-3) (1997) 131–163
[18] Castillo, G., Gama, J., Breda, A.M.: An Adaptive Predictive Model for
Student Modeling. Advances in Web-based Education: Personalized
Learning Environments, (2005) Chapter IV
[19] Carmona, C., Castillo, G. and Millán, E.: Discovering Student
Preferences in E-Learning. International Workshop on Applying Data
Mining in e-Learning, ADML'07 (2007), 33-42
[20] Sahami, M.: Learning Limited Dependence Bayesian Classifiers.
Proceedings of the Second International Conference on Knowledge
Discovery and Data Mining, KDD-96 AAAI Press (1996) 335–338
[21] García, P., Amandi, A., Schiaffino, S., Campo, M. “Evaluating Bayesian
networks’ precision for detecting students’ learning styles”. Computers
& Education 49, (2007) pp.794-808.
[22] Dan, Y. XinMeng, C. “Using Bayesian Networks to Implement
Adaptivity in Mobile Learning”. Proceedings of the Second International
Conference on Semantics, Knowledge, and Grid (SKG’06), (2006)
[23] Pearl, J. Probabilistic Reasoning in Expert Systems: Networks of
Plausible Inference. (1988). San Francisco: Morgan Kaufmann
Publishers, Inc.
[24] Gama, J.: Iterative Bayes. Discovery Science - Second International
Conference, LNAI 1721, (1999)
Cristina Carmona recibió el título de Ingeniera en
Informática por la Universidad de Málaga en 1997.
Actualmente está realizando su tesis doctoral en el
Departamento de Lenguajes y Ciencias de la
Computación de la misma Universidad. Ha estado
trabajando durante algunos años desarrollando
software para hospitales y centros de salud en
Novasoft S.A. Actualmente sus líneas de
investigación están relacionadas con el modelado del
alumno y la aplicación de la minería de datos en los sistemas educativos.
Gladys Castillo obtuvo su doctorado en
Matemática en la Universidad de Aveiro en 2006
donde actualmente trabaja como profesora asistente
en el departamento de Matemática e investigadora
del Centro de Estudios en Optimización y Control.
Durante los últimos años ha centrado su
investigación en el área de Aprendizaje Automático
con énfasis en el desarrollo de sistemas de
aprendizaje on-line y adaptativos usando
clasificadores de redes Bayesianas.
Eva Millán es licenciada en Matemáticas
(Universidad de Málaga, año 1989) y Doctora
Ingeniera en Informática (Universidad de Málaga,
año 2000). Desde el año 1989 es profesora en el
Departamento de Lenguajes y Ciencias de la
Computación de la Universidad de Málaga en el
que desde el año 2002 es profesora Titular de
Universidad. Ha sido visitante en Stanford Research
Institute en Menlo Park, California (verano 1998 y
1999). Su área principal de investigación es modelado del usuario en Entornos
de Aprendizaje Adaptativos, en el cual tiene numerosas publicaciones en
congresos y revistas internacionales. Ha realizado revisiones científicas de
artículos para las conferencias Artificial Intelligence in Education, Adaptive
Hypermedia, User Modeling e Intelligent Tutoring Systems y para las revistas
International Journal of Atificial Intelligence in Education e International
Journal of User Modeling and User Adapted Interaction. Actualmente es
Subdirectora de Innovación Educativa de la ETSI de Informática de la
Universidad de Málaga.
ISSN 1932-8540 © IEEE