Modelo Bayesiano del Alumno basado en el Estilo de Aprendizaje y
Transcription
Modelo Bayesiano del Alumno basado en el Estilo de Aprendizaje y
IEEE-RITA Vol. 4, Núm. 2, May. 2009 139 Modelo Bayesiano del Alumno basado en el Estilo de Aprendizaje y las Preferencias Cristina Carmona Márquez, Gladys Castillo Jordán, Eva Millán Valldeperas Title— Bayesian Student Model based on Learning Styles and Preferences Abstract— Nowadays, modeling user’s preferences is one of the most challenging tasks in e-learning systems that deal with large volumes of information. The growth of on-line educational resources including encyclopaedias, repositories, etc., has made it crucial to “filter” or “sort” the information shown to the student, so that he/she can make a better use of it. To find out the student’s preferences, a commonly used approach is to implement a decision model that matches some relevant characteristics of the learning resources with the student’s learning style. The rules that compose the decision model are, in general, deterministic by nature and never change over time. In this paper, we propose to use adaptive machine learning algorithms to learn about the student’s preferences over time. First we use all the background knowledge available about a particular student to build an initial decision model based on learning styles. This model can then be fine-tuned with the data generated by the student’s interactions with the system in order to reflect more accurately his/her current preferences. Index Terms— Learning Styles, E-Learning, Data Mining, Bayesian Model. E I. INTRODUCCIÓN N los últimos años se ha desarrollado un gran número de material educativo diseñado como repositorios de objetos de aprendizaje (Learning Objects Repositories - LOR), como por ejemplo MERLOT [1] y ARIADNE [2]. Al usar objetos de aprendizaje se incrementa la flexibilidad y la posibilidad de reutilizar el material educativo en distintas instituciones académicas, editoriales o cualquier otra organización. En los repositorios, los objetos de aprendizaje se comparten entre diferentes entornos de aprendizaje y pueden ser accedidos C. Carmona pertenece al Departamento de Lenguajes y Ciencias de la Computación, ETSI Informática, Universidad de Málaga, 29071, Málaga, España (e-mail: [email protected]). G. Castillo pertenece al Departamento de Matemática, Universidad de Aveiro, Campus Universitario de Santiago, 3810-193 Aveiro, Portugal (email: [email protected]). Trabajo apoyado por el CEOC (Programa POCTI, FCT) y co-financiado por EC fund FEDER E. Millán pertenece al Departamento de Lenguajes y Ciencias de la Computación, ETSI Informática, Universidad de Málaga, 29071, Málaga, España (e-mail: [email protected]). DOI (Digital Object Identifier) Pendiente tanto por los alumnos como por los profesores. Por un lado, los alumnos tienen acceso a una gran variedad de objetos de aprendizaje para poder obtener todo el conocimiento que necesiten y, por otro lado, los profesores pueden hacer uso de los materiales de otros autores para su posterior uso en el aula. En este entorno de enseñanza surgen distintas propuestas para la definición de objetos de aprendizaje, como el estándar LOM [3] (Learning Object Metadata) que especifica la sintaxis y la semántica de los objetos de aprendizaje usando una serie de atributos que los describen de manera completa y adecuada. Uno de los temas clave relacionados con el uso de repositorios es la recuperación y búsqueda de objetos de aprendizaje. Para resolver este problema una posibilidad es filtrar y ordenar los objetos de aprendizaje mostrados al alumno según su estilo de aprendizaje y sus preferencias. Para ello es necesario averiguar el estilo de aprendizaje del alumno utilizando alguno de los instrumentos psicométricos existentes para después establece reglas que relacionen los estilos de aprendizaje con los objetos de aprendizaje. Existen varios sistemas hipermedia educativos que se han implementado siguiendo esta idea como MANIC [4], AES-CS [5], INSPIRE [6], iWeaver [7], TANGOW/WOTAN [8], WHURLE [9] y CS383 [10]. Sin embargo, tal como se dice en [11], “no existen fórmulas probadas para el uso de los estilos de aprendizaje en la adaptación”. Esto puede ser debido a que, en la mayoría de los casos, las suposiciones sobre el estilo de aprendizaje del alumno, una vez obtenidas, ya no cambian nunca más con el paso del tiempo. Es más, las reglas que definen el modelo de decisión tampoco cambian, esto significa que el modelo se utiliza para la adaptación, pero que no es capaz de adaptarse él mismo con la llegada de nuevos datos. Por otro lado, durante la interacción del alumno con el sistema, éste puede cambiar sus preferencias por otra tipo de objeto de aprendizaje que ya no se corresponda con el valor inferido para su estilo de aprendizaje. Este problema se conoce como “cambio de concepto” (concpet-drift) [12]. En estos escenarios es interesante contar con modelos de decisión adaptativos, capaces de ajustarse a las preferencias actuales del alumno. La diferencia principal entre nuestro modelo y otros modelos relacionados es que nosotros intentamos adaptar la información inicial sobre el estilo de aprendizaje y las preferencias del alumno observando las interacciones del usuario con el sistema. En nuestro modelo se utiliza toda la información disponible para construir un modelo de estilo de ISSN 1932-8540 © IEEE 140 IEEE-RITA Vol. 4, Núm. 2, May. 2009 aprendizaje (Learning Style Model – LSM) y un modelo de decisión (Decision Model – DM) para cada alumno. Para el modelo de estilo de aprendizaje utilizamos una red bayesiana [13] que representa el modelo de estilo de aprendizaje de Felder-Sylverman (FSLSM) [14]. Los valores iniciales sobre el estilo de aprendizaje se pueden obtener explícitamente si el alumno contesta al ILSQ [15] (Index of Learning Styles Questionnaire). Después, las selecciones del alumno se introducen como evidencias en la red bayesiana, ejecutándose el mecanismo de propagación de evidencias y obteniendo nuevos valores para los estilos de aprendizaje. Una primera versión del modelo de estilo de aprendizaje es la que aparece en [16]. Para el modelo de decisión utilizamos un clasificador bayesiano [17] (Bayesian Network Classifier- BNC) que representa las relaciones entre los estilos de aprendizaje y los objetos de aprendizaje para decidir si un determinado objeto puede ser interesante para un alumno o no. El clasificador inicial se aprende utilizando ejemplos generados aleatoriamente utilizando una reglas predefinidas. Después, cuando un alumno selecciona un objeto de aprendizaje (y también puede dar una evaluación) se incorpora esta información al modelo para obtener valores actualizados sobre sus preferencias. Además, nuestro modelo de decisión es capaz de adaptarse rápidamente a cualquier cambio en las preferencias del alumno. Esta propuesta es una mejora del modelo propuesto en [18] y se presentó por primera vez en [19], donde el estilo de aprendizaje, una vez obtenido, ya no se actualizaba y donde el modelo de decisión se implementaba usando un clasificador Naive Bayes (NB). En la siguiente sección se explica el proceso completo para seleccionar los objetos de aprendizaje apropiados para un alumno de entre todos los disponibles. Posteriormente, se explica brevemente el modelo de estilos de aprendizaje de Felder-Sylverman (FSLSM) y el diseño del modelo de estilo de aprendizaje. Finalmente se describe el modelo de decisión y se concluye con un resumen y unas indicaciones sobre el trabajo futuro. aprendizaje seleccionados como apropiados o no apropiados para el alumno. Para la clasificación se construyen ejemplos automáticamente, usando los atributos del estilo de aprendizaje (inferidos del modelo de estilo de aprendizaje) y los atributos del objeto de aprendizaje. Estos ejemplos se usan como entrada del modelo de decisión, y dado que utilizamos un clasificador bayesiano, la salida del modelo será una probabilidad que indica cómo de apropiado es el objeto de aprendizaje para el alumno. Para cada ejemplo se obtiene una probabilidad, por lo que se pueden generar dos listas ordenadas de objetos de aprendizaje (una para los apropiados y otra para los no apropiados). Todos los recursos mostrados al alumno explican el mismo concepto, por lo que si el alumno selecciona un objeto de aprendizaje, asumimos que le ha resultado interesante por sus características. 3) Adaptación: Cada vez que el alumno selecciona un objeto de aprendizaje, es posible etiquetar el ejemplo correspondiente, por lo que este ejemplo se puede utilizar para adaptar ambos modelos, el modelo de decisión y el modelo de estilo de aprendizaje. Para obtener una evaluación aún más fiable, se propone al alumno que vote el objeto de aprendizaje seleccionado indicando en qué medida le ha gustado o no. II. SELECCIÓN DE OBJETOS DE APRENDIZAJE EN UN REPOSITORIO El proceso completo para seleccionar los objetos de aprendizaje apropiados para un determinado concepto según las características del alumno (nivel de conocimiento, estilo de aprendizaje y preferencias) y las características del objeto de aprendizaje se realiza siguiendo los siguientes pasos (Fig. 1): 1) Filtrado: cuando un alumno se identifica en el sistema se aplican una serie de reglas para filtrar aquellos objetos de aprendizaje que se corresponden con el idioma definido en el perfil del alumno. 2) Predicción: cuando un alumno selecciona un concepto, se filtran los objetos de aprendizaje para obtener aquellos que explican dicho concepto. Después, se aplica un tercer filtro para obtener los objetos de aprendizaje que se corresponden con el nivel de conocimiento del alumno. En este momento, se utiliza el modelo de decisión para clasificar los objetos de Fig. 1 Proceso de selección de los objetos de aprendizaje ISSN 1932-8540 © IEEE CARMONA, CASTILLO Y MILLÁN: MODELO BAYESIANO DEL ALUMNO III. ESTILOS DE APRENDIZAJE El estilo de aprendizaje se puede definir como la forma en la que las personas recopilan, procesan y organizan la información. Entre las distintas propuestas para modelar los estilos de aprendizaje, hemos elegido el modelo de FelderSylverman (FSLSM) ya que es uno de los modelos con mayor reputación y ha sido implementado con éxito en muchos sistemas de e-learning. FSLSM clasifica a los alumnos según cuatro dimensiones: • Procesamiento (Processing Æ Active / Reflective): Se considera que las personas activas son capaces de entender la información solo si han hablado sobre ella, la han aplicado o han intentado explicárselas a otras personas. En cambio, las personas reflexivas prefieren pensar sobre el tema antes de asumir ninguna postura. • Percepción (Perception Æ Sensing / Intuitive): Las personas sensitivas aprenden a partir de tareas y hechos que podrían resolverse mediante métodos bien definidos, sin sorpresas ni efectos inesperados. Normalmente hace referencia a estudiantes aficionados a los detalles, con muy buena memoria de los hechos y aplicaciones prácticas. En el otro lado, se encuentra los estudiantes intuitivos que prefieren descubrir posibilidades alternativas y relaciones por si mismos, trabajando con abstracciones y fórmulas, lo que les permite comprender nuevos conceptos e innovar rápidamente realizando nuevas tareas. • Entrada (Input ÆVisual / Verbal): Las personas visuales no encuentran dificultades en interpretar imágenes, diagramas, escalas de tiempo o películas. Al contrario que los estudiantes verbales cuyo proceso de aprendizaje está dirigido por explicaciones orales o escritas. • Comprensión (Understanding Æ Sequential / Global): Las personas secuenciales estructuran su proceso de aprendizaje mediante la lógica, la sucesión de pasos relacionados entre sí para llegar a la solución. Por otro lado, los estudiantes globales se caracterizan por ver el problema en su conjunto: a veces son capaces de resolver problemas complejos aunque no saben cómo han llegado a la solución Felder&Soloman propusieron una herramienta psicométrica, el cuestionario ILSQ, que clasifica las preferencias por una u otra categoría de cada dimensión como débil, moderado o fuerte. Sin embargo, el uso de tests de este tipo tiene algunas limitaciones. Primero los alumnos tienden a responder las preguntas de forma arbitraria. Segundo es realmente difícil diseñar un test capaz de medir exactamente cómo aprenden las personas. Por lo tanto, la información obtenida mediante esos instrumentos incluye cierto grado de incertidumbre. En la mayoría de los sistemas que utilizan estos tests, la información sobre el estilo de aprendizaje no se actualiza tras la llegada de nuevas evidencias de la interacción del estudiante con el sistema. Una propuesta que utiliza redes bayesianas para modelar el estilo de aprendizaje del alumno en lugar de hacerlo mediante test psicométricos es la que se explica en [21][22]. Al usar una red bayesiana como modelo de estilo de aprendizaje, las 141 observaciones derivadas del comportamiento del usuario puedan utilizarse para descubrir el estilo de aprendizaje de cada usuario de forma automática usando el mecanismo de inferencia. Para nuestro modelo de estilo de aprendizaje usamos una aproximación híbrida. Para cada estudiante, se inicializa una red bayesiana utilizando las puntuaciones obtenidos en el ILSQ para las cuatro dimensiones de FSLSM. Posteriormente se observan las selecciones de los distintos objetos de aprendizaje por parte del alumno y se almacenan como evidencias en la red bayesiana. Por lo tanto, cada vez que llegan nuevas evidencias sobre las preferencias del alumno (selecciones del alumno y evaluación) se instancia una nueva evidencia de la red bayesiana, propagándose automáticamente y actualizando los valores del estilo de aprendizaje. Esto hace posible refinar los valores iniciales que se obtuvieron de los alumnos mediante el test ILSQ, a través de las interacciones de los usuarios, haciendo que el sistema sea cada vez más fiable. IV. DISEÑO DE LA RED BAYESIANA Una red bayesiana [23] se compone de dos partes: la parte cualitativa (su estructura) y la parte cuantitativa (el conjunto de parámetros que definen la red). La estructura es un grafo acíclico dirigido cuyos nodos representan variables aleatorias y cuyos arcos representan dependencias entre dichas variables. Los parámetros son probabilidades condicionadas que representan la fuerza de dichas dependencias. Por tanto, para modelar el estilo de aprendizaje usando una red bayesiana es necesario determinar primero las variables de interés y las relaciones entre dichas variables, es decir, la estructura de la red. En nuestro modelo tenernos en cuenta tres tipos de variables: 1) Variables para representar el estilo de aprendizaje del alumno: para cada dimensión del FSLSM se utiliza una variable. La lista de variables con el conjunto de valores posibles es: • Input = {visual, verbal} • Processing = {active, reflective} • Perception = {sensing, intuitive} • Understanding = {sequential, global} 2) Variables para representar el objeto de aprendizaje seleccionado: cada vez que el alumno selecciona un objeto de aprendizaje, el modelo debe anotar los valores de los atributos seleccionados. En nuestro modelo utilizamos una variable para cada atributo LOM que está relacionado con los estilos de aprendizaje. En la Tabla I se muestran los atributos LOM seleccionados para cada dimensión de los estilos de aprendizaje y a continuación aparece la lista de variables de la red bayesiana junto con el conjunto de valores posibles: • SelectedFormat = {text, image, audio, video, application} • SelectedLearningResourceType = {exercise, simulation, questionnaire, figure, index, table, narrative-text, exam, lecture} ISSN 1932-8540 © IEEE 142 IEEE-RITA Vol. 4, Núm. 2, May. 2009 • SelectedSemanticDensity = {very-low, low, medium, high, very-high } • SelectedInteractivityLevel = {very-low, low, medium, high, very-high} • SelectedInteractivityType = { active, expositive, mixed } • Opción 2: unir las cuatro dimensiones en una única red. En este caso, el número de parámetros necesarios para la red bayesiana más grande es de 162000. Por motivos obvios, se ha elegido la primera opción ya que la segunda es excesivamente compleja computacionalmente. 3) Una variable para representar la evaluación del alumno para el objeto de aprendizaje seleccionado: el alumno puede votar el objeto de aprendizaje con 1, 2, 3, 4 o 5 estrellas. • SelectedRating = {star1, star2, star3, star4, star5} TABLA I RELACIÓN ENTRE LOS ESTILOS DE APRENDIZAJE Y LOS ATRIBUTOS LOM Dimensión Input Processing Perception Understanding Atributos LOM Technical.Format Educational.LearningResourceType Educational.LearningResourceType Educational.InteractivityType Educational.InteractivityLevel Educational.LearningResourceType Technical.Format Educational.LearningResourceType Educational.SemanticDensity En cuanto a las relaciones entre las variables, consideramos que el estilo de aprendizaje del alumno determina sus selecciones. Además, el estilo del aprendizaje del alumno y el las características del objeto seleccionado determinan la evaluación del alumno para dicho objeto. Para que el diseño de la estructura sea lo más claro posible, se modela cada dimensión por separado. La Fig. 2 muestra la red bayesiana para modelar la dimensión Input (el resto de las dimensiones se modelan de forma similar). Opción 1 Opción 2 Fig. 3 Alternativas para modelar las cuatro dimensiones del estilo de aprendizaje Fig. 2 Red bayesiana para modelar la dimensión Input Para modelar las demás dimensiones del estilo de aprendizaje se han contemplado dos posibles opciones (Fig. 3): • Opción 1: se considera cada dimensión por separado, de forma que se tendrían cuatro redes bayesianas distintas. En este caso el número de parámetros necesarios para la tabla de probabilidades condicionadas más grande es de 1350. Para definir los parámetros de las redes se inicializa la distribución a priori de los nodos que representan a las dimensiones de los estilos de aprendizaje con los valores obtenidos por el alumno en el ILSQ si es que ha realizado el test. Si no lo ha realizado, se inicializa con una distribución uniforme. En cuanto a las tablas de probabilidades condicionadas que representan las relaciones entre las dimensiones del estilo de aprendizaje y los atributos LOM, se estiman los valores usando las tablas definidas por el experto. La Tabla muestra la tabla definida por el experto para el atributo LearningResourceType (existe una tabla para cada atributo LOM). ISSN 1932-8540 © IEEE CARMONA, CASTILLO Y MILLÁN: MODELO BAYESIANO DEL ALUMNO TABLA II ESTILOS DE APRENDIZAJE Y EL ATRIBUTO LEARNINGRESOURCETYPE LRT* 1 2 3 4 5 6 7 8 9 VIS VER □ ■ ■ □ □ ■ ■ □ □ ■ □ ■ □ ■ □ ■ ■ □ *Los valores para el 3=questionnaire, 4=figure, 9=lecture. SEN INT SEQ GLO ACT REF ■ □ ■ □ ■ □ ■ □ ■ □ ■ □ □ ■ ■ □ ■ □ ■ □ □ ■ □ ■ ■ □ □ ■ □ ■ ■ □ □ ■ □ ■ □ ■ ■ □ □ ■ ■ □ ■ □ ■ □ □ ■ ■ □ □ ■ atributo LRT son 1=exercise, 2=simulation, 5=index, 6=table, 7= narrative-text, 8=exam y V. EJEMPLO DE ADAPTACIÓN EN EL MODELO DE ESTILO DE APRENDIZAJE En este apartado se presenta un ejemplo de cómo la red bayesiana es capaz de refinar los valores asociados al estilo de aprendizaje del alumno a medida que éste interactúa con el sistema. Por simplicidad, vamos a mostrar sólo los resultados que se obtienen para la dimensión Input. Supongamos un alumno que realiza el test ILSQ y obtiene los siguiente valores para la dimensión Input: visual= 3 y verbal = 8. El modelo FSLSM clasifica al alumno como verbal-moderado. El valor inicial de la red se muestra en la Fig. 4. 143 Las tablas proporcionadas por el experto relacionan los valores figure e image con la categoría visual de la dimensión Input y establece que el valor 2star significa que al alumno le ha gustado el objeto de aprendizaje en un 30%. Una forma de interpretar esta selección es la siguiente: entre todos los objetos de aprendizaje mostrados al alumno, éste ha elegido uno de tipo visual, así que por lo menos al principio ha mostrado cierta preferencia por esta categoría. Pero finalmente la evaluación que realiza indica que no le ha gustado mucho. En la red, cuando estos valores se introducen como evidencias y se ejecuta el algoritmo de actualización de parámetros, los valores que se infieren para la dimensión Input muestran un ligero decremento en el valor de la categoría visual Supongamos ahora que el mismo alumno selecciona ahora un objeto de aprendizaje con los valores LRT = lecture, Format = text y no proporciona ninguna evaluación. En este caso, la única información disponible es que el alumno ha seleccionado un objeto de aprendizaje de tipo verbal de entre todos los objetos disponibles. Dado que no hay evaluación no se puede determinar en qué medida le ha gustado. La Fig. 6 muestra que cuando esta selección se introduce como evidencia en la red y se ejecuta el algoritmo de actualización de parámetros, los valores inferidos para la dimensión Input muestran un incremento en la categoría verbal. Fig. 6 Valores para la dimensión Input después de la segunda selección del alumno Fig. 4 Valores iniciales para la dimensión Input Cada vez que el alumno selecciona un recurso, se aplica el algoritmo de actualización secuencial [13] (sequential update algorithm) para incorporar la nueva información al modelo. Supongamos que ahora este alumno selecciona un objeto de aprendizaje con valores LRT = figure, Format = image y lo evalúa con 2 estrellas (Fig. 5). Este ejemplo muestra que cada vez que el alumno hace una selección, su estilo de aprendizaje se modifica de forma apropiada, esto es, que la red es capaz de refinar el valor del estilo de aprendizaje inicial. Si el alumno cambia sus preferencias, es decir, que empieza a seleccionar objetos de aprendizaje que no se corresponden con el valor estimado de su estilo de aprendizaje, la red es capaz de interpretar estas selecciones y tener en cuenta esta información para actualizar el modelo. VI. EL MODELO DE DECISIÓN Fig. 5 Valores para la dimensión Input después de la primera selección del alumno El modelo de decisión se utiliza para determinar si un determinado objeto de aprendizaje es apropiado para un estilo de aprendizaje concreto. Este modelo utiliza un clasificador bayesiano y su comportamiento es muy similar a un sistema recomendador basado en el contenido. Un sistema recomendador muestra al usuario la información que le interesa. Para hacer esto, se compara el perfil del usuario con ISSN 1932-8540 © IEEE 144 IEEE-RITA Vol. 4, Núm. 2, May. 2009 algunas características de referencia. Estas características pueden venir en el ítem a recomendar (sistema basado en el contenido) o en el entorno social del usuario (sistema colaborativo). En nuestro modelo, la información sobre el objeto de aprendizaje (el ítem a recomendar) y sobre el estilo de aprendizaje del alumno (las características del usuario) es la entrada del clasificador, que produce como salida una probabilidad que indica cómo es de apropiado el objeto de aprendizaje para el alumno (cuanto interesa el ítem al usuario). Hay dos cuestiones importantes a la hora de definir el modelo de decisión: la primera es el problema de la inicialización (cold-start), es decir, obtener los datos para construir el modelo inicial; la segunda el procedimiento de adaptación para actualizar el modelo con los nuevos datos. En nuestro modelo se utilizan una serie de reglas extraídas de las tablas definidas por el experto (ver Tabla II) para generar ejemplos de entrenamiento. Estos ejemplos están formados por 10 atributos: los cuatro primeros representan el estilo de aprendizaje del alumno, los cinco siguientes representan las características del objeto de aprendizaje y el último es la clase. La Tabla III muestra los valores posibles para cada atributo. Un posible ejemplo sería 1,4,3,1,6,2,1,2,5,1, que significa que a un alumno con una preferencia fuerte por visual, una preferencia moderada por intuitive, una preferencia equilibrada en la dimensión Understanding y una preferencia fuerte por active le gusta un objeto de aprendizaje que implemente la actividad table en el formato image, con un nivel de interactividad very-low, un tipo de interactividad expositive y con una densidad semántica very-high. red bayesiana con una estructura NB1 que permite además que cada atributo tenga un máximo de k nodos atributos como padres. Para definir el modelo inicial hemos realizado varios experimentos con el fin de obtener el clasificador que mejor se adapta a los ejemplos de entrenamiento generados con las reglas del experto. Hemos generado conjunto de datos con diferente número de instancias (3125, 6250, 9375, 12500, 15625, 18750 y 21875) y de cada tipo generamos 10 muestras. En cada conjunto de datos están representados todos los estilos de aprendizaje posibles. Dado que hay 4 atributos para el estilo de aprendizaje y cada uno puede tener 5 valores, el número de estilos de aprendizaje distintos es 625. Hemos generado conjuntos de datos con 5, 10, 15, 20, 25, 30 y 35 ejemplos para cada estilo de aprendizaje. Las características del objeto de aprendizaje se generan aleatoriamente y el ejemplo que se obtiene se clasifica utilizando las reglas extraídas de las tablas del experto. Estos conjuntos de datos se han utilizado para aprender diferentes modelos: el NB y distintos k-DBC donde k varía desde 1 hasta 5. Para aprender los k-DBC se aplica un procedimiento Hill-Climbing junto con distintas funciones objetivo: BAYES, MDL y AIC. La Fig. 7 muestra los errores obtenidos con cada modelo y con cada función objetivo. Estos resultados son el valor medio de las 10 muestras de los 15625 ejemplos (con conjuntos de datos más grandes se obtienen resultados muy similares). El mejor modelo encontrado es un 2-DBC, con k>2 no se mejora el error de forma significativa. TABLA III LOS ATRIBUTOS Y SUS POSIBLES VALORES Atributo Input Perception Understanding Processing Learning Resource Type Format Interactivity Level Interactivity Type Semantic Density Class Valores visualStrong(1); visualModerate(2); balanced(3); verbalModerate(4); verbalStrong(5) sensingStrong(1); sensingModerate(2); balanced(3); intuitiveModerate(4); intuitiveStrong(5) sequentialStrong(1);sequentialModerate(2); balanced(3); globalModerate(4); globalStrong(5) activeStrong(1); activeModerate(2); balanced(3); reflectiveModerate(4); reflectiveStrong(5) exercise(1); simulation(2); questionnaire(3); figure(4); index(5); table(6); narrative-text(7); exam(8); lecture(9) text(1); image(2); audio(3); video(4);application(5) very-low(1); low(2); medium(3); high(4); veryhigh(5) active(1); expositive(2); mixed(3) very-low(1); low(2); medium(3); high(4); veryhigh(5) appropriate(1); not_appropriate(2) Fig. 7 Porcentaje de error para cada k-DBC En cuanto a la función objetivo, la función AIC es la que produce el menor error pero el modelo generado es muy complejo, casi todos los nodos tienen dos padres aparte de la clase, por lo que finalmente hemos elegido la función BAYES ya que el modelo es mucho más simple y es la siguiente función con el mejor error. La estructura del modelo elegido es la que se muestra en la Fig. 8. Además de las relaciones entre los atributos y la clase, hemos encontrado otras dependencias entre los atributos. Para representar el modelo de decisión vamos a utilizar un k-DBC [20] (k-Dependence Bayesian Classifier), que es una 1 Un Naive Bayes es una red bayesiana con una estructura simple, donde el nodo clase es el padre de todos los demás nodos que son atributos ISSN 1932-8540 © IEEE CARMONA, CASTILLO Y MILLÁN: MODELO BAYESIANO DEL ALUMNO Appropriate Input Processing Perception Understan.. L.R.T. Format I.T. I.L. S.D. Fig. 8 Modelo de decisión inicial A medida que el alumno interactúa con el sistema, el modelo inicial se va adaptando utilizan los datos generados por el usuario. Para construir los ejemplos necesarios para la adaptación es necesario añadirles la clase correcta, por lo que necesitamos que el alumno diga cuanto le ha gustado el objeto de aprendizaje que ha seleccionado. Cada vez que se obtiene un ejemplo etiquetado (con la clase correcta) se utiliza para adaptar el modelo. Para la adaptación hay que tener el cuenta que las observaciones más recientes representan mejor las preferencias actuales del alumno. Por ello, estamos trabajando en una adaptación del algoritmo Iterative Bayes (IB) [24] para clasificadores bayesianos. El algoritmo IB realiza un proceso de optimización basado en una actualización iterativa de los parámetros de la red bayesiana. En cada iteración, y para cada ejemplo, las probabilidades condicionadas correspondientes se actualizan de forma que se incrementa la probabilidad de la clase correcta. Dado un ejemplo, se calcula un incremento que se añade a los contadores correspondientes a la clase predicha y se substrae de los contadores del resto de las clases. Si el ejemplo está correctamente clasificado entonces el incremento es positivo y es igual a 1-P(predicha/X), en otro caso es negativo. Se ha demostrado experimentalmente que IB reduce de forma considerable la tase de error, pero su característica más importante es su habilidad para tratar con escenarios donde hay cambios de concepto. Para nuestro modelo proponemos una modificación del algoritmo IB. La idea principal es utilizar la valoración del alumno en vez de los valores categóricos de las clases para el procedimiento de adaptación. Vamos a considerar distintos valores para los incrementos según las diferencias cuantitativas entre la clase predicha y la clase observada. Por ejemplo, si un objeto de aprendizaje se clasifica como apropiado con una alta probabilidad (5star) y el alumno finalmente lo evalúa con 4star, entonces tenemos que utilizar un incremento con un valor mayor que el que se utilizaría si el alumno lo hubiese votado con 1star. ventajas de utilizar una red bayesiana es que permite refinar el valor inicial obtenido con el ILSQ teniendo en cuenta las selecciones del alumno mientras interactúa con el sistema. Hemos incluido un ejemplo que ilustra este comportamiento. Por otro lado, también utilizamos un clasificador bayesiano adaptativo como modelo de decisión para determinar si un determinado objeto de aprendizaje es apropiado o no para un estilo de aprendizaje. Hemos descrito los experimentos realizados para obtener el modelo inicial, resolviendo así el problema de la inicialización (cold-start). Para cada alumno se genera un modelo de decisión inicial que se va adaptando utilizando las selecciones y votaciones del alumno. Además, este modelo es capaz de adaptarse a sí mismo, respondiendo así a los cambios en las preferencias del alumno (conceptdrift). Actualmente estamos trabajando en la adaptación del algoritmo Iterative Bayes y también en la elaboración de los experimentos que permitan demostrar que nuestro modelo funciona correctamente. REFERENCIAS [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] VII. CONCLUSIÓN En este trabajo se explica un modelo del usuario adaptativo enfocado a representar las preferencias del alumno sobre el material educativo a lo largo del tiempo. Este modelo resulta muy apropiado para aquellos sistemas de e-learning que necesitan filtrar grandes volúmenes de información, de forma que sus usuarios puedan sacar un mejor provecho de los materiales disponibles. Para descubrir las preferencias del alumno utilizamos la información sobre su estilo de aprendizaje, representada en el modelo de estilo de aprendizaje que es una red bayesiana. Las 145 [12] [13] [14] [15] MERLOT, http://www.merlot.org. URL last accessed on 01-2008. ARIADNE, http://www.ariadne-eu.org/. URL last accessed on 01-2008. IEEE- Learning Technology Standards Committee. “IEEE Standard for Learning Object Metadata”. http://ltsc.ieee.org/wg12/files/LOM_1484_12_1_v1_Final_Draft.pdf. URL last accessed on 01-2008. Stern, M.K., Woolf, B.P.: Adaptive Content in an Online Lecture System. Proceedings of the International Conference on Adaptive Hypermedia and Adaptive Web based Systems, AH2000, (2000) 227238 Triantafillou, E., Pomportsis, A., Demetriadis, S. “The design and the formative evaluation of an adaptive educational system based on cognitive styles”. Computers & Education 41, (2003) pp.87-103. Papanikolaou, K.A., Grigoriadou, M., Kornilakis, H., Magoulas, G. D. “Personalizing the inter-action in a Web-based educational hypermedia system: the case of INSPIRE”. User- Modeling and User-Adapted Interaction 13 (3), (2003) pp.213-267. Wolf, C. “iWeaver: Towards Learning Style-based e-Learning in Computer Science Education”. Proceedings of the Fifth Australasian Computing Education Conference (ACE2003), (2003) pp.273-279. Paredes, P., Rodriguez, P. “The Application of Learning Styles in Both Individual and Collaborative Learning”. Proceedings of the sixth IEEE International Conference on Advanced Learning Technologies (ICALT'06), (2006) pp.1141-1142. Brown, E., Stewart, C., Brailsford, T. “Adapting for Visual and Verbal Learning Styles in AEH”. Proceedings of the sixth IEEE International Conference on Advanced Learning Technologies (ICALT'06), (2006) pp.1145-1146. Carver, C.A., Howard, R.A., Lane, W.D. “Enhancing Student Learning Trough Hypermedia Courseware and Incorporation of Student Learning Styles”, IEEE Transactions on Education v.42 nº1, (1999) pp.33-38. Brusilovsky P., Millán, E. “User Models for Adaptive Hypermedia and Adaptive Educational Systems”. The Adaptive Web: Methods and Strategies of Web Personalization, LNCS 4321 (2007) pp.3 – 53 Webb, G., Pazzani, M., Billsus, D.: Machine Learning for User Modeling. User Modeling and User-Adapted Interaction, v.11 (2001) 19-29 Jensen, F.V., Nielsen T. Bayesian Networks and Decision Graphs. Springer Verlag New York Inc, (2007) Felder, R.M., Soloman, B.A. “Learning styles and strategies”, (2003). URL last accessed on 01-2008. http://www.ncsu.edu/felderpublic/ILSdir/styles.htm Felder, R.M., Soloman, B.A. “Index of Learning Style Questionnaire (ILSQ)”. URL last accessed on 01-2008. http://www.engr.ncsu.edu/learningstyles/ilsweb.html ISSN 1932-8540 © IEEE 146 IEEE-RITA Vol. 4, Núm. 2, May. 2009 [16] Carmona, C., Castillo, G. and Millán, E.: Designing a Dynamic Bayesian Network for Modeling Student's Learning Styles. The 8th IEEE International Conference on Advanced Learning Technologies, ICALT 2008 (2008), 346-350 [17] Friedman, N., Geiger, D. and Goldszmidt, M.: Bayesian Network Classifiers. Machine Learning, 29 (2-3) (1997) 131–163 [18] Castillo, G., Gama, J., Breda, A.M.: An Adaptive Predictive Model for Student Modeling. Advances in Web-based Education: Personalized Learning Environments, (2005) Chapter IV [19] Carmona, C., Castillo, G. and Millán, E.: Discovering Student Preferences in E-Learning. International Workshop on Applying Data Mining in e-Learning, ADML'07 (2007), 33-42 [20] Sahami, M.: Learning Limited Dependence Bayesian Classifiers. Proceedings of the Second International Conference on Knowledge Discovery and Data Mining, KDD-96 AAAI Press (1996) 335–338 [21] García, P., Amandi, A., Schiaffino, S., Campo, M. “Evaluating Bayesian networks’ precision for detecting students’ learning styles”. Computers & Education 49, (2007) pp.794-808. [22] Dan, Y. XinMeng, C. “Using Bayesian Networks to Implement Adaptivity in Mobile Learning”. Proceedings of the Second International Conference on Semantics, Knowledge, and Grid (SKG’06), (2006) [23] Pearl, J. Probabilistic Reasoning in Expert Systems: Networks of Plausible Inference. (1988). San Francisco: Morgan Kaufmann Publishers, Inc. [24] Gama, J.: Iterative Bayes. Discovery Science - Second International Conference, LNAI 1721, (1999) Cristina Carmona recibió el título de Ingeniera en Informática por la Universidad de Málaga en 1997. Actualmente está realizando su tesis doctoral en el Departamento de Lenguajes y Ciencias de la Computación de la misma Universidad. Ha estado trabajando durante algunos años desarrollando software para hospitales y centros de salud en Novasoft S.A. Actualmente sus líneas de investigación están relacionadas con el modelado del alumno y la aplicación de la minería de datos en los sistemas educativos. Gladys Castillo obtuvo su doctorado en Matemática en la Universidad de Aveiro en 2006 donde actualmente trabaja como profesora asistente en el departamento de Matemática e investigadora del Centro de Estudios en Optimización y Control. Durante los últimos años ha centrado su investigación en el área de Aprendizaje Automático con énfasis en el desarrollo de sistemas de aprendizaje on-line y adaptativos usando clasificadores de redes Bayesianas. Eva Millán es licenciada en Matemáticas (Universidad de Málaga, año 1989) y Doctora Ingeniera en Informática (Universidad de Málaga, año 2000). Desde el año 1989 es profesora en el Departamento de Lenguajes y Ciencias de la Computación de la Universidad de Málaga en el que desde el año 2002 es profesora Titular de Universidad. Ha sido visitante en Stanford Research Institute en Menlo Park, California (verano 1998 y 1999). Su área principal de investigación es modelado del usuario en Entornos de Aprendizaje Adaptativos, en el cual tiene numerosas publicaciones en congresos y revistas internacionales. Ha realizado revisiones científicas de artículos para las conferencias Artificial Intelligence in Education, Adaptive Hypermedia, User Modeling e Intelligent Tutoring Systems y para las revistas International Journal of Atificial Intelligence in Education e International Journal of User Modeling and User Adapted Interaction. Actualmente es Subdirectora de Innovación Educativa de la ETSI de Informática de la Universidad de Málaga. ISSN 1932-8540 © IEEE