Home » n. 7 gennaio 2002

Utilizzo del Data Mining: verso la personalizzazione della formazione a distanza

7 gennaio 2002 | di Roberto Baldascino

Roberto Baldascino è Tecnico ricercatore presso l'I.R.R.E. Marche e componente del Gruppo di progetto "Teamfad" per la formazione a distanza del personale docente delle reti ALICE.

Per contattare l'autore di questo articolo puoi scrivere a: roberto.baldascino@irre.marche.it

Uno dei maggiori problemi che abbiamo incontrato come formatori del gruppo Teamfad è la limitata conoscenza delle tante diversificate caratteristiche cognitive dei corsisti che avevamo virtualmente di fronte, e in che maniera queste ultime erano sollecitate dal nostro nuovo ambiente di apprendimento a distanza. E' importante sottolineare che una caratteristica dei nostri corsi è anche quella di prevedere alcuni, se pur limitati, incontri in presenza, soprattutto nelle fasi di presentazione delle attività e in quelle laboratoriali (dove si realizzano in pratica le cose apprese in teoria). Conseguentemente questa forma "ibrida" permette una maggior socializzazione tra le parti coinvolte e perciò anche una maggior conoscenza di tanti elementi in più che non possono essere recepiti dai canali normali su cui si basa la comunicazione di un corso FAD. In effetti l'interattività sincrona e asincrona che è parte integrante di un qualsiasi attività a distanza, tramite mailinglist, newsgroup, chat ed e-mail, pur garantendo un importantissimo scambio di informazioni sia esplicite e sia, in parte, implicite tra gli utenti stessi e tra questi ultimi con i formatori, riescono a dare solo un'immagine parziale di come il corsista utilizzi realmente l'ambiente virtuale di apprendimento. Anche i tanti questionari di omogeneizzazione, di monitoraggio e di valutazione che possono essere somministrati in diversi periodi del corso, riescono solo a fornire un'idea approssimata di come avviene l'utilizzazione del materiale e l'apprendimento; inoltre, la maggior parte dei dati raccolti sono soprattutto formali. Al contrario, i dati più sono informali e legati alle abitudini, al modo di porsi nei confronti dell'ambiente di formazione, più assumono un'importanza rilevante. Questi ultimi, ovviamente, sono i più difficili da reperire con le modalità tradizionali. Per meglio spiegare quali sono queste informazioni e che importanza hanno per un più preciso funzionamento della didattica a distanza bisogna far riferimento a una metodologia già presente e consolidata nel web, soprattutto per quanto riguarda i siti per l'e-commerce: il Data Mining. La metodologia consiste nel raccogliere informazioni da dati preesistenti raccolti in database (Data Warehouse), per poi scoprire fatti, elementi e correlazioni apparentemente nascosti. Queste attività sono normalmente praticate all'interno dei database attraverso l'analisi statistica e le tecniche di modellizzazione. In altre parole il Data Mining trova modelli e relazioni nei dati per poi inferire regole che permettono di prevedere risultati futuri in determinati campi di applicazione. Questi modelli hanno una funzione descrittiva o predittiva. La prima serve a comprendere i processi e i comportamenti, nel nostro caso degli utenti FAD. La seconda elabora un insieme di regole che rendono possibili la predizione di un valore imprevisto o non misurato dagli altri valori conosciuti (vedi fig. 1) Nell'e-commerce l'utilizzazione tipica del Data Mining riguarda la segmentazione del mercato, la valutazione delle varie promozioni di vendita e la creazione dei profili di utenti relativi ai loro comportamenti, abitudini e preferenze. Quest'ultimo punto è quello che ovviamente interessa più da vicino chi si occupa di formazione a distanza. Riuscire a creare dei precisi profili utente significa poter eseguire una progettazione accurata del corso e soprattutto una personalizzazione di quest'ultimo. Ma per arrivare a raggiungere questo obiettivo ci sono tre passi importanti da compiere: il primo consiste nel reperire tutti i dati significativi espliciti e impliciti riguardanti l'utente inserendoli in un database (data warehouse) facendo le prime elaborazioni, il secondo nella creazione dei vari profili utenti utilizzando la metodologia del Data Mining (che rafforzerà o aggiungerà qualcosa di nuovo ai risultati della prima elaborazione) e infine, il terzo, nella personalizzazione del corso attraverso le inferenze scaturite. Ma quali sono questi dati per così dire "sensibili" da reperire e come raccoglierli? Nel momento in cui una persona naviga in un sito lascia numerosissime informazioni di sé. Tenendo presente che i corsi a distanza sono web-based e conseguentemente strutturate in diverse pagine html, link, animazioni, filmati e audio streaming oltre a test on-line e altro, diventa oltremodo interessante avere informazioni su ogni utente (ad esempio sui tempi parziali trascorsi per ogni pagina, i link maggiormente cliccati, la maggior preferenza audio rispetto al video). Dal punto di vista tecnico per reperire queste informazioni bisogna agire con una programmazione script lato server utilizzando ad esempio script ASP appoggiati su un database (mdb), dove conservare tutte le informazioni relative all'attività dell'utente. Ovviamente i computer client degli utenti devono avere dei browser che permettano il salvataggio dei coockies (piccoli file testuali per marcare e riconoscere il computer ogni qualvolta si ricolleghi al server). Sapere che cosa il corsista privilegia, i suoi tempi, il perché si è soffermato molto in una pagina o il perché ha trascurato alcuni link sono dati che possono fare supporre diverse cose, come particolari difficoltà incontrate nella spiegazione o al contrario spiegazioni superflue o elementari rispetto alle conoscenze già acquisite. La predilezione per il video, audio oppure per pagine testuali o interattive, può far supporre stili cognitivi diversi (visuale, auditivo, cinestetico); incrociando tutti questi tipi di dati, si può ottenere un vero e proprio profilo dell'utente, e tarare conseguentemente le lezioni a livello personale. Se poi il corso è supportato da un database per l'aggiornamento delle lezioni, si può prevedere che per gli stessi argomenti corrispondano diversi modi di presentazione relativi alla tipologia del corsista, per ottenere in tal modo una maggior personalizzazione. Ipoteticamente ogni utente, pur mantenendo inalterati gli obiettivi del corso, studierà cose diverse o quantomeno con modalità diverse, che rispecchino il proprio stile cognitivo, massimizzando l'efficienza e l'efficacia del corso stesso, nonché la fidelizzazione dell'utente-corsista. In tal modo non sarà più il corsista che si dovrà adattare al corso (già il semplice adattamento all'utilizzo delle nuove tecnologie per molti è un ostacolo insormontabile), ma al contrario il corso stesso che dinamicamente si modellerà alle caratteristiche cognitive del singolo corsista. Fare formazione a distanza apparentemente può sembrare facile, ma in realtà è estremamente difficile in quanto è necessario e indispensabile prendere in considerazione molteplici aspetti; un elemento strategico è quindi la gestione dinamica di due tipi di conoscenze: una in uscita (offerta formativa) e una in entrata (conoscenza delle caratteristiche cognitive dell'utente). In definitiva l'abilità consiste nel correlare le due conoscenze con lo scopo finale di migliorare l'offerta formativa che in tal modo verrebbe a essere sì omogenea, ma al tempo stesso diversificata e ad personam. Bibliografia Introduction to Data Mining and Knowledge Discovery Two Crows Corporation Third edition (1999), Potomac (USA) www.twocrows.com Sorge C. (2000), Gestire la Conoscenza, Sperling & Kupfer Editori, Milano


<< Indietro Avanti >>