Il corso prevede la trattazione dei seguenti argomenti per il raggiungimento dei risultati di apprendimento attesi: Introduzione al Text Mining e alla programmazione in R; Algoritmi per la preparazione dei testi; Metodologie statistiche ed algoritmi per l’analisi dei dati testuali; Visualizzazione di dati testuali
1) Introduzione al Text Mining
2) Introduzione a R
3) Preparazione dei testi
Standardizzazione o preprocessing
Tokenizzazione
Stopwords
Stemming
Lemmatizzazione
Normalizzazione
Boundary detection
Il modello “Bag of words”
4) Algoritmi per l'analisi dei testi
Analisi delle corrispondenze semplice e multiple
Topic models
Sentiment analysis
Classificazione automatica di testi (k-means)
Regressione logistica
Naïve Bayes
5) Visualizzazione dati testuali
SEDE DI CHIETI
Via dei Vestini,31
Centralino 0871.3551
SEDE DI PESCARA
Viale Pindaro,42
Centralino 085.45371
email: info@unich.it
PEC: ateneo@pec.unich.it
Partita IVA 01335970693