Tirocini interni

Contestualmente all'attività di ricerca dell'ISGroup, sono disponibili numerose tesi interne per Laurea Specialistica e Laurea Triennale nell'ambito della gestione del dato e dell'informazione. Per una descrizione completa e dettagliata contattare i docenti di riferimento. Alcuni dei macro-argomenti sono i seguenti:

knowledge

Bibliometric & "Touristicity" Data Analytics

Progetto in collaborazione con il Prof. Luca Bedogni e il Prof. Giacomo Cabri (Università di Modena e Reggio Emilia)

C'è qualche correlazione tra l'impatto di una conferenza scientifica e il luogo in cui si svolge? E se sì, quali sono le caratteristiche di una location (comodità di raggiungimento, numero di attrazioni turistiche, infrastrutture, ...) che più impattano sulla scelta della conferenza? In questo ambito di ricerca finora poco esplorato sono disponibili una serie di temi di indagine basati su tecniche all'avanguardia di data analytics e visualizzazione (tecnologie Python, Pandas, Seaborn, Scikit-learn). Da un lato, occorre analizzare e integrare dati bibliometrici provenienti da siti quali DBLP e OpenCitations, comprendenti ad esempio il numero di citazioni che forniscono l'indicatore dell'impatto di una conferenza; dall'altro, occorre considerare specifici indici turistici che caratterizzano le location in cui le conferenze si sono tenute, attraverso la definizione di nuovi tipi di indicatori o l'analisi di quelli definiti a livello internazionale, ad esempio dal World Economic Forum all'interno del Travel and Tourism Competitiveness Report.

Per informazioni più dettagliate rivolgersi a: riccardo.martoglia@unimore.it

knowledge

Graph mining di reti biologiche per l'identificazione di oncogeni e oncosopressori

Progetto in collaborazione con il Prof. Cristian Taccioli (Università di Padova)

La variazione del numero dei copy numbers (CNVs) di proteine e di famiglie geniche all’interno del genoma è un fenomeno per cui i geni si trovano in copie multiple o ridotte all’interno del materiale genetico di un individuo. Negli ultimi anni, la ricerca si sta spostando dalla semplice localizzazione e sequenziamento genetico, verso un’approfondita analisi del ruolo funzionale che le variazioni nel DNA (ovvero dei geni) possono avere nei confronti del singolo genoma o dell’ambiente stesso. Per esempio, copie multiple di un gene in un soggetto rispetto ad un altro, possono essere associate all’incremento del rischio di patologie come il cancro, o portare a particolari manifestazioni fenotipiche di un carattere (ciò che noi vediamo come traduzione e codifica dal codice genetico stesso). In questo contesto, l’obiettivo dello studio è quello di analizzare il ruolo dei copy number variations per l'identificazione di potenziali oncogeni e oncosoprressori attraverso l'applicazione di tecniche di graph mining su reti biologiche che mettono in collegamento informazioni relative a geni, specie, famiglie e copy number variations.

Per informazioni più dettagliate rivolgersi a: federica.mandreoli@unimore.it

knowledge

Massive Data Science su dati clinici

Progetto in collaborazione con il Prof. Giovanni Guaraldi (UniMoRe, Policlinico di Modena) e il Prof. Paolo Missier (Newcastle University)

La pratica medica si sta evolvendo rapidamente, allontanandosi dal tradizionale ma inefficiente approccio di rilevamento e cura, e verso una visione di medicina Preventiva, Predittiva, Personalizzata e Partecipativa (P4). Questa visione è sempre più basata sui dati ed è sostenuta da molte forme di "Big Health Data". In collaborazione con il Prof. Giovanni Guaraldi, infettivologo e responsabile della Clinica Metabolica HIV presso il Policlinico di Modena sono disponibili argomenti di tesi sui temi di data analytics e machine learning applicati a diversi dataset clinici come, ad esempio, dati di pazienti COVID 19 e pazienti seguiti dalla clinica metabolica. Gli argomenti di interesse sono argomenti trasversali che riguardano sia il data engineering e le tecniche di machine learning rispetto alla specificità dei dati clinici come lo studio di soluzioni di interpretabilità dei modelli, l'imputazione dei dati, la robustezza dei modelli, il tuning dei parametri sia i risvolti sulla pratica clinica in termini di P4 medicine quali l'introduzione di terapie personalizzate, la predizione di condizioni cliniche avverse, la formulazione di score di rischio.

Per informazioni più dettagliate rivolgersi a:  federica.mandreoli@unimore.it

knowledge

Coordinamento di digital twin per smart manufacturing

Tematica nell'ambito del progetto EU FIRST e in collaborazione con il Prof. Massimo Mecella (Sapienza)

I digital twin stanno rapidamente diventando un concetto importante nella rappresentazione digitale di asset di produzione, prodotti e altre risorse in ambito manifatturiero. In quanto rappresentazioni digitali complete di risorse fisiche, comprendenti la loro progettazione e configurazione, stato e comportamento, i Digital Twins forniscono informazioni e servizi basati sulle condizioni attuali della loro controparte fisica, sulla loro storia e persino sul loro futuro previsto. In quanto tali, possono essere considerati gli elementi costitutivi di una visione delle future fabbriche digitali in cui gli stakeholder collaborano tramite le informazioni che i Digital Twins forniscono sulle risorse fisiche in fabbrica e durante tutto il ciclo di vita del prodotto. In collaborazione con Sapienza Università di Roma e Università di Roma Tre sono disponibili argomenti di tesi relativi alla composizione dinamica e al coordinamento di digital twin per lo svolgimento di compiti complessi e alla loro interazione con dati di diversa natura provenienti dai diversi livelli aziendali, dalle linee produttive ai livelli dirigenziali.

Per informazioni più dettagliate rivolgersi a:  federica.mandreoli@unimore.it 

knowledge

Game science data analytics

Tematica in collaborazione con Game Science Research Center

La Game Science è un'area emergente e ancora parzialmente indefinita della ricerca scientifica, caratterizzata da una forte attenzione multidisciplinare che abbraccia molte discipline diverse (umana, sociale, vita e scienze naturali). In questo ambito sono in definizione una serie di temi di indagine riguardanti l'applicazione e la definizione di tecniche di data management e data analytics al settore gaming. Uno dei primi obiettivi sarà di estrarre ed analizzare le informazioni riguardanti un grande numero di boardgame (es. da siti di riferimento come BoardGameGeek) per aumentare la comprensione di quali meccaniche di gioco possano promuovere il pensiero computazionale (CT) per gli studenti di scuole superiori e universitari. Le analisi si avvarranno della collaborazione con esperti in ambito gaming e dell'applicazione di opportune tecniche di interpretable machine learning e intelligenza artificiale.

Per informazioni più dettagliate rivolgersi a:  riccardo.martoglia@unimore.it 

knowledge

Big data management e analytics per Modena Automotive Smart Area

Tematica nell'ambito dei progetti EU CLASS e SECREDAS e in collaborazione con HiPeRT lab (UniMoRe)

La Modena Automotive Smart Area (MASA) è un'area di un chilometro quadrato per lo sviluppo della mobilità smart, dotata di una copertura pervasiva di sensori intelligenti, infrastruttura di rete e dispositivi per l'analisi in tempo reale dei dati. A partire dalle enormi quantità di dati originate nella'area da sensori, telecamere e veicoli smart, lo scopo è di individuare architetture e tecniche big data in grado di memorizzare, aggregare ed analizzare le informazioni a supporto di applicazioni e servizi innovativi, dal monitoraggio alla previsione del traffico, dello stato parcheggi, del livello di inquinamento, ecc. In questo ambito sono disponibili diversi argomenti di tesi su big data management, big data analytics, big data visualization e machine learning.

Per informazioni più dettagliate rivolgersi a:  riccardo.martoglia@unimore.it 

knowledge

Data analytics e machine learning sui dati della UK Biobank

Progetto in collaborazione con il Prof. Paolo Missier (Newcastle University)

La UK Biobank www.ukbiobank.ac.uk è una enorme banca dati che raccoglie dati longitudinali sulla salute e il benessere di 500,000 volontari del Regno Unito e che offre opportunità di ricerca senza pari. Obiettivo ultimo del progetto "UK Biobank" è di migliore la salute delle generazioni future. A tale scopo, essa fornisce informazioni sanitarie a ricercatori approvati nel Regno Unito e all'estero, con lo scopo di migliorare la prevenzione, la diagnosi e il trattamento di una vasta gamma di malattie gravi e potenzialmente letali, tra cui cancro, malattie cardiache, ictus, diabete, artrite, osteoporosi, disturbi oculari, depressione e forme di demenza. Grazie alla collaborazione con il Prof. Paolo Missier della New Castle University, all'ISGroup è stata offerta la possibilità di lavorare al progetto "UK Biobank". In questo contesto, sono disponibili tesi sia su temi di data analytics sia su temi di machine e deep learning.

Per informazioni più dettagliate rivolgersi a:  federica.mandreoli@unimore.itriccardo.martoglia@unimore.it

knowledge

Database e interfaccia web per la gestione e l'interrogazione di dati eterogenei in ambito neuroscientifico

Progetto in collaborazione con il Prof. Giuseppe Pagnoni, il Prof. Carlo Adolfo Porro e il Dott. Marco Prato (Università di Modena e Reggio Emilia)

In collaborazione con il Dip. di Scienze Biomediche, Metaboliche e Neuroscienze, e nell’ambito del finanziamento MIUR "Dipartimento di Eccellenza" ad esso assegnato, si propone la realizzazione di un database da utilizzarsi per la raccolta e gestione dei dati in ambito neuroscientifico. Il progetto mira a caratterizzare fisiopatologia, fattori predittivi e terapie innovative delle patologie neurogenerative (Alzheimer, Parkinson, demenza frontotemporale, sclerosi laterale amiotrofica, epilessia e patologie neurodegenerative periferiche). Data la sua multidisciplinarietà, il progetto prevede la raccolta di un numero cospicuo di dati di natura eterogenea, come questionari neuropsicologici, demografici e ambientali, parametri clinici ematici e del liquido cefalo-rachidiano, e immagini cerebrali di risonanza magnetica. Una caratteristica cruciale del database dovrà essere la semplicità dell’interfaccia per quanto riguarda l’immissione e il recupero dei dati.

Per informazioni più dettagliate rivolgersi a:  riccardo.martoglia@unimore.it

knowledge

Circos: Visualizzatore interattivo di big data genomici in forma circolare

Progetto in collaborazione con il Prof. Cristian Taccioli (Università di Padova)

In ambito genomico e non solo, è indispensabile poter disporre di strumenti che consentano di visualizzare in modo efficiente e con forme visive efficaci grandissime quantità di dati. Il progetto, in collaborazione con studiosi Bioinformatici dell'Università di Padova, prevede lo sviluppo di Circos, uno strumento in linguaggio Python basato su matplotlib per visualizzare la genomica e altri tipi di dati come un grafico circolare. Il layout circolare è particolarmente vantaggioso per l'immediato feedback e per l'impatto visivo del risultato, e renderà la piattaforma perfetta per esplorare in maniera interattiva le relazioni tra gli elementi in diverse posizioni del grafico.

Per informazioni più dettagliate rivolgersi a:  riccardo.martoglia@unimore.it, federica.mandreoli@unimore.it

knowledge

Database per i copynumber variation con statistica descrittiva e machine learning

Progetto in collaborazione con il Prof. Cristian Taccioli (Università di Padova)

La variazione del numero dei copy numbers (CNVs) di proteine e di famiglie geniche all’interno del genoma è un fenomeno per cui i geni si trovano in copie multiple o ridotte all’interno del materiale genetico di un individuo. Negli ultimi anni, la ricerca si sta spostando dalla semplice localizzazione e sequenziamento genetico, verso un’approfondita analisi del ruolo funzionale che le variazioni nel DNA (ovvero dei geni) possono avere nei confronti del singolo genoma o dell’ambiente stesso. Per esempio, copie multiple di un gene in un soggetto rispetto ad un altro, possono essere associate all’incremento del rischio di patologie come il cancro, o portare a particolari manifestazioni fenotipiche di un carattere (ciò che noi vediamo come traduzione e codifica dal codice genetico stesso). In questo contesto, l’obiettivo dello studio è quello di creare un database di CNVs per diversi organismi animali, vertebrati e non, sfruttando l’analisi delle librerie genomiche pubbliche disponibili in rete, al fine di ottenere, per la prima volta, una raccolta completa di variazioni nel numero di copy numbers all’interno del regno animale. Il database sarà affiancato da analisi statistiche descrittive elaborate in prospettiva comparativa e che saranno poi utili per successive indagini in campo evoluzionistico, biologico e biomedico. Infine, saranno utilizzati e testati algoritmi di Machine Learning (Decision Trees, Random Decision Forests, GLM e SVM) per creare modelli predittivi di analisi delle variazioni delle sequenze e del rischio di insorgenza di malattie.

Per informazioni più dettagliate rivolgersi a:  riccardo.martoglia@unimore.it, federica.mandreoli@unimore.it

knowledge

Data analytics e machine learning su una sperimentazione clinica per healthy aging

Progetto in collaborazione con il Prof. Giovanni Guaraldi (UniMoRe, Policlinico di Modena) e il Prof. Paolo Missier (Newcastle University)

L'Organizzazione Mondiale della Sanità (OMS) è alla continua ricerca di strumenti di healthy aging. MySmart Age with HIV (MySAwH) è uno studio prospettico in corso, coordinato dal Prof. Giovanni Guaraldi, progettato per consentire agli anziani (di età> 50 anni) che vivono con l'HIV in Italia, Australia e Hong Kong di ottenere un invecchiamento sano. Lo studio coinvolge circa 280 pazienti monitorati per 24 mesi. I dati raccolti sono altamente eterogenei per quanto riguarda il tipo, l'origine e il tasso di acquisizione e includono: La valutazione geriatrica completa raccolte dagli operatori sanitari durante le visite di studio; conteggio passi, ore di sonno e calorie raccolte quotidianamente da un dispositivo indossabile; risultati di questionari su capacità funzionali e qualità della vita, registrati tramite un'app dedicata per smartphone (MySAwHApp). La finalità di questo studio è di indagare approcci data-driven con l'obiettivo di fornire strumenti di medicina preventiva e personalizzata che possano supportare le persone adulte con patologie croniche nel perseguimento di una vita sana e attiva. In questo ambito, sono disponibili tesi di data analytics e machine e deep learning che si concentrano sulle caratteristiche dei diversi dati disponibili, dai dati provenienti da wearable device, ai dati soggettivi quali le risposte ai sondaggi, ai dati clinici e alle caratteristiche longitudinali dei dati stessi.

Per informazioni più dettagliate rivolgersi a:  federica.mandreoli@unimore.itriccardo.martoglia@unimore.it

knowledge

Dashboard intelligente per la composizione di Tweet in ambito cultural heritage (web / iOS / Android)

Tematica in collaborazione con il Prof. Marco Furini e la Dott.ssa Manuela Montangero

Scrivere tweet di successo è più difficile di quanto pensino i manager dei social media. Oltre a sapere quando pubblicare tweet per la massima esposizione, è necessario sapere quale argomento, hashtag e struttura linguistica funzionano meglio per generare like e retweet. Inoltre, è fondamentale determinare quali caratteristiche del contenuto (immagini, contenuti multimediali, ecc.) danno il meglio per aiutare il tweet a spiccare sui social feed. Sono disponibili tesi per progettare e provare sul campo innovativi algoritmi intelligenti oltre che un dashboard grafico (tecnologia web / mobile, iOS/ Android) dedicato. Questi strumenti potranno sostenere campagne di comunicazione e marketing efficaci nel settore dei Beni Culturali, fornendo: (a) una panoramica costantemente aggiornata della potenza comunicativa di un account Twitter rispetto ai concorrenti; (b) strumenti efficaci per scrivere tweet di successo e prevederne l'impatto prima di pubblicarli.

Per informazioni più dettagliate rivolgersi a:  federica.mandreoli@unimore.itriccardo.martoglia@unimore.it

knowledge

Intelligenza artificiale e graph analytics per Digital Work analysis

Tematica nell'ambito di un progetto di ricerca interdisciplinare finanziato da UniMoRe

La digitalizzazione dell'ambiente di lavoro è un fenomeno diffuso che coinvolge sia le industrie manifatturiere che quelle dei servizi. Una semplice definizione di digitalizzazione è: gli atti di lavoro sono sempre più concepiti ed eseguiti all'interno di piattaforme digitali per mezzo di dispositivi digitali. Nell'ambito di questa ricerca, raccoglieremo e analizzeremo congiuntamente dati qualitativi e quantitativi sulle attitudini dei lavoratori (indagini) cercando di correlarle al loro maggiore o minore utilizzo di tecnologie digitali sul lavoro (compresi i dati da intranet aziendale, sensori biometrici e app mobili). Verranno utilizzate, tra le altre, tecniche di graph analytics e intelligenza artificiale. In questo modo acquisiremo approfondimenti sulle relazioni tra atteggiamenti dei dipendenti e comportamenti del lavoro digitale.

Per informazioni più dettagliate rivolgersi a:  federica.mandreoli@unimore.itriccardo.martoglia@unimore.it

knowledge

Monitoraggio e mining di dati clinici per infection control e stewardship antibiotica

Tematica in collaborazione con il Prof. Giovanni Guaraldi (UniMoRe, Policlinico di Modena)

Il controllo delle infezioni, in particolare il monitoraggio della diffusione di infezione e la sua gestione, nonché una gestione coordinata e multidisciplinare delle terapie antimicrobiche, sono questioni chiave per raggiungere risultati clinici ottimali e ridurre i costi sanitari. Sono per questo necessarie nuove tecniche di gestione e monitoraggio di big data eterogenei (dati clinici ed epidemiologici locali, storia medica, dati da sensori, ecc.) che sfruttino gli ultimi sviluppi in ambito streaming, data mining, ricerca approssimata e intelligenza artificiale.

Per informazioni più dettagliate rivolgersi a:  federica.mandreoli@unimore.itriccardo.martoglia@unimore.it

knowledge

Gestione, analisi ed interrogazione di Big Data

La quantità di dati generati è sempre maggiore: dai telefoni, alla carte di credito usate per gli acquisti, dalla televisione agli storage necessari per le applicazioni dei computer, dalle infrastrutture intelligenti delle città, fino ai sensori montati sugli edifici, sui mezzi di trasporto pubblici, ecc. Per la gestione, l'analisi e l'interrogazione di tali quantità di dati è fondamentale conoscere le nuove tecnologie e piattaforme Big Data. In particolare, potranno essere approfonditi aspetti riguardanti lo studio di prestazioni, anche comparativo, dei principali sistemi (MongoDB, Neo4j, ...) e tecnologie (Hadoop, Spark, ...) nell'ambito di svariati ambiti applicativi, dall'analisi di dati social, all'interrogazione approssimata di dati a grafo, all'analisi di dati e feedback di vendita.

Per informazioni più dettagliate rivolgersi a:  federica.mandreoli@unimore.itriccardo.martoglia@unimore.it

knowledge

Interrogazione avanzata di dati knowledge base e social graph

Le grandi knowledge base (quale quella di Google Knowledge Graph e Freebase), i dati Linked Data in forma di grafo, i grafi sociali (quali Facebook Open Graph) e le comunità Web 2.0 aprono sempre nuove opportunità per una ricerca semantica in grado di soddisfare le esigenze informative avanzate degli utenti (anche in contesti di mobilità), pur mantenendo semplice ed immediata la costruzione dell'interrogazione in sé. I problemi da risolvere in questo caso sono numerosi, dallo studio dei nuovi tipi di sorgenti informative, alle loro modalità di interrogazione, dalla selezione delle sorgenti più adatte a rispondere all'interrogazione, alla possibile interoperabilità tra i dati delle sorgenti, eterogenei in formato, lingua e contenuti.

Per informazioni più dettagliate rivolgersi a:  federica.mandreoli@unimore.itriccardo.martoglia@unimore.it

context

Sviluppo di applicazioni dipendenti dal contesto

Tematica nell’ambito del progetto Ambit

Nell'ambito del progetto AMBIT (Algorithms and Models for Building context-dependent Information delivery Tools), l'obiettivo è di studiare e sviluppare un’architettura software prototipale per lo sviluppo di applicazioni e sistemi dipendenti dal contesto, cioè strumenti in grado di fornire agli utenti servizi che siano personalizzati proprio in base al contesto nei quali essi si trovano ad operare. Preliminari saranno lo studio di modelli, algoritmi e strutture dati per la rappresentazione e manipolazione dei contesti. Caratteristica innovativa sarà lo studio e l'implementazione di un concetto di contesto molto ampio, comprendente (fra gli altri) la modellazione dell’ambiente esterno, il profilo dell’utente e la storia delle azioni da esso intraprese. Tra i campi applicativi che si potranno considerare: pubblicità on-line, applicazioni interattive per la valorizzazione del territorio, help-desk intelligenti.

Per informazioni più dettagliate rivolgersi a:  riccardo.martoglia@unimo.it

apple-app-store

Sviluppo di app per dispositivi mobili iOS e Android

Sono disponibili tesi riguardanti lo sviluppo di software per dispositivi mobili (iOS, Android), anche in ambiti legati ai progetti di ricerca attivi. Potranno essere approfondite tecniche di programmazione nativa (Objective C per iOS, Java per Android), oppure innovative tecniche per la programmazione multipiattaforma. Nel caso di sviluppo su dispositivi iOS, la tesi verrà svolta nell'ambito dell'Apple iOS Developer University Program che fornirà accesso a tutti gli strumenti necessari per lo sviluppo e la pubblicazione dell'app.

Per informazioni più dettagliate rivolgersi a:  riccardo.martoglia@unimore.it

Database_3

Applicazioni web e/o mobile per lo studio e la progettazione di basi di dati

Nell'ambito delle basi di dati, ci si propone di realizzare applicazioni web (es. HTML5) o mobile (per smartphone iOS o Android) in grado di automatizzare e agevolare i compiti del progettista database, e al tempo stesso di aiutare didatticamente nello studio e nella pratica della realizzazione di una base di dati. Svariate le tematiche e gli obiettivi specifici, tra i quali: studio di dati derivati, disegno interattivo di diagrammi E/R, progettazione logica assistita, ottimizzazione degli accessi e scelta degli indici più convenienti, ...

Per informazioni più dettagliate rivolgersi a:  riccardo.martoglia@unimore.it