Διαχείριση Μεγάλων Δεδομένων

Managing Big Data

Κωδικός Μαθήματος

ΕΦΟ-03

Εξάμηνο: 1ο

Έτος Σπουδών: 1ο έτος

Κατηγορία: Υποχρεωτικό

Προς Φοιτητές Erasmus: Όχι

Μαθησιακά Αποτελέσματα

Στόχος του μαθήματος είναι να κατανοήσουν οι φοιτητές τον ρόλο που παίζουν τα μεγάλα δεδομένα στην Οικονομική Επιστήμη σήμερα και ιδιαίτερα στην εφαρμοσμένη οικονομική καθώς επίσης και να εμπλουτίσουν τις ποσοτικές/οικονομετρικές μεθόδους που ήδη γνωρίζουν με νέους αλγορίθμους οι οποίοι μπορούν να εφαρμοστούν σε περιβάλλοντα μεγάλων δεδομένων.

Μετά την επιτυχή ολοκλήρωση του μαθήματος, αναμένεται οι φοιτητές να είναι σε θέση να:

  • Ορίσουν την έννοια των μεγάλων δεδομένων
  • Αναγνωρίζουν τα περιβάλλοντα που χαρακτηρίζονται από μεγάλα δεδομένα
  • Κατανοήσουν τη σημασία των υπολογιστικών περιβαλλόντων στον χειρισμό και επεξεργασία μεγάλων δεδομένων
  • Κατανοήσουν τον ρόλο και την σημασία των μεγάλων δεδομένων σήμερα στην οικονομική επιστήμη
  • Έρθουν σε επαφή με περιπτώσεις χρήσης μεγάλων δεδομένων στον χώρο της οικονομικής επιστήμης αναδεικνύοντας έμπρακτα τον ρόλο αυτών
  • Κατανοήσουν τα στάδια και διαδικασίες χειρισμού των μεγάλων δεδομένων από την παραγωγή, προεπεξεργασία έως την ανάλυση και ερμηνεία των αποτελεσμάτων τους
  • Εξοικειωθούν με τους βασικούς αλγορίθμους προεπεξεργασίας καθώς και μηχανικής μάθησης επιβλεπόμενης και μη- στις περιοχές παλινδρόμηση, κατηγοριοποίηση, συσταδοποίηση και ανάλυση συσχετίσεων που λειτουγούν για μεγάλα δεδομένα
  • Αποκτήσουν εμπειρία πάνω σε θέματα χρήσης πολυμεσικών δεδομένων όπως κείμενο και εικόνες σε οικονομετρικά μοντέλα, εκτός από παραδοσιακά είδη μεταβλητών.
  • Διακρίνουν σε ποιες περιπτώσεις οι αλγόριθμοι μηχανικής μάθησης μεγάλων δεδομένων μπορούν να εφαρμοστούν
  • Εφαρμόσουν τους αλγορίθμους μηχανικής μάθησης για την μελέτη πραγματικών οικονομικών προβλημάτων που κάνουν χρήση μεγάλων δεδομένων.
  • Αξιολογήσουν τα αποτελέσματα των αλγορίθμων μηχανικής μάθησης μεγάλων δεδομένων και να τα συγκρίνουν με τα αποτελέσματα παραδοσιακών οικονομετρικών μεθόδων που χρησιμοποιούνται στην οικονομική επιστήμη
  • Ερμηνέυσουν τα αποτελέσματα των αλγορίθμων μηχανικής μάθησης υπό το πρίσμα ότι εφαρμόζονται σε μεγάλα δεδομενα
  • Χρησιμοποιούν γλώσσες προγραμματισμού όπως R και Python και να εξοικειωθούν με το οικοσύστημα βιβλιοθηκών μεγάλων δεδομένων που διαθέτουν για να υλοποιήσουν και να εφαρμόζουν αλγορίθμους μηχανικής μάθησης σε περιβάλλοντα μεγάλων δεδομένων στην περιοχή της οικονομικής.

Περιεχόμενα μαθήματος

  • Η έννοια των μεγάλων δεδομένων και η σημασία τους στην οικονομική επιστήμη.
  • Περιπτώσεις χρήσης μεγάλων δεδομένων

Αλγόριθμοι προεπεξεργασίας δεδομένων

  • Μείωση διαστάσεων δεδομένων: Principal Component Analysis (PCA)
  • Καθαρισμός δεδομένων: Binning method
  • Μετασχηματισμός δεδομένων: Κανονικοποίηση, διακριτοποίηση
  • Μετρικές ομοιότητας και απόστασης δεδομένων
  • Περιπτώσεις χρήσης αλγορίθμων προεπεξεργασίας μεγάλων δεδομένων στην περιοχή της οικονομικής επιστήμης

Αλγόριθμοι παλινδρόμησης

  • Batch Gradient Descent
  • Mini Batch Gradient Descent
  • Stochastic Gradient Descent
  • Αξιολόγηση αλγορίθμων της οικογένειας Gradient Descent και αντιπαράθεση με τη μέθοδο OLS.
  • Περιπτώσεις χρήσης αλγορίθμων εκτίμησης συντελεστών παλινδρόμησης μεγάλων δεδομένων στην περιοχή της οικονομικής επιστήμης

Αλγόριθμοι Κατηγοριοποίησης

  • Δέντρα απόφασης
  • K-nn
  • Naïve Bayes
  • Περιπτώσεις χρήσης αλγορίθμων κατηγοριοποίησης μεγάλων δεδομένων στην περιοχή της οικονομικής επιστήμης

Αλγόριθμοι συσταδοποίησης

  • K-means/K-modes
  • Ιεραρχική συσταδοποίηση
  • Περιπτώσεις χρήσης αλγορίθμων συσταδοποίησης μεγάλων δεδομένων στην περιοχή της οικονομικής επιστήμης

Αλγόριθμοι ανάλυσης συσχετίσεων

  • Apriori
  • Περιπτώσεις χρήσης αλγορίθμων ανάλυσης συσχετίσεων στην περιοχή της οικονομικής επιστήμης

Διδακτικές Δραστηριότητες

Διαλέξεις (3 ώρες/εβδομάδα) και Ασκήσεις (1 ώρες/εβδομάδα)

Οργάνωση Διδασκαλίας

Δραστηριότητα

Φόρτος Εργασίας Εξαμήνου

Διαλέξεις (3 ώρες την εβδομάδα x 13 εβδομάδες

39 ώρες

Εργαστήριο (1 ώρα την εβδομάδα x 13 εβδομάδες)

13 ώρες

Αυτόνομη μελέτη

148 ώρες

Σύνολο Μαθήματος (25 ώρες φόρτου εργασίας ανά πιστωτική μονάδα)

200 ώρες

Αξιολόγηση

Η αξιολόγηση βασίζεται στην επίδοση του φοιτητή στη γραπτή τελική εξέταση (70%) και στο βαθμό τριών (3) εργασιών που πρέπει να παραδίδονται περίπου κάθε 3 εβδομάδες.

Η γραπτή τελική εξέταση στοχεύει να εξετάσει εάν οι μεταπτυχιακοί φοιτητές  κατανοούν τα θέματα που αναλύονται στις διαλέξεις με βάση την διδαχθείσα ύλη. Ο στόχος των εργασιών είναι να αξιολογήσει εάν οι φοιτητές μπορούν ορθά να εφαρμόσουν τους αλγορίθμους σε πραγματικά δεδομένα και να ερμηνεύσουν/συζητήσουν τα αποτελέσματά τους.

Οι 3 εργασίες εκπονούνται ομαδικά και οι οποίες:

  • Καλύπτουν όλους τους διδασκόμενους αλγορίθμους και την εφαρμογή τους
  • Ανακοινώνονται μετά το τέλος συγκεκριμένων ενοτήτων προκειμένου οι φοιτητές να τριφτούν με τις έννοιες που διδάχτηκαν
  • Απαιτούν τη συγγραφή προγραμμάτων σε R και Python που εφαρμόζουν μεθόδους προεπεξεργασίας και τους διδασκόμενους αλγορίθμους σε πραγματικά δεδομένα και οι οποίοι αναλύουν πραγματικά δεδομένα στα πλαίσια οικονομικών ερωτημάτων.
  • Τη σύνταξη αναφοράς σε Lateχ όπου παρουσιάζονται τα αποτελέσματα της ανάλυσης, τα αξιολογούν και τα συζητούν συγκρίνοντάς τα με αποτελέσματα από τη σύγχρονη οικονομική βιβλιογραφία.

Οι μεταπτυχιακοί φοιτητές ενημερώνονται για τον τρόπο αξιολόγησής τους από την ιστοσελίδα του μαθήματος στο eclass.upatras.gr (βλ ενότητα «Μέθοδοι Αξιολόγησης»).

Χρήση ΤΠΕ

  • Χρήση σημειώσεων και διαφανειών για την υποστήριξη διαλέξεων
  • Χρήση πηγαίου κώδικα σε R και Python για την επίδειξη και πρακτική προσέγγιση των αλγορίθμων μηχανικής μάθησης του περιεχομένου μαθήματος που αποτελούν μέρος της ύλης του μαθήματος.
  • Χρήση πλατφόρμας elearning του Πανεπιστημίου Πατρών (eclass.upatras.gr) για την:
  • οργάνωση και διανομή των σημειώσεων
  • εκπόνηση εβδομαδιαίων ηλεκτρονικών ασκήσεων (quizzes) κατανόησης της ύλης και αξιολόγηση φοιτητών
  • ανακοίνωση και παράδοση των ομαδικών εργασιών.
  • την επικοινωνία με τους φοιτητές.
  • Χρήση ανοικτών μαθημάτων ως συμπληρωματικό εκπαιδευτικό υλικό

Ώρες διδασκαλίας: 6

Μoνάδες ECTS: 8

Διδακτικές μονάδες: 

Συντελεστής Βαρύτητας: 

Τύπος: Υποβάθρου, Επιστημονικής Περιοχής, Ανάπτυξης Δεξιοτήτων

Γλώσσα: Ελληνική

Τρόπος Παράδοσης: Πρόσωπο με πρόσωπο

Γενικές Ικανότητες: Αναζήτηση, ανάλυση και σύνθεση δεδομένων και πληροφοριών, με τη χρήση και των απαραίτητων τεχνολογιών, Προσαρμογή σε νέες καταστάσεις, Λήψη αποφάσεων, Ομαδική εργασία

Αναπληρωτής Καθηγητής
Τζαγκαράκης Μανώλης - Αναπληρωτής Καθηγητής

Γνωστικό Αντικείμενο: Συστήματα Διαχείρισης Πληροφορίας

Οργανική Μονάδα / Εργαστήριο:

Τηλέφωνο: +30 2610 962588

Ώρες γραφείου: Δευτέρα 10:00 - 12:00 Παρασκευή 11:00-12:00

Προτεινόμενα Συγγράμματα: 

  • Β. Βερύκιος, Σ. Κωτσιαντής, Η. Σταυρόπουλος, Μ. Τζαγκαράκης: Η Επιστήμη των Δεδομένων – Βασικές Αρχές, Θεωρία & Εφαρμογές με τη Γλώσσα R, Εκδόσεις Νέων Τεχνολογιών (NewTech Pub), 2019. (Πίνακας περιεχομένων)
  • Tan, P., Steinbach, M. and Kumar, V.: Introduction to Data Mining (2nd Edition), Pearson, 2nd Edition, 2018
  • Consoli, S., Reforgiato Recupero, D. and Saisana, M. editor(s), Data Science for Economics and Finance: Methodologies and Applications, , Springer Nature, Cham, 2021, ISBN 978-3-030-66891-4, JRC124606.
  • Dulhare, U., N.: Machine Learning and Big Data: Concepts, Algorithms, Tools and Applications, Wiley-Scrivener, 1st Edition, 2020
  • Consoli, S., Recupero, D. R., Saisana, M. (Editors): Data Science for Economics and Finance: Methodologies and Applications, Springer, 1st ed. 2021
  • Abraham, K. G., Jarmin, R. S., Moyer, B., Shapiro, D.: Big Data for Twenty-First-Century Economic Statistics, University of Chicago Press, 2022
  • Chan, F., Mátyás, L.: Econometrics with Machine Learning, Springer, 2022
  • Provost, F and Fawcett, T.: Data Science for Business: What you need to know about data mining and data-analytic thinking, 1st Edition, O’Reilly Media, 2013
  • Hastie, T., Tibshirani, R. and Friedman, J.: The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition (Springer Series in Statistics) 2nd Edition, 2016
  • Leskovec, J., Rajaraman, A and Ullman, J.: Mining of Massive Datasets, ‎ Cambridge University Press; 2nd edition, 2014
  • Νανόπουλος, Αλ. και Μανωλόπουλος, Ι.: Εισαγωγή στην Εξόρυξη Δεδομένων και στις Αποθήκες Δεδομένων, Εκδόσεις Νέων Τεχνολογιών 2008
  • Walkowiak , S.: Big Data Analytics with R: Leverage R Programming to uncover hidden patterns in your Big Data, Packt Publishing, 2016

Προπτυχιακά

Τελευταία νέα & ανακοινώσεις

Πρόσκληση εκδήλωσης ενδιαφέροντος επιλογής φοιτητών ακαδημαϊκού έτους 2024-2025

03/04/2024|

Το Πρόγραμμα Μεταπτυχιακών Σπουδών «Εφαρμοσμένη Οικονομική και Ανάλυση Δεδομένων» του Τμήματος Οικονομικών Επιστημών του Πανεπιστημίου Πατρών, προκηρύσσει για το ακαδημαϊκό έτος 2024-2025 σαράντα (40) θέσεις μεταπτυχιακών φοιτητών. Το Π.Μ.Σ οδηγεί στην απονομή Διπλώματος Μεταπτυχιακών Σπουδών (Δ.Μ.Σ) στην […]

Πρόσκληση εκδήλωσης ενδιαφέροντος επιλογής μεταπτυχιακών φοιτητών ακαδημαϊκού έτους 2024-25

02/04/2024|

Το Πρόγραμμα Μεταπτυχιακών Σπουδών «Εφαρμοσμένη Οικονομική και Ανάλυση Δεδομένων» του Τμήματος Οικονομικών Επιστημών του Πανεπιστημίου Πατρών, προκηρύσσει για το ακαδημαϊκό έτος 2024-2025 σαράντα (40) θέσεις μεταπτυχιακών φοιτητών. Το Π.Μ.Σ οδηγεί στην απονομή Διπλώματος Μεταπτυχιακών Σπουδών (Δ.Μ.Σ) στην […]

Δημοσίευση ΦΕΚ Εσωτερικού Κανονισμού ΠΜΣ (1342/26.02.2024 τ. Β’)

11/03/2024|

Θα θέλαμε να σας ενημερώσουμε ότι έχει δημοσιευτεί το νέο ΦΕΚ του Εσωτερικού Κανονισμού του Π.Μ.Σ (ΦΕΚ 1342/26.02.2024 τεύχος Β’).

Το νέο ΦΕΚ του Εσωτερικού Κανονισμού μπορεί να βρεθεί εδώ.

 

Κύκλος σεμιναρίων ΠΜΣ: Ομιλία Γιώργου Σιδηρόπουλου, Managing Director Think Silicon an Applied Materials Company

04/03/2024|

Στα πλαίσια του κύκλου σεμιναρίων του ΠΜΣ “Εφαρμοσμένη Οικονομική και Ανάλυση Δεδομένων”, την Τετάρτη 6 Μαρτίου 2024 και ώρα 17:00 – 18:00 στο ΑΜΦ 4, θα γίνει ομιλία του Γιώργου Σιδηρόπουλου, Managing Director Think Silicon an Applied Materials Company με τίτλο:

“From Campus to Silicon […]