Przejdź do treści

Informacje ogólne

Organizacja zajęć

Odpowiadając na potrzeby Słuchaczy zajęcia realizowane są w trybie hybrydowym: wykłady realizowane są w trybie zdalnym on-line na platformie MS Teams, natomiast wszystkie ćwiczenia oraz ostatni zjazd, podczas którego organizowane są zaliczenia oraz egzaminy zerowe – stacjonarnie w Akademii.

Program studiów obejmuje dwa semestry, 210 godzin dydaktycznych, w tym 120 godzin praktycznych.

Zajęcia prowadzone są w języku polskim.


Wartość dodana

Harmonogram zajęć jest ułożony tak, aby jeden dzień z każdego dwudniowego zjazdu był zdalnie (sobota lub niedziela), a drugi stacjonarnie, co bardzo usprawnia logistykę osób dojeżdżających na studia. Dodatkowym atutem takiego podziału zajęć są nagrane wykłady, które stanowią wartościową bazę materiałów wykorzystywanych do nauki treści oferowanych podczas kształcenia.


Program studiów

Program studiów 2024/2025

Program studiów 2023/2024


Program studiów 2022/2023


Podstawy inżynierii dużych zbiorów danych
  • Inżynieria danych
  • Data Science, Big Data, Data Analysis
  • Uczenie maszynowe i Deep Learning
  • Algorytm MapReduce
  • Model BigTable
  • Rozwiązania sprzętowe
Infrastruktura sprzętowa w przetwarzaniu dużych zbiorów danych
  • Big Data na laptopie lub komputerze stacjonarnym
  • Big Data na klastrze lokalnym
  • Realizacje w Chmurze
  • Zastosowanie procesorów graficznych
  • Wykorzystanie NVIDIA Tesla Deep Learning
Analiza danych w języku Python
  • Przygotowanie środowiska dla programisty (Rodeo)
  • Podstawy języka Python
  • Wyrażenia regularne w języku Python
  • Przegląd bibliotek naukowych: NumPy, SciPy, Matplotlib
  • Wizualizacja danych
  • Uczenie maszynowe i Sickit Learn
Nierelacyjne bazy danych
  • Koncepcja baz NoSQL
  • Reprezentacje danych w bazie Cassandra
  • Interfejsy do baz Cassandra i HBase
  • Środowisko Apache Hadoop na potrzeby baz NoSQL
  • Reprezentacje danych w bazie HBase
  • Baza HBase i Hadoop
Przetwarzanie dużych zbiorów danych w chmurze obliczeniowej
  • Ekosystem Microsoft Azure
  • Silnik Microsoft Azure Machine Learning
  • Narzędzie Azure Machine Learning Studio
  • Rozwiązanie przykładowego problemu
Konfiguracja środowiska przetwarzania dużych zbiorów danych
  • Apache Cassandra
  • Apache HBase
  • Apache Spark
  • Apache Mahaut
  • Apache MLlib
  • Apache Hadoop
Infrastruktura programowa w przetwarzaniu dużych zbiorów danych
  • Rozwiązania Open Source (Apache)
  • Rozwiązania komercyjne (SAS, Google, Microsoft)
  • Silnik Microsoft Azure i Machine Learning Tool
  • Silnik Cloud Analytics Services (CAS)
  • Silnik Google Cloud Machine Learning Engine
Analiza danych w języku R
  • Przygotowanie środowiska programisty (RStudio)
  • Podstawy języka skryptowego R
  • Wizualizacja danych w R
  • Obliczenia stacjonarne z wykorzystaniem R
  • Obliczenia w chmurze
  • Przegląd pakietów R
Metody uczenia maszynowego
  • Związek Big Data z uczeniem maszynowym
  • Apache Spark i biblioteka MLlib
  • Apache Mahaut w zadaniach klasyfikacyjnych
  • Podstawowe algorytmy uczenia maszynowego
Projekt własny
  • Wybór problemu
  • Samodzielna implementacja oraz rozwiązanie problemu

Spotkanie z kierownikami studiów podyplomowych

Nikt nie opowie o studiach proponowanych przez Centrum Kształcenia Podyplomowego lepiej niż ci, którzy je stworzyli. Zapraszamy do obejrzenia i wysłuchania rozmów z kierownikami studiów podyplomowych oraz studiów MBA (w tym kierownikiem CKP Panią Martą Godzisz), które przeprowadziła Pani Aleksandra Szyr.