Przejdź do treści

Informacje ogólne

Uczestnicy studiów uczą się pracować z narzędziami powszechnie stosowanymi przez bioinformatyków, od systemu operacyjnego Linux, po programowanie w Python, R, uczenie maszynowe i in.

Ten konsultowany z praktykami i otoczeniem gospodarczym program ma na celu przygotować słuchacza w warstwie teoretycznej, praktycznej oraz programistycznej do samodzielnej pracy z narzędziami bioinformatycznymi również na własnym komputerze.


Warunki zaliczenia

Warunkiem zaliczenia studiów jest zaliczenie wszystkich przedmiotów znajdujących się w programie studiów w czasie zdefiniowanym przez osoby prowadzące.

Słuchacz na koniec każdego z przedmiotów powinien rozwiązać test wyboru oraz przygotować projekt. Podstawą zaliczenia danego przedmiotu jest uzyskanie pozytywnej oceny z testu oraz zaliczenia z projektu. Moment rozpoczęcia przedmiotu, czas jego trwania oraz moment zakończenia będzie dostosowany do poziomu grupy i może ulegać nieznacznym zmianom. Przedmioty będą udostępniane sekwencyjnie, najczęściej na okres 1 m-ca, z naciskiem na to, aby równolegle nie były realizowane więcej niż 2 przedmioty.

Każdy semestr kończy się egzaminem, który będzie odbywał się stacjonarnie w siedzibie uczelni PJATK w Warszawie. Egzamin będzie obejmował materiał z danego semestru.


Program studiów

Program studiów 2024/2025

Program studiów 2023/2024



Semestr 1

Semestr 2

Wprowadzenie do bioinformatyki – 15h

Przedmiot oferuje wprowadzenie do bioinformatyki obejmujące podstawowe pojęcia, historyczny rozwój dziedziny, podstawy algorytmiki, struktury danych oraz praktyczne zastosowanie algorytmów w biologii obliczeniowej, z wprowadzeniem do programowania w Scratch i przeglądem systemów operacyjnych. Kurs ten jest kluczowy dla zrozumienia, jak komputery kodują, przechowują i przetwarzają dane.

System kontroli wersji – 10h

Przedmiot obejmuje naukę technik implementacji i wykorzystania systemów kontroli wersji, ze szczególnym uwzględnieniem protokołu Git, w kontekście kolaboratywnego rozwoju oprogramowania. Słuchacze zostaną zaznajomieni z architekturą rozproszonego systemu kontroli wersji, metodologią zarządzania gałęziami kodu źródłowego oraz protokołami rozwiązywania konfliktów. Przedmiot ten umożliwi uczestnikom efektywne zarządzanie cyklem życia projektów programistycznych, poprzez naukę pracy zespołowej, integracji narzędzi CI/CD oraz technik automatyzacji.

Ubuntu Linux jako środowisko pracy bioinformatyka – 15h

Przedmiot oferuje wprowadzenie do systemu operacyjnego Linux, ze szczególnym uwzględnieniem instalacji i konfiguracji Ubuntu, zarządzania plikami, katalogami, użytkownikami oraz automatyzacji zadań bioinformatycznych za pomocą skryptów bash. Kurs obejmuje również praktyczne umiejętności w zakresie przetwarzania wzorców w danych, zarządzania procesami oraz zdalnego dostępu i wirtualizacji.

Podstawy programowania w języku Python – 15h

Kurs oferuje kompleksowe wprowadzenie do programowania w języku Python, obejmujące zarówno podstawowe, jak i bardziej zaawansowane struktury danych, funkcje, programowanie obiektowe oraz operacje na plikach. Nacisk położony jest na praktyczne zastosowania w analizie i wizualizacji danych biologicznych. W dalszej części tematyka kursu skupia się na aplikacjach bioinformatycznych, w tym na analizie danych przy użyciu specjalistycznych bibliotek takich jak NumPy, Pandas, Matplotlib oraz Biopython.

Konteneryzacja w bioinformatyce – 10h

Przedmiot stanowi wprowadzenie do konteneryzacji, koncentrując się na instalacji, konfiguracji i podstawowych operacjach. Kurs ten obejmuje również porównanie konteneryzacji z wirtualizacją, prezentację przykładowych narzędzi bioinformatycznych uruchamianych w kontenerach oraz podstawy orkiestracji.

Relacyjne bazy danych – 10h

Przedmiot wprowadza w podstawy relacyjnych baz danych, obejmując historię, zastosowania oraz podstawy języka SQL, a także projektowanie schematów, zapytania i optymalizację wydajności. Kurs obejmuje również zastosowania w bioinformatyce oraz porównanie z modelami NoSQL.

Biostatystyka i wizualizacja – 15h

Przedmiot dostarcza wiedzy na temat statystyki w kontekście biologii, w tym biologii molekularnej i genetyki, obejmując miary tendencji centralnej, prawdopodobieństwo, estymację oraz analizę wielowymiarową. Kurs kładzie duży nacisk na praktyczne zastosowanie statystyki w projektowaniu eksperymentów i analizie danych oraz na wizualizację wyników przy użyciu wybranych narzędzi.

Podstawy programowania w języku R – 20h

Przedmiot wprowadza do wszechstronnego języka R. Obejmuje instalację oraz konfigurację R i RStudio, prezentuje typy i struktury danych, operatory oraz funkcje. Kurs skupia się również na technikach przetwarzania danych oraz wizualizacji. Kurs kładzie duży nacisk na praktyczne zastosowania w analizie danych, statystyce opisowej i modelowaniu statystycznym, m.in. z wykorzystaniem pakietów bioinformatycznych takich jak Bioconductor.

Bioinformatyka w genomice i transkryptomice – 20h

Przedmiot zapewnia zrozumienie procesów sekwencjonowania genomowego i transkryptomowego, obejmując m.in. instalację narzędzi bioinformatycznych, kontrolę jakości danych, mapowanie sekwencji oraz kwantyfikację i analizę ekspresji genów. Kurs zawiera także tematy poświęcone wykrywaniu wariantów genetycznych, ich anotacji i wizualizacji, a także analizie danych metagenomowych i single-cell RNAseq.

Bioinformatyka w proteomice – 20h

Przedmiot dostarcza wiedzy w zakresie analizy danych proteomicznych, obejmującej m.in. przetwarzanie danych surowych i identyfikację białek oraz analizę interakcji i sieci białkowych. Przedmiot ten rozwija również umiejętności w zakresie wizualizacji danych, predykcji struktury białek oraz integracji danych proteomicznych z danymi genomowymi.

Zarządzanie procesami analizy danych – 10h

Przedmiot przedstawia metody organizacji i nadzoru nad przebiegiem zadań bioinformatycznych (workflows), koncentrując się na implementacji i optymalizacji wybranych narzędzi. Słuchacze opanują tworzenie i uruchamianie kolejki zadań (pipelines), ich łączenie z technologią kontenerową oraz wykorzystanie w środowiskach chmurowych. Poznają także różnice w funkcjonalnościach i zastosowaniach tych narzędzi.

Uczenie maszynowe w bioinformatyce – 10h

Przedmiot oferuje podstawy teoretyczne i praktyczne koncepcji uczenia maszynowego i jego zastosowań w bioinformatyce, obejmując techniki regresji, klasyfikacji, oraz głębokiego uczenia, a także m.in. narzędzia Python, R i Orange Data Mining. Kurs ten umożliwia naukę przetwarzania danych, oceny i walidacji modeli oraz wykorzystania tych metod w praktycznych problemach związanych z genomiką, proteomiką i obrazowaniem medycznym.

Klastry obliczeniowe i rozwiązania chmurowe – 10h

Przedmiot zawiera podstawy w zakresie definicji, architektury i zarządzania klastrami obliczeniowymi oraz obliczeń równoległych i rozproszonych, z naciskiem na modele programowania równoległego oraz obliczenia wysokowydajnościowe (HPC) w chmurze. Porównuje również usługi chmurowe głównych dostawców, takich jak AWS, Azure i Google Cloud, oraz prezentuje narzędzia do analizy Big Data, takie jak Hadoop i Spark, umożliwiające skalowanie aplikacji bioinformatycznych.


Spotkanie z kierownikami studiów podyplomowych

Nikt nie opowie o studiach proponowanych przez Centrum Kształcenia Podyplomowego lepiej niż ci, którzy je stworzyli. Zapraszamy do obejrzenia i wysłuchania rozmów z kierownikami studiów podyplomowych oraz studiów MBA (w tym kierownikiem CKP Panią Martą Godzisz), które przeprowadziła Pani Aleksandra Szyr.