Oświadczenie Rektora Polsko-Japońskiej Akademii Technik Komputerowych

DeepSeek stał się jednym z najgorętszych tematów w świecie technologii na samym początku 2025 roku, wywołując zarówno zachwyt użytkowników, jak i niepokój inwestorów technologicznych. Ten chiński model sztucznej inteligencji, zwrócił uwagę nie tylko przez swoją wydajność, ale również ze względu na kontrowersje związane z bezpieczeństwem danych i metodami szkolenia.
DeepSeek to zaawansowany system sztucznej inteligencji z Chin, który w krótkim czasie zdobył ogromną popularność i zaczął konkurować z najpotężniejszymi modelami AI na świecie. Twórcą i obecnym właścicielem DeepSeek jest chińska firma z Hangzhou — DeepSeek Artificial Intelligence, założona jeszcze w 2023 roku przez Liang Wenfenga.
W terminologii specjalistycznej DeepSeek klasyfikowany jest jako duży model językowy (LLM — Large Language Model), podobnie jak ChatGPT czy Google Gemini. Jednak to, co wyróżnia DeepSeek na tle konkurencji, to przede wszystkim jego architektura. Model ten wykorzystuje innowacyjne podejście zwane Mixture-of-Experts (MoE), które można porównać do zespołu wyspecjalizowanych ekspertów, gdzie tylko najbardziej odpowiedni z nich są angażowani do każdego z zadań.
Drugim istotnym wyróżnikiem DeepSeek jest podejście open-source, co oznacza ni mniej, ni więcej, iż jest dostępny za darmo i może być modyfikowany przez społeczność. To w kontekście kontrowersji, do których zaraz przejdziemy, jest szczególnie cenne dla osób, chcących zrozumieć jak dokładnie działa DeepSeek. Co więcej, model ten można zainstalować lokalnie i dostosować jego technologię bazową do indywidualnych potrzeb czy zintegrować go z własnymi systemami.
Wspominaliśmy na początku o niepokoju inwestorów technologicznych. Wywołało go zaskoczenie związane z kosztami wdrożenia DeepSeek, które okazały się znacząco niższe niż w przypadku ChatGPT. DeepSeek został wytrenowany na 14,8 bilionach różnorodnych i wysokiej jakości tokenów, a koszt całego procesu oszacowano na około 6 milionów dolarów. To znacząco mniej niż 100 milionów dolarów, które OpenAI miało wydać na trening GPT-4 w 2023 roku.
DeepSeek-R1 i DeepSeek-V3 to dwa zaawansowane modele językowe, które różnią się fundamentalnie pod względem architektury, zastosowań i sposobu działania.DeepSeek-R1 jest specjalistycznym modelem skupionym na rozumowaniu i rozwiązywaniu złożonych problemów, wykorzystującym uczenie z naciskiem na generowanie dokładnych czy przemyślanych odpowiedzi. Z kolei DeepSeek-V3 to wszechstronny model ogólnego zastosowania, zaprojektowany jako konkurent dla modeli takich jak GPT-4o, świetnie radzący sobie z tworzeniem treści, ale o ograniczonych zdolnościach rozumowania.
Niemal natychmiast po debiucie DeepSeek, obszarem budzącym niepokój z nim związanym, stała się kwestia ochrony danych osobowych użytkowników. DeepSeek rejestruje wiadomości wysyłane przez użytkowników i odpowiedzi bota w celu udoskonalenia modelu, choć firma zapewnia, że informacje te są anonimowe.
Niemniej, fakt przechowywania tych danych na chińskich serwerach wzbudza obawy w kontekście kontroli państwowej i możliwości dostępu do tych danych przez władze Chin. Z tego też względu, kilka krajów, w tym Stany Zjednoczone, Australia, Korea Południowa, Włochy czy Tajwan, oficjalnie zabroniło używania DeepSeek na urządzeniach rządowych.
Obawy te spotęgowały kontrowersje związane z cenzurowaniem odpowiedzi generowanych przez DeepSeek w tematach drażliwych dla Chin, przede wszystkim dotyczących treści politycznych.
O ile inne modele sztucznej inteligencji czasem charakteryzują się efektem halucynacji, a więc mówiąc wprost — wymyślaniem fikcyjnych informacji, jeśli nie mają w swoich danych szkoleniowych właściwych informacji, o tyle DeepSeek unika i wręcz odmawia drażliwych dla rządu chińskiego odpowiedzi.
Przykładami chińskiej cenzury implementowanej w DeepSeek może być odmowa odpowiedzi przez chatbota na temat masakry na placu Tiananmen w 1989 roku, statusu Tajwanu czy prześladowań Ujgurów.
Porównanie DeepSeek vs ChatGPT ujawnia znaczące różnice w podejściu do podobnych problemów. Oba modele reprezentują najnowocześniejsze technologie AI, ale każdy z nich ma swoje unikalne mocne strony i ograniczenia.
Kryterium | DeepSeek | ChatGPT |
Koszty | Darmowy, open-source | Subskrypcja za funkcje premium |
Specjalizacja | Zadania techniczne, matematyka | Twórczość, konwersacje |
Wydajność | Szybsze odpowiedzi w kodowaniu | Lepsze zrozumienie kontekstu |
Bezpieczeństwo | Ryzyko związane z jurysdykcją Chin | Silniejsze zabezpieczenia danych |
Dostępność | Możliwość instalacji lokalnej | Tylko w chmurze |
Podczas gdy DeepSeek wykorzystuje wspomnianą architekturę Mixture-of-Experts, ChatGPT angażuje wszystkie swoje zasoby do każdego zadania (jakby wszyscy eksperci pracowali nad każdym problemem), DeepSeek aktywuje tylko te części modelu, które są najbardziej odpowiednie dla danego zapytania.
DeepSeek V3, czyli najnowsza wersja modelu, posiada imponujące 671 miliardów parametrów, z czego tylko 37 miliardów jest aktywowanych dla każdego tokenu, co znacząco zwiększa wydajność modelu, umożliwiając dynamiczne dostosowywanie się do różnych typów zapytań przy jednoczesnej optymalizacji zasobów. Z tego też względu, w testach wydajności DeepSeek wykazuje imponujące zdolności w zadaniach technicznych, szczególnie w matematyce, gdzie osiąga 90% dokładności — znacząco przewyższając wielu konkurentów. To czyni go szczególnie wartościowym narzędziem w rozwiązywaniu problemów technicznych. Z kolei ChatGPT tradycyjnie demonstrował mocniejsze zdolności w rozumieniu kontekstu i dostarczaniu bardziej zniuansowanych odpowiedzi w szerszym zakresie tematów.
Dobrym przykładem będzie tu test przeprowadzony przez BBC, w którym to w jednym z zadań DeepSeek szybciej stworzył pełną historię, podczas gdy ChatGPT skupił się na generowaniu pomysłów.
Co jeszcze istotne w kwestiach porównania tych modeli, DeepSeek oferuje bardziej rozbudowane opcje dostosowywania, co jest korzystne dla osób z pewną wiedzą techniczną. ChatGPT natomiast stawia na przyjazność dla użytkownika, oferując bardziej dopracowane doświadczenie, które jest dostępne nawet dla osób dopiero rozpoczynających przygodę z AI.
DeepSeek zdążył już zrewolucjonizować wciąż jeszcze świeży przecież rynek AI, udowadniając, że zaawansowane modele można budować przy minimalnych nakładach. Z drugiej strony, choć jego efektywność i niskie koszty przyciągają developerów i startupy, kontrowersje związane z bezpieczeństwem danych i cenzurą ograniczają zastosowania we wrażliwych sektorach.
Niemniej, DeepSeek to fascynujący przykład, jak firma z ograniczonymi zasobami może rzucić wyzwanie największym gigantom technologicznym. Model DeepSeek R1, dzięki innowacyjnej architekturze Mixture-of-Experts i podejściu open-source, zdobył uznanie użytkowników na całym świecie.
Może i wspomniane kontrowersje związane z cenzurą, bezpieczeństwem danych i metodami szkolenia rzucają cień na ten sukces, ale też równocześnie przypominają nam, że rozwój technologii AI nie odbywa się w próżni — jest głęboko osadzony w szerszym kontekście społecznym, politycznym i geopolitycznym. Kwestie te będą z pewnością kształtować dyskusję wokół sztucznej inteligencji w najbliższych latach.
Skontaktuj się z Działem Rekrutacji, aby otrzymać odpowiedzi na wszystkie swoje pytania.
rekrutacja@pja.edu.pl