Po co Polsce własna sztuczna inteligencja? Ekspert od PLLuM odpowiada

Czy Polsce naprawdę potrzebna jest własna sztuczna inteligencja, skoro światowe modele są na wyciągnięcie ręki? Twórcy polskich modeli językowych przekonują, że chodzi nie tylko o jakość języka, lecz także o bezpieczeństwo, koszty i niezależność.

Jakub Szymczuk, Kanał Zero: Po co nam polska sztuczna inteligencja, skoro każdy może użyć ChatGPT?

Dr inż. Jan Kocoń, kierownik naukowy pierwszej edycji projektu PLLuM (Polish Large Language Model): To fundamentalne pytanie. Zawsze możemy zapytać: czy warto budować własną fabrykę, skoro w kraju obok jest lepsza? Kiedy ChatGPT ujrzał światło dzienne, jego obsługa języka polskiego wzbudzała raczej śmiech. Model mówił trochę jak taki wujek z Ameryki, który mieszka tam już od 20 lat i powoli zapomina polską mowę. Dziś sytuacja wygląda inaczej. Modele wielkich korporacji świetnie mówią po polsku, ale musimy zwrócić uwagę na dwie kluczowe kwestie: bezpieczeństwo i cenę.

Dr inż. Jan Kocoń, adiunkt w Katedrze Sztucznej Inteligencji Politechniki Wrocławskiej, kierownik naukowy pierwszej edycji projektu PLLuM (Polish Large Language Model) oraz lider zespołu badawczego w projekcie CLARIN-PL. (fot. Materiały Prasowe)

Rozumiem kwestię danych, ale koszty? Przecież teraz z wielu tych narzędzi korzystamy za darmo.

Zastanówmy się: wdrażając sztuczną inteligencję w administracji publicznej, medycynie czy ubezpieczeniach, czy chcemy, by nasze poufne dane leciały na zagraniczne serwery? Korporacje twierdzą, że nie trenują swoich modeli na naszych danych, ale właściwie kto złapie je za rękę? My, jako państwo i obywatele, powinniśmy mieć kontrolę nad naszymi informacjami.

A teraz sprawa kosztów. Big techy dają nam dostęp do swoich modeli właściwie po kosztach, czasem za darmo. Działają trochę jak diler, który pierwszą działkę daje gratis, a za kolejne każe słono płacić. Kiedy urzędnicy, obywatele i firmy uzależnią się od tych rozwiązań, inwestorzy z Doliny Krzemowej zażądają zwrotu z inwestycji. Wtedy zamiast darmowej usługi dostaniemy mnóstwo reklam, a abonament za ich wyłączenie z roku na rok będzie drastycznie rosnąć. Inwestycja w PLLuM to inwestycja w naszą cyfrową suwerenność. Zabezpiecza nas przed tym technologicznym uzależnieniem.

Pojawia się w tym kontekście pojęcie „cyfrowego kolonializmu”. Kraje, które nie mają własnych technologii, są całkowicie zależne od infrastruktury obcych mocarstw. Czyli polski model to nasza cyfrowa tarcza?

Zdecydowanie można tak powiedzieć. Każde pieniądze wydane na własne technologie prędzej czy później nam się zwrócą. Zresztą, nasze modele wcale nie mają się czego wstydzić. Jeśli porównamy polskie modele językowe – takie jak PLLuM czy Bielik – z modelami zagranicznej konkurencji w tej samej „kategorii wagowej” (czyli o podobnej liczbie parametrów), okazuje się, że nasze radzą sobie z językiem polskim zauważalnie lepiej.

Wielkie firmy uwzględniają język polski raczej przy okazji. Nas natomiast interesowało uchwycenie polskiego kontekstu kulturowego, niuansów językowych i poprawnej składni.

Skoro wspomniał pan o „kategorii wagowej” – dlaczego PLLuM jest mniejszy od ChatGPT i jakie to ma znaczenie w praktyce?

Większe modele mają więcej tzw. parametrów, co w dużym uproszczeniu oznacza, że są „mądrzejsze” i mają szerszą wiedzę ogólną. Ale za tym idą gigantyczne koszty. Gdybyśmy chcieli oprzeć aplikację mObywatel, z której korzystają miliony Polaków, na gigantycznym modelu, potrzebowalibyśmy infrastruktury za dziesiątki miliardów dolarów.

My idziemy inną drogą. Tworzymy modele mniejsze, ale za to sprytne, szybkie i tanie w utrzymaniu. Taki model nie musi wiedzieć, jak rozwiązać skomplikowane zadanie matematyczne albo jak uzdrowić gospodarkę obcego państwa. Ma dostać konkretne dokumenty urzędowe i na ich podstawie udzielić obywatelowi rzetelnej, zwięzłej odpowiedzi. Zużywa ułamek mocy obliczeniowej, co przekłada się na realne oszczędności finansowe i energetyczne dla państwa. Dodatkowo model jest w całości nasz, mamy nad nim pełną kontrolę.

I taki model każdy Polak może mieć na swoim komputerze?

Dokładnie tak! Cały czas mówimy o wdrożeniach instytucjonalnych, ale prawda jest taka, że każdy obywatel, przedsiębiorca czy prawnik może pobrać bezpłatnie polski model i uruchomić go lokalnie. Dla naszych najmniejszych modeli wystarczy do tego lepszy laptop. Jeśli prawnik ma poufną umowę i nie chce ryzykować wycieku danych, wysyłając ją do zewnętrznego czata, może użyć polskiego modelu bezpośrednio na swoim sprzęcie, bez dostępu do internetu.

Polskie modele mogą być z powodzeniem wykorzystywane w urzędach. W przyszłości chcielibyśmy, aby takie modele potrafiły wstępnie wypełniać formularze czy analizować załączniki, pozostawiając urzędnikowi jedynie rolę walidatora i osoby podejmującej ostateczną decyzję. To uwolniłoby administrację od żmudnego przepisywania danych.

„Sztuczna inteligencja zastępuje zadania, nie ludzi”. Ale zjawisko automatyzacji będzie narastało

Wojna o sztuczną inteligencję w obozie Trumpa. MAGA pęka na pół

Nadciąga demograficzne piekło kobiet

Z jednej strony ułatwienia w urzędach, a z drugiej ratowanie życia. Wiem, że pracujecie nad rewolucyjnymi rozwiązaniami dla polskich szpitali. Jak polska sztuczna inteligencja pomoże pacjentom?

To projekty, które realizujemy m.in. w ramach CLARIN-PL. Współpracujemy ściśle z kardiologami ze szpitali na Dolnym Śląsku. Tworzymy modele przetwarzające historię choroby pacjenta bezpośrednio w szpitalu, bez wysyłania tych danych na zewnątrz.

Dziś dokumentacja medyczna to często nieustrukturyzowany tekst. My uczymy model wyciągać z tego parametry, które mogą pomóc w ocenie ryzyka zgonu pacjenta przyjmowanego na oddział kardiologiczny. Przemęczony po wielogodzinnym dyżurze lekarz może coś przeoczyć. Nasz system może być asystentem, który dyskretnie podpowie: „zwróć pilniejszą uwagę na tego pacjenta”. Co ważne, badamy hipotezę, że model douczany na lokalnej, polskiej populacji będzie skuteczniejszy niż systemy przygotowane w innych krajach, bo u nas pacjenci mogą mieć przykładowo inne obciążenia i predyspozycje niż chociażby mieszkańcy Teksasu. Pracujemy też nad modelami „słuchającymi” rozmowy lekarza z pacjentem i automatycznie generującymi notatki medyczne. Wszystko lokalnie, na komputerze w gabinecie, bez konieczności wysyłania danych poza placówkę medyczną.

Będzie lista zawodów tylko dla ludzi? Zanim powstanie, sztuczna inteligencja zdąży je zastąpić

Jakie są kolejne te najbardziej wizjonerskie plany na rozwój?

Idziemy w trzech fascynujących kierunkach. Po pierwsze, modele tzw. Mixture of Experts (MoE) – to potężne architektury, które posiadają w sobie „wielu ekspertów", ale do rozwiązania konkretnego zadania uruchamiają tylko tych potrzebnych, co drastycznie przyspiesza działanie.

Po drugie, wdrażamy w modelach zdolność do „rozumowania”, czyli prowadzenia ciągów myślowych przed udzieleniem odpowiedzi, co jest kluczowe w skomplikowanych zadaniach logicznych.

Po trzecie, pracujemy nad multimodalnością i korzystaniem z zewnętrznych narzędzi (tzw. function calling). Chcemy, by nasz system potrafił samodzielnie uruchomić kalkulator, gdy musi coś dokładnie policzyć albo sprawdzić aktualne przepisy prawne w zewnętrznej bazie, zanim odpowie użytkownikowi. Docelowo chcemy też, aby w przyszłości modele PLLuM „widziały” i „słyszały” – rozumiały rysunki techniczne, skany medyczne czy pliki audio.

Polska sztuczna inteligencja nie jest już tylko eksperymentem. To realne narzędzie wspierające funkcjonowanie państwa, biznesu i, co dla mnie najważniejsze, polskiej nauki oraz medycyny.