Polacy nie gęsi, swój LLM mają


Gdyby zapytać ludzi jakie modele AI znają, można spodziewać się, że padną modele udostępniane przez największych dostawców tj. ChatGPT, Gemini lub Claude. W tym artykule przedstawiam dwie, moim zdaniem najważniejsze, inicjatywy prowadzone przez Polaków. Są to PLLuM i Bielik. Celem tych projektów jets stworzenie modeli, które mają lepiej rozumieć nasz język polski, znać nasze polskie zwyczaje kulturowe i specyfikę lokalnych zastosowań oraz być ogólnie dostępne dla polskiego społeczeństwa.

PLLuM – Polish Large Language Universal Model

Największym projektem w Polsce jest PLLuM. Jest to inicjatywa badawczo-rozwojowa mająca na celu stworzenie dużego, otwartego modelu językowego dla języka polskiego. Projekt powstał dzięki konsorcjum polskich instytucji naukowych i badawczych, m.in. Politechniki Wrocławskiej, NASK, OPI PIB, PAN, Uniwersytetu Łódzkiego, a jego finansowanie pochodzi z Ministerstwa Cyfryzacji. Celem PLLuM jest stworzenie modelu, który będzie:

  • dostępny na otwartej licencji, z możliwością wykorzystania w administracji, biznesie i badaniach,
  • przystosowany do polszczyzny i polskiej rzeczywistości,
  • używany m.in. jako inteligentny asystent wspierający obsługę obywateli w publicznych usługach.

Projekt jest rozwijany od początku 2024 roku. Zakończenie prac i udostępnienie pierwszych rezultatów miało miejsce w 2025 roku. Modele PLLuM są już udostępniane w różnych wariantach i testowane w praktyce, m.in. w ramach pilotażu w administracji publicznej. Obecnie jest wykorzystywany w aplikacji mObywatel do obsługi użytkownika. 1

Przykładem zastosowania PLLuM jest również pilotaż w mieście Częstochowa, gdzie model wspiera automatyzację lokalnych usług administracyjnych – od pisania oficjalnych pism po analizę zapytań mieszkańców. 2

PLLuM ma być też elementem budowania suwerenności technologicznej Polski, czyli niezależności od zagranicznych dostawców dużych modeli AI. Więcej o PLLuM możesz przeczytać tutaj

Bielik – polski model typu open source

Innym ważnym polskim projektem LLM jest Bielik AI, rozwijany przez Fundację SpeakLeash we współpracy z Akademickim Centrum Komputerowym Cyfronet AGH. To rodzina modeli językowych zaprojektowanych z myślą o języku polskim – w tym duży model o nazwie Bielik-11B-v3, mający ok. 11 miliardów parametrów.

Bielik wyróżnia się:

  • dużą, autorską bazą danych tekstów w języku polskim,
  • otwartym kodem i dostępnością dla społeczności AI,
  • różnymi wariantami modeli o różnej skali parametrów (np. mniejsze wersje 1,5B i 4,5B w nowszych iteracjach).

Nowsze wersje Bielika uzyskują dobre wyniki w międzynarodowych benchmarkach porównujących modele językowe, co wskazuje na ich konkurencyjność wobec innych LLM-ów na świecie.

Fundacja prowadzi kilka ciekawych projektów. Udział w tych projektach zachęcani są zwykli obywatele. Nasze zaangażowanie ma pomóc i przyspieszyć rozwój kolejnych modeli. Tymi projektami są:

Obywatel Bielik

Jest to projekt mający na celu zachęcenie Polaków do rozwoju kolejnych modeli z rodziny Bielik. Przygotowana została aplikacja, która ma ułatwić wysyłanie danych i ich opisywanie. Dane te będą wykorzystane do trenowania kolejnych wersji modelu Bielik. Więcej o tej inicjatywnie można dowiedzieć się pod URL https://obywatel.bielik.ai/

Sójka AI

Kolejny projekt prowadzony przez Funcje SpeakLeash. Ma on na celu wychytywanie szkodliwych treści w czasie rzeczywistym. Moim zdaniem jest to niesłychanie ważny projekt, w czasach gdy język posługiwania się w mediach jest na niskim poziomie. Zachęcamm do zapoznania się ze szczegółami https://guard.bielik.ai/

Inne inicjatywy i projekty

Poza PLLuM i Bielikiem istnieje kilka mniejszych lub bardziej wyspecjalizowanych projektów związanych z LLM w Polsce:

  • Projekty badawcze nad zasobami językowymi i infrastrukturą, np. w ramach CLARIN-PL, które mają wspierać rozwój narzędzi NLP i przyszłych modeli językowych dostosowanych do polskiego języka. 3
  • Branżowe eksperymenty z modelami językowymi dla konkretnych sektorów, np. projekt OPI PIB i PKO BP skoncentrowany na modelach do zastosowań w finansach i analizie danych branżowych. 4
  • Społecznościowe i eksperymentalne przedsięwzięcia, takie jak nieformalne propozycje lokalnych modeli (np. Polka 1.1B czy różne fine-tune’y modeli bazowych) publikowane i rozwijane w społecznościach open source.5

Dlaczego własne polskie LLM mają znaczenie

Polskie modele LLM są budowane przede wszystkim z myślą o:

  • lepszym rozumieniu i generowaniu języka polskiego, z uwzględnieniem niuansów kulturowych i językowych,
  • suwerenności technologicznej – mniejszej zależności od zagranicznych dostawców AI,
  • praktycznych zastosowaniach, takich jak chatboty, automatyzacja procesów administracyjnych, analiza tekstu i wsparcie pracy ekspertów.

W porównaniu do zagranicznych LLM-ów, polskie modele mogą oferować lepsze dopasowanie do lokalnych potrzeb językowych i prawnych oraz większą kontrolę nad danymi wykorzystywanymi w procesie uczenia i zastosowań.

Jak korzystać z polskich LLM?

Z obu modeli można korzystać tak samo jak z popularnych modeli za pomocą czatu. Należy pamiętać, że te modele nie są tak duże jak modele “gigantów”. Należy pisać dobrze zdefionowane prompty, aby uzyskać oczekiwane rezultaty. Jak pisać dobre prompty pisałem w tym wpisie.

https://chat.bielik.ai/

https://pllum.clarin-pl.eu/pllum_8x7b

Istnieje też możliwość uruchonienia modeli lokalnie. Ale to wymaga nieco wiedzy technicznej i odpowiednio mocnego GPU z odpowiednią ilością RAM. Ja korzystam z ollama. Jednak ze względu na ograniczenia sprzętowe prędkość generowanych tokenów jest niska. Niemniej do prostych eksperymentów i prac jest wystarczająca.

Podsumowanie

Polska scena LLM dynamicznie się rozwija. Największe projekty, takie jak PLLuM i Bielik, osiągają rezultaty, które mogą realnie konkurować z międzynarodowymi rozwiązaniami w specyficznych zadaniach językowych. Ich rozwój wspierany jest zarówno przez instytucje publiczne i naukowe, jak i społeczność open source. Mam nadzieję, że te inwestycje w LLM to krok w kierunku naszej technologicznej niezależności i lepszego wykorzystania AI w publicznych i komercyjnych zastosowaniach.

Footnotes

  1. https://www.gov.pl/web/cyfryzacja/pllum—polski-model-jezykowy-jak-dziala-i-do-czego-moze-sie-przydac

  2. https://www.reddit.com/r/europes/comments/1mnfjpk/cz%C4%99stochowa_city_becomes_first_to_use_polish_ai/

  3. https://ai.pwr.edu.pl/projects/24-mnisw-clarin-biz-bis-piasecki/

  4. https://opi.org.pl/en/project/the-development-of-innovative-polish-domain-specific-large-language-models-and-a-service-platform-that-delivers-multitask-models-to-be-used-internally-by-pko-bp/

  5. https://www.reddit.com/r/LocalLLaMA/comments/1am6d1w