REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

Polska odpowiedź na ChatGPT: PLLuM - modele językowe AI wyspecjalizowane w języku polskim. Już można korzystać

PLLuM Chat - strona główna
PLLuM - modele językowe wyspecjalizowane w języku polskim już udostępnione. Lepsze od ChatGPT?
Źródło zewnętrzne

REKLAMA

REKLAMA

Staraliśmy się, by polskie modele językowe PLLuM były bezpieczne, dostosowane do języka polskiego i "wytrenowane" na legalnie pozyskanych danych — powiedział PAP dr hab. Szymon Łukasik z NASK, ośrodka zaangażowanego w prace nad opublikowanymi w lutym modelami AI.

rozwiń >

PLLuM - rodzina dużych polskich modeli językowych

PLLuM (Polish Large Language Universal Model) to rodzina dużych polskich modeli językowych. Tego typu programy sztucznej inteligencji (AI) umożliwiają generowanie tekstu oraz przetwarzanie języka naturalnego. Dzięki nim komunikacja z maszyną nie wymaga od użytkownika stosowania sztywnych kodów i mechanicznych poleceń, ale przypominać może dialog z człowiekiem.

W odróżnieniu od komercyjnych modeli LLM (takich jak ChatGPT, Claude czy Gemini), modele PLLuM wyspecjalizowane są w języku polskim, choć do ich trenowania używano również tekstów w innych językach słowiańskich, bałtyckich oraz oczywiście w języku angielskim.

"Model jest dostosowany do języka i kultury polskiej. Prace w ramach tego projektu wspierają zaś polskich ekspertów i rozwój kompetencji w dziedzinie sztucznej inteligencji" — wyjaśnił w rozmowie z PAP uczestnik projektu dr hab. Szymon Łukasik, prof. AGH i dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK. Ośrodek ten ma koordynować teraz prace nad dalszymi pracami i wdrożeniem modeli w prace administracji publicznej — w ramach działań konsorcjum HIVE.

Do doszkalania modeli wykorzystano największy w Polsce, bo liczący 40 tys. interakcji, zbiór zapytań, w tym około 3,5 tys. dłuższych dialogów między tutejszymi trenerami a maszyną. Dzięki tej mrówczej pracy tzw. anotatorów AI ma sobie lepiej radzić ze specyfiką polskiego języka i polskiej kultury.

REKLAMA

REKLAMA

Bezpieczeństwo i etyka

Badacz tłumaczy, jak ważne były w ramach prac kwestie bezpieczeństwa i etycznego podejścia do budowy AI. "Filozofią przyświecającą budowie tego modelu było to, żeby kwestie zbierania danych były maksymalnie przejrzyste. Żebyśmy mieli pewność, na jakim polu modele zbudowane z ich użyciem można wykorzystać" — powiedział dr hab. Łukasik. Wskazał, że przedstawiciele projektu zawierali np. umowy z redakcjami i pozyskiwali oficjalne zgody na korzystanie z archiwów polskich tekstów.

PLLuM — jak zapewniają jego twórcy — powstaje zgodnie z krajowymi i unijnymi wytycznymi dotyczącymi sztucznej inteligencji. I uwzględnia aktualne standardy ochrony danych.

30 miliardów tokenów

Ekspert z NASK tłumaczy, że język polski jest językiem o niskich zasobach. A to znaczy, że danych, które można wykorzystać do budowy modeli, nie ma zbyt dużo. Modele PLLuM do użytku komercyjnego są trenowane na ok. 30 miliardach tokenów (token to kawałek przetwarzanego tekstu - np. słowo lub jego fragment); zaś modele do użytku niekomercyjnego – dla takiego celu zasobów jest znacznie więcej – były trenowane na około 150 miliardach.

Wykorzystanie w administracji państwowej

Modele PLLuM docelowo mają być używane w administracji państwowej, a to oznacza kolejne wyzwania związane z bezpieczeństwem. Twórcy projektu musieli zadbać o to, by model stawiał w swoich odpowiedziach granice i by nie padały tam jakieś nielegalne, nieprawdziwe lub kontrowersyjne treści.

REKLAMA

PLLuM Chat i PLLuM dla programistów

Modele PLLuM udostępnione są bezpłatnie w formie czatu wszystkim zainteresowanym https://pllum.clarin-pl.eu/. Ministerstwo Cyfryzacji opublikowało też dotąd 18 otwartych wersji modelu PLLuM dla programistów https://huggingface.co/CYFRAGOVPL. Do dyspozycji wszystkich zainteresowanych są więc zarówno lekkie, ale mniej dokładne wersje modeli, które można ściągnąć na laptopa, jak i mocniejsze, ale wymagające wielu kart graficznych modele do bardziej zaawansowanych zastosowań - np. badawczych. W przypadku obu typów istnieje możliwość uruchomienia modeli na własnej infrastrukturze, bez konieczności przekazywania zapytań do podmiotów zewnętrznych.

Dalszy ciąg materiału pod wideo

Generatory - wyspecjalizowane modele RAG-owe

W ramach projektu powstały też generatory, czyli wyspecjalizowane modele RAG-owe (ang. Retrieval Augmented Generation). Dzięki takim modelom można np. przeszukiwać i analizować swoje lokalne bazy danych i tworzyć wirtualnych asystentów analizujących zbiory własnych dokumentów. Zespół PLLuM zbudował najmniejszy (8 mld parametrów) ale wiodący w rankingach dla polskiego języka generator tego typu.

PLLuM i HIVE

Dr Łukasik odniósł się też do zmiany nazwy projektu z PLLuM na HIVE. "Nasze modele nazywają się PLLuM, a ich rodzina będzie dalej rozwijana w ramach konsorcjum HIVE. Chcieliśmy w ten sposób nawiązać do idea współpracy wielu badaczy, inżynierów i instytucji, działających niczym pszczoły w jednym ekosystemie, wymieniając się wiedzą i zasobami (np. danymi, kodem, modelami). Natomiast być może kiedyś będziemy chcieli wypuścić jakąś nową rodzinę modeli - z nową nazwą. Rozmawiamy o tym z Ministerstwem Cyfryzacji" - wskazał dr Łukasik.

Ludwika Tomala (PAP)
lt/ zan/ ktl/

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
PILNE: od 19.11.2025 do 28.02.2026 r. całodobowe dyżury we wskazanych urzędach, a osoby wyznaczone do wykonywania zadań ochronny wyposażone w broń i amunicję. Weszło w życie zarządzenie premiera wprowadzające trzeci stopień alarmowy

Zarządzeniem wydanym w dniu 19 listopada 2025 r. premier Donald Tusk wprowadził trzeci stopień alarmowy CHARLIE. Obejmuje on obszary linii kolejowych zarządzanych przez PKP Polskie Linie Kolejowe S.A. oraz PKP Linia Hutnicza Szerokotorowa Sp. z o.o. i będzie obowiązywał w okresie od dnia 19 listopada 2025 r., od godz. 00.00, do dnia 28 lutego 2026 r., do godz. 23.59. Sprawdź, co poszczególne alarmy, oznaczają dla urzędów administracji publicznej i dla obywateli naszego kraju.

Przepadek psa i zakaz posiadania zwierząt. Trzeba będzie lepiej pilnować zwierząt. Sejm pracuje nad zmianami

Liczba zwierząt domowych w Polsce rośnie. W ostatnim czasie wzrosła też liczba niebezpiecznych zdarzeń z udziałem psów. Problem narasta, a Sejm pracuje nad projektem zmian, który ma szansę nieco poprawić sytuację. Co na to właściciele zwierząt?

Masz AI w telefonie? Możliwe, że służby czytają już twoje prompty. Pierwszy w historii nakaz sądowy dot. danych z ChatGPT

Czasopismo Forbes ujawniło przełomową sprawę z Maine, która zmienia sposób, w jaki myślimy o prywatności cyfrowej w erze sztucznej inteligencji. Po raz pierwszy w historii amerykańskie organy federalne uzyskały nakaz sądowy zmuszający OpenAI do wydania danych użytkownika na podstawie zapytań do ChatGPT – a szczegóły tej sprawy są absolutnie fascynujące. Co więcej, nowy raport wywiadowczy Anthropic z sierpnia 2025 roku ujawnia znacznie szerszy obraz wykorzystania systemów AI przez cyberprzestępców, tworząc niepokojący kontekst dla rosnącej roli sztucznej inteligencji zarówno w przestępczości, jak i w jej zwalczaniu.

Czy od 2026 r. trzeba będzie raportować do fiskusa transakcje firmowymi i prywatnymi kartami płatniczymi? Ministerstwo wyjaśnia

W sieci pojawiają się nieprawdziwe informacje, według których od 2026 r. urzędy skarbowe będą rzekomo otrzymywać od banków dane o płatnościach kartą przekraczających ustalony próg. Ministerstwo Finansów zdementowało te doniesienia. Wprowadzenie takich przepisów byłoby uzasadnione tylko w wybranych sytuacjach kryzysowych - powiedział PAP prof. Błażej Podgórski.

REKLAMA

Wniosek o świadczenie pielęgnacyjne. Rodzice mają problem z niejasnym terminem

Jeżeli rodzic zawnioskuje o świadczenie w okresie trzech miesięcy, licząc od dnia wydania orzeczenia, to gmina przyzna wsparcie począwszy od miesiąca, w którym złożono wniosek o ustalenie niepełnosprawności lub stopnia niepełnosprawności. Jak liczyć ten termin, gdy orzeczenie o niepełnosprawności uzyskano w postępowaniu sądowym?

Stawkę za grudzień trzeba zaktualizować. Nie każdy o tym pamięta. Pracownicy powinni sprawdzić, czy dostali należne pieniądze

Zmiany wprowadzane na gruncie prawa pracy i prawa podatkowego najczęściej wchodzą w życie na początku roku kalendarzowego. W szczególności dotyczy to przypadków, w których są one związane z obciążeniami finansowymi. Niestety nie jest to regułą, co oznacza, że zawsze trzeba zachować czujność.

ZUS najpierw przyznał matce 800 plus, a teraz każe oddać pieniądze. Jednocześnie jednak nadal je… wypłaca. Co się dzieje? [wyrok]

Świadczenie 800 plus ma poprawić sytuację dzieci. Trafia jednak do rąk rodziców. Takie rozwiązanie jest zrozumiałe i uzasadnione, ale okazuje się, że może również być źródłem wielu problemów. I nie chodzi o to, że rodzice się nie dogadują między sobą. Również ZUS czasami zmienia zdanie.

Seniorze nie daj się nabrać: uważny senior powinien zwracać na to uwagę, szczególnie w okresie przedświątecznym

Seniorze nie daj się nabrać. Uważny senior powinien zwracać na to uwagę, szczególnie w okresie przedświątecznym. Nieuczciwe praktyki sprzedażowe wobec osób starszych to problem, który od lat powraca w różnych formach: od agresywnej sprzedaży door-to-door po natarczywe telefony i pozornie bezpłatne pokazy. Zmienili się sprzedawcy, technologie i kanały kontaktu, ale mechanizm oszustwa pozostał ten sam: wywołać emocje, zaskoczyć, zmusić do szybkiej decyzji. Podpowiadamy jak reagować, co robić i co mówić.

REKLAMA

USA mówią STOP prawom autorskim dla AI. Ten wyrok zmienia zasady gry

Amerykański sąd apelacyjny definitywnie odrzucił prawa autorskie dla obrazu stworzonego przez sztuczną inteligencję, podtrzymując zasadę, że autorem może być tylko człowiek. Ten głośny wyrok – już viralowy w branży technologicznej – otwiera nowy front w globalnej debacie o AI, własności intelektualnej i przyszłości kreatywności w erze generatywnych modeli.

Czy ciężko jest wybrać dobrego prawnika?

Wszyscy wiemy, że prawnik może być niezbędny – przy zakładaniu firmy, sporach z kontrahentem czy problemach z pracownikami. Ale kiedy rzeczywiście sięgamy po telefon, żeby umówić konsultację, nagle ogarnia nas strach. Który wybrać? Jak poznać, że jest kompetentny? Czy nie przepłacę? A może w ogóle da się jakoś bez niego?

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA