REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

Polska odpowiedź na ChatGPT: PLLuM - modele językowe AI wyspecjalizowane w języku polskim. Już można korzystać

PLLuM Chat - strona główna
PLLuM - modele językowe wyspecjalizowane w języku polskim już udostępnione. Lepsze od ChatGPT?
Źródło zewnętrzne

REKLAMA

REKLAMA

Staraliśmy się, by polskie modele językowe PLLuM były bezpieczne, dostosowane do języka polskiego i "wytrenowane" na legalnie pozyskanych danych — powiedział PAP dr hab. Szymon Łukasik z NASK, ośrodka zaangażowanego w prace nad opublikowanymi w lutym modelami AI.

rozwiń >

PLLuM - rodzina dużych polskich modeli językowych

PLLuM (Polish Large Language Universal Model) to rodzina dużych polskich modeli językowych. Tego typu programy sztucznej inteligencji (AI) umożliwiają generowanie tekstu oraz przetwarzanie języka naturalnego. Dzięki nim komunikacja z maszyną nie wymaga od użytkownika stosowania sztywnych kodów i mechanicznych poleceń, ale przypominać może dialog z człowiekiem.

W odróżnieniu od komercyjnych modeli LLM (takich jak ChatGPT, Claude czy Gemini), modele PLLuM wyspecjalizowane są w języku polskim, choć do ich trenowania używano również tekstów w innych językach słowiańskich, bałtyckich oraz oczywiście w języku angielskim.

"Model jest dostosowany do języka i kultury polskiej. Prace w ramach tego projektu wspierają zaś polskich ekspertów i rozwój kompetencji w dziedzinie sztucznej inteligencji" — wyjaśnił w rozmowie z PAP uczestnik projektu dr hab. Szymon Łukasik, prof. AGH i dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK. Ośrodek ten ma koordynować teraz prace nad dalszymi pracami i wdrożeniem modeli w prace administracji publicznej — w ramach działań konsorcjum HIVE.

Do doszkalania modeli wykorzystano największy w Polsce, bo liczący 40 tys. interakcji, zbiór zapytań, w tym około 3,5 tys. dłuższych dialogów między tutejszymi trenerami a maszyną. Dzięki tej mrówczej pracy tzw. anotatorów AI ma sobie lepiej radzić ze specyfiką polskiego języka i polskiej kultury.

REKLAMA

REKLAMA

Bezpieczeństwo i etyka

Badacz tłumaczy, jak ważne były w ramach prac kwestie bezpieczeństwa i etycznego podejścia do budowy AI. "Filozofią przyświecającą budowie tego modelu było to, żeby kwestie zbierania danych były maksymalnie przejrzyste. Żebyśmy mieli pewność, na jakim polu modele zbudowane z ich użyciem można wykorzystać" — powiedział dr hab. Łukasik. Wskazał, że przedstawiciele projektu zawierali np. umowy z redakcjami i pozyskiwali oficjalne zgody na korzystanie z archiwów polskich tekstów.

PLLuM — jak zapewniają jego twórcy — powstaje zgodnie z krajowymi i unijnymi wytycznymi dotyczącymi sztucznej inteligencji. I uwzględnia aktualne standardy ochrony danych.

30 miliardów tokenów

Ekspert z NASK tłumaczy, że język polski jest językiem o niskich zasobach. A to znaczy, że danych, które można wykorzystać do budowy modeli, nie ma zbyt dużo. Modele PLLuM do użytku komercyjnego są trenowane na ok. 30 miliardach tokenów (token to kawałek przetwarzanego tekstu - np. słowo lub jego fragment); zaś modele do użytku niekomercyjnego – dla takiego celu zasobów jest znacznie więcej – były trenowane na około 150 miliardach.

Wykorzystanie w administracji państwowej

Modele PLLuM docelowo mają być używane w administracji państwowej, a to oznacza kolejne wyzwania związane z bezpieczeństwem. Twórcy projektu musieli zadbać o to, by model stawiał w swoich odpowiedziach granice i by nie padały tam jakieś nielegalne, nieprawdziwe lub kontrowersyjne treści.

REKLAMA

PLLuM Chat i PLLuM dla programistów

Modele PLLuM udostępnione są bezpłatnie w formie czatu wszystkim zainteresowanym https://pllum.clarin-pl.eu/. Ministerstwo Cyfryzacji opublikowało też dotąd 18 otwartych wersji modelu PLLuM dla programistów https://huggingface.co/CYFRAGOVPL. Do dyspozycji wszystkich zainteresowanych są więc zarówno lekkie, ale mniej dokładne wersje modeli, które można ściągnąć na laptopa, jak i mocniejsze, ale wymagające wielu kart graficznych modele do bardziej zaawansowanych zastosowań - np. badawczych. W przypadku obu typów istnieje możliwość uruchomienia modeli na własnej infrastrukturze, bez konieczności przekazywania zapytań do podmiotów zewnętrznych.

Dalszy ciąg materiału pod wideo

Generatory - wyspecjalizowane modele RAG-owe

W ramach projektu powstały też generatory, czyli wyspecjalizowane modele RAG-owe (ang. Retrieval Augmented Generation). Dzięki takim modelom można np. przeszukiwać i analizować swoje lokalne bazy danych i tworzyć wirtualnych asystentów analizujących zbiory własnych dokumentów. Zespół PLLuM zbudował najmniejszy (8 mld parametrów) ale wiodący w rankingach dla polskiego języka generator tego typu.

PLLuM i HIVE

Dr Łukasik odniósł się też do zmiany nazwy projektu z PLLuM na HIVE. "Nasze modele nazywają się PLLuM, a ich rodzina będzie dalej rozwijana w ramach konsorcjum HIVE. Chcieliśmy w ten sposób nawiązać do idea współpracy wielu badaczy, inżynierów i instytucji, działających niczym pszczoły w jednym ekosystemie, wymieniając się wiedzą i zasobami (np. danymi, kodem, modelami). Natomiast być może kiedyś będziemy chcieli wypuścić jakąś nową rodzinę modeli - z nową nazwą. Rozmawiamy o tym z Ministerstwem Cyfryzacji" - wskazał dr Łukasik.

Ludwika Tomala (PAP)
lt/ zan/ ktl/

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
D. Tusk: nie będzie reformy PIP; przesadna władza urzędników byłaby destrukcyjna dla firm

Premier Donald Tusk na konferencji prasowej 6 stycznia 2025 r. poinformował, że podjął decyzję, aby nie kontynuować prac nad reformą Państwowej Inspekcji Pracy. Zaznaczył, że przesadna władza dla urzędników, wprowadzana reformą byłaby destrukcyjna dla firm i oznaczałaby utratę pracy dla wielu ludzi.

Przestępstwo obrazy uczuć religijnych bez kary więzienia. MS chce zmiany w kodeksie karnym z powodu wyroku ETPCz w sprawie „Rabczewska przeciwko Polsce”

W dniu 5 stycznia 2026 r. Ministerstwo Sprawiedliwości przekazało do uzgodnień międzyresortowych i konsultacji publicznych projekt zmian w Kodeksie karnym, dotyczący usunięcia kary pozbawienia wolności z katalogu kar przewidzianych za przestępstwo obrazy uczuć religijnych. Jak tłumaczy resort sprawiedliwości, to konsekwencja wyroku Europejskiego Trybunału Praw Człowieka Polska zmierza do wywiązania się z obowiązków wynikających z Konwencji o ochronie praw człowieka i podstawowych wolności. Zmiany przepisów mają nie dopuścić do powtórzenia się podobnych naruszeń jakie wykazano w sprawie „Rabczewska przeciwko Polsce”.

Testament audiowizualny. Czy będzie w 2026 roku?

Testament audiowizualny ma ułatwić przekazanie majątku. Nowe rozwiązanie ma zarówno swoich zwolenników, jak i przeciwników. Nie brakuje głosów, iż w dobie sztucznej inteligencji łatwo o sfałszowanie ostatniej woli spadkodawcy. Na jakim etapie są obecnie prace nad nowymi przepisami?

Przepisy do zmiany, Jeżeli nie możesz odśnieżyć chodnika (ciąża, choroba, wiek) musisz za to zapłacić

Przypominam artykuł z 2023 r. o absurdalnym obowiązku odśnieżania chodników gmin i miast przez prywatne osoby. Mieszkańcy muszą to robić, gdy ich posesja sąsiaduje z chodnikiem publicznym. Nikt nie potrafi wyjaśnić dlaczego ktoś ma za darmo wykonywać tą pracę. Zwłaszcza, że przepisy nie przewidują zwolnienia z tej darmowej pracy na rzecz bogatej Warszawy, Wrocławia czy Poznania osób chorych, starszych, niepełnosprawnych. Osoby te mogą zawiadomić gminę, że nie odśnieżą jej chodnika. Wtedy gmina odśnieża i ... żąda zapłaty (według przepisów) za swoją pracę. Naprawdę tak stanowi prawo.

REKLAMA

Szkoły zawieszają zajęcia. Część dzieci nie wróci do szkoły 7 stycznia 2026 r.? „Chcemy w ten sposób zadbać o bezpieczeństwo uczniów”

Ze względu na trudne warunki atmosferyczne (i w związku z tym również komunikacyjne), które panują obecnie w wielu częściach kraju – w 2026 r., pierwsze szkoły, zdecydowały się już na odwołanie z tego powodu zajęć lekcyjnych. „Chcemy w ten sposób zadbać o bezpieczeństwo uczniów” – ogłosiła dyrektorka jednej ze szkół w województwie pomorskim. W jakich okolicznościach – zgodnie z aktualnie obowiązującymi przepisami – szkoła może zostać zamknięta z powodu niskich temperatur lub intensywnych opadów śniegu?

Sąd nakazał. I ZUS podwyższa emerytury. 5 przykładów. Od 612,63 zł do 2.280,20 zł brutto. Warto iść do sądu

Często otrzymuję zapytania, czy prawomocne wyroki sądów powszechnych dotyczące art. 25 ust. 1b ustawy emerytalnej, wydawane po wyroku TK z 4 czerwca 2024 roku sygn. akt SK 140/20 są realizowane przez Zakład Ubezpieczeń Społecznych (ZUS). Do tej pory, we wszystkich prowadzonych przeze mnie sprawach dotyczących osób poszkodowanych przez art. 25 ust. 1b ustawy emerytalnej, prawomocne wyroki zostały zrealizowane lub są w trakcie realizacji przez ZUS.

246 korzystnych wyroków sądów powszechnych w sprawach dot. wyroku TK z 4 czerwca 2024 r. SK 140/20, w tym 68 prawomocnych

Przedstawiony w artykule problem przeliczenia emerytur dotyczy około 100 000 - 200 000 poszkodowanych emerytów. Na razie mamy 246 korzystnych wyroków sądów powszechnych w sprawach dot. wyroku TK z 4 czerwca 2024 r. SK 140/20, w tym 68 prawomocnych. Nic nie wskazuje na zatrzymanie wzrostu liczby tych wyroków. ZUS seryjnie przegrywa sprawy o przeliczenie emerytur. Ale pamiętajmy, że poszkodowanych może być od 100 000 do 200 000 osób (są rozbieżne szacunki tej liczby). Około 300 osób, które otrzyma w najbliższym czasie częściową rekompensatę ma się niestety nijak do masy osób mających prawo do wyższej emerytury. Osoby te wciąż nie odzyskały należnych im pieniędzy.

Wielka rewolucja w telewizji. Sejmowa komisja stawia ultimatum nadawcom: Koniec z dyskryminacją niepełnosprawnych

Oglądasz wieczorne wiadomości, ulubiony serial czy debatę publicystyczną i wszystko jest dla Ciebie jasne. To komfort, nad którym rzadko się zastanawiamy. Tymczasem dla setek tysięcy Polaków ten sam ekran pozostaje barierą nie do przebicia. W sejmowych kuluarach właśnie zapadła decyzja, która może wywrócić rynek telewizyjny do góry nogami. Komisja do Spraw Petycji skierowała do Ministerstwa Kultury pismo, które wskazuje, że obecne przepisy są w 50% niewystarczające. Jeśli resort przychyli się do tego postulatu, do 2030 roku polska telewizja zmieni się nie do poznania, a nadawcy będą musieli więcej zainwestować.

REKLAMA

Więcej inwestycji bez pozwolenia na budowę (np. przydomowe schrony, tarasy, oczka wodne i baseny). 7 stycznia 2026 r. wchodzi nowelizacja Prawa budowlanego

Ministerstwo Rozwoju i Technologii poinformowało w komunikacie, że 7 stycznia 2026 r. wchodzi w życie większość przepisów nowelizacji Prawa budowlanego oraz niektórych innych ustaw. Ta nowelizacja ma uprościć proces budowlany (tj. formalności prawno-administracyjne związane z inwestycją budowlaną. Więcej inwestycji będzie mogło być realizowanych bez pozwolenia na budowę a nawet bez zgłoszenia.

Ci cudzoziemcy nie muszą mieć zezwolenia na pracę w Polsce [lista]. Nowe przepisy już obowiązują

W dniu 1 czerwca 2025 r. weszła w życie ustawa o warunkach dopuszczalności powierzania pracy cudzoziemcom na terytorium Rzeczypospolitej Polskiej. Ustawa ta określa w szczególności listę cudzoziemców, którzy mogą pracować w Polsce bez zezwolenia na pracę. Oprócz tego Minister Rodziny, Pracy i Polityki Społecznej w rozporządzeniu z 20 listopada 2025 r. (weszło w życie 1 grudnia 2025 r.) określił listę szczególnych przypadków, w których cudzoziemiec uprawniony do pobytu na terytorium Polskie ma prawo wykonywać pracę bez zezwolenia na pracę lub oświadczenia o powierzeniu pracy cudzoziemcowi.

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA