REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

Polska odpowiedź na ChatGPT: PLLuM - modele językowe AI wyspecjalizowane w języku polskim. Już można korzystać

PLLuM Chat - strona główna
PLLuM - modele językowe wyspecjalizowane w języku polskim już udostępnione. Lepsze od ChatGPT?
Źródło zewnętrzne

REKLAMA

REKLAMA

Staraliśmy się, by polskie modele językowe PLLuM były bezpieczne, dostosowane do języka polskiego i "wytrenowane" na legalnie pozyskanych danych — powiedział PAP dr hab. Szymon Łukasik z NASK, ośrodka zaangażowanego w prace nad opublikowanymi w lutym modelami AI.

rozwiń >

PLLuM - rodzina dużych polskich modeli językowych

PLLuM (Polish Large Language Universal Model) to rodzina dużych polskich modeli językowych. Tego typu programy sztucznej inteligencji (AI) umożliwiają generowanie tekstu oraz przetwarzanie języka naturalnego. Dzięki nim komunikacja z maszyną nie wymaga od użytkownika stosowania sztywnych kodów i mechanicznych poleceń, ale przypominać może dialog z człowiekiem.

W odróżnieniu od komercyjnych modeli LLM (takich jak ChatGPT, Claude czy Gemini), modele PLLuM wyspecjalizowane są w języku polskim, choć do ich trenowania używano również tekstów w innych językach słowiańskich, bałtyckich oraz oczywiście w języku angielskim.

"Model jest dostosowany do języka i kultury polskiej. Prace w ramach tego projektu wspierają zaś polskich ekspertów i rozwój kompetencji w dziedzinie sztucznej inteligencji" — wyjaśnił w rozmowie z PAP uczestnik projektu dr hab. Szymon Łukasik, prof. AGH i dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK. Ośrodek ten ma koordynować teraz prace nad dalszymi pracami i wdrożeniem modeli w prace administracji publicznej — w ramach działań konsorcjum HIVE.

Do doszkalania modeli wykorzystano największy w Polsce, bo liczący 40 tys. interakcji, zbiór zapytań, w tym około 3,5 tys. dłuższych dialogów między tutejszymi trenerami a maszyną. Dzięki tej mrówczej pracy tzw. anotatorów AI ma sobie lepiej radzić ze specyfiką polskiego języka i polskiej kultury.

REKLAMA

REKLAMA

Bezpieczeństwo i etyka

Badacz tłumaczy, jak ważne były w ramach prac kwestie bezpieczeństwa i etycznego podejścia do budowy AI. "Filozofią przyświecającą budowie tego modelu było to, żeby kwestie zbierania danych były maksymalnie przejrzyste. Żebyśmy mieli pewność, na jakim polu modele zbudowane z ich użyciem można wykorzystać" — powiedział dr hab. Łukasik. Wskazał, że przedstawiciele projektu zawierali np. umowy z redakcjami i pozyskiwali oficjalne zgody na korzystanie z archiwów polskich tekstów.

PLLuM — jak zapewniają jego twórcy — powstaje zgodnie z krajowymi i unijnymi wytycznymi dotyczącymi sztucznej inteligencji. I uwzględnia aktualne standardy ochrony danych.

30 miliardów tokenów

Ekspert z NASK tłumaczy, że język polski jest językiem o niskich zasobach. A to znaczy, że danych, które można wykorzystać do budowy modeli, nie ma zbyt dużo. Modele PLLuM do użytku komercyjnego są trenowane na ok. 30 miliardach tokenów (token to kawałek przetwarzanego tekstu - np. słowo lub jego fragment); zaś modele do użytku niekomercyjnego – dla takiego celu zasobów jest znacznie więcej – były trenowane na około 150 miliardach.

Wykorzystanie w administracji państwowej

Modele PLLuM docelowo mają być używane w administracji państwowej, a to oznacza kolejne wyzwania związane z bezpieczeństwem. Twórcy projektu musieli zadbać o to, by model stawiał w swoich odpowiedziach granice i by nie padały tam jakieś nielegalne, nieprawdziwe lub kontrowersyjne treści.

REKLAMA

PLLuM Chat i PLLuM dla programistów

Modele PLLuM udostępnione są bezpłatnie w formie czatu wszystkim zainteresowanym https://pllum.clarin-pl.eu/. Ministerstwo Cyfryzacji opublikowało też dotąd 18 otwartych wersji modelu PLLuM dla programistów https://huggingface.co/CYFRAGOVPL. Do dyspozycji wszystkich zainteresowanych są więc zarówno lekkie, ale mniej dokładne wersje modeli, które można ściągnąć na laptopa, jak i mocniejsze, ale wymagające wielu kart graficznych modele do bardziej zaawansowanych zastosowań - np. badawczych. W przypadku obu typów istnieje możliwość uruchomienia modeli na własnej infrastrukturze, bez konieczności przekazywania zapytań do podmiotów zewnętrznych.

Dalszy ciąg materiału pod wideo

Generatory - wyspecjalizowane modele RAG-owe

W ramach projektu powstały też generatory, czyli wyspecjalizowane modele RAG-owe (ang. Retrieval Augmented Generation). Dzięki takim modelom można np. przeszukiwać i analizować swoje lokalne bazy danych i tworzyć wirtualnych asystentów analizujących zbiory własnych dokumentów. Zespół PLLuM zbudował najmniejszy (8 mld parametrów) ale wiodący w rankingach dla polskiego języka generator tego typu.

PLLuM i HIVE

Dr Łukasik odniósł się też do zmiany nazwy projektu z PLLuM na HIVE. "Nasze modele nazywają się PLLuM, a ich rodzina będzie dalej rozwijana w ramach konsorcjum HIVE. Chcieliśmy w ten sposób nawiązać do idea współpracy wielu badaczy, inżynierów i instytucji, działających niczym pszczoły w jednym ekosystemie, wymieniając się wiedzą i zasobami (np. danymi, kodem, modelami). Natomiast być może kiedyś będziemy chcieli wypuścić jakąś nową rodzinę modeli - z nową nazwą. Rozmawiamy o tym z Ministerstwem Cyfryzacji" - wskazał dr Łukasik.

Ludwika Tomala (PAP)
lt/ zan/ ktl/

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Nowa ustawa o opiece ma mylący tytuł. Nie przewiduje żadnych nowych świadczeń dla opiekunów albo osób niepełnosprawnych, seniorów, osób samotnych [projekt]

Nazwa ustawy o opiece długoterminowej powinna zostać zmieniona, gdyż wprowadza w błąd osoby, które jej nie przeczytały. Obecna nazwa projektu sugeruje, że jest ustawa regulująca kwestie świadczeń dla opiekunów zajmujących się opieką np. osób niepełnosprawnych. Nieprawda. Ta ustawa dotyczy biurokracji związanej z opieką takiej jak plany, raporty, sprawozdania. Jedyne świadczenia jakie przewiduje to np. organizowanie szkoleń przez np. gminy. Tak, szkoleń, a nie np. nowego zasiłku dla opiekunów albo podwyżki słynnego zasiłku pielęgnacyjnego, który od 2019 r. wynosi 215,84 zł miesięcznie. I nic nie wskazuje, że zostanie podniesiony choć o 50 zł przed 2028 r.

Jeszcze przed 2026 r. pracodawca musi udzielić pracownikom 2 dni wolnego. Jeśli nie, grozi mu grzywna do 30 000 zł

Choć niewykorzystany urlop wypoczynkowy nie przepada wraz z końcem roku kalendarzowego, to są i takie przypadki, gdy wolne przysługujące pracownikowi na podstawie obowiązujących przepisów przepada wraz z tą szczególną zmianą kartki w kalendarzu. Tak jest ze zwolnieniem, które przysługuje w związku z wychowywaniem dziecka.

Odpowiedzialność małoletnich za czyny kryminalne - wyjaśnienia Ministerstwa Sprawiedliwości

Ministerstwo Sprawiedliwości w komunikacie z 17 grudnia 2025 r. przedstawiło podstawowe informacje odnośnie odpowiedzialności karnej małoletnich za czyny kryminalne. Powodem przekazania tych informacji do opinii publicznej jest zabójstwo dziewczynki w Jeleniej Górze. Szczególnie silnie porusza opinię publiczną i rodzi pytania kontekst konsekwencji dla sprawcy – w wieku dziecka czy nastolatka. A także o granice ingerencji państwa w życie młodych ludzi.

W okresie świątecznym szef może odmówić pracownikowi udzielenia urlopu na żądanie. Zgodnie z prawem

Żądać można, ale czy się dostanie, nie ma pewności. Przepisy dotyczące urlopu na żądanie są niejasne. A raczej, brzmią dwuznacznie. Choć specjaliści i sądy nie mają wątpliwości, jak je interpretować, to pracownicy czują się wprowadzeni w błąd.

REKLAMA

Rząd chce systemowo uporządkować opiekę długoterminową dla seniorów - bo żyjemy coraz dłużej, ale czy lepiej? Dlatego jest projekt nowej ustawy z 16 grudnia 2025 r.

Rząd przygotował projekt ustawy o opiece długoterminowej. Ma on uporządkować rozproszony system wsparcia osób wymagających stałej pomocy oraz ich opiekunów. Projekt opublikowany przez Rządowe Centrum Legislacji 16 grudnia 2025 r. wprowadza m. in. koordynatora opieki długoterminowej w każdym powiecie i definiuje pojęcie opiekuna nieformalnego. Dokument trafił do konsultacji społecznych.

Kiedy orzeczenie o niepełnosprawności jest na stałe? Przepisy na 2026 rok

Komu przysługuje orzeczenie o niepełnosprawności na stałe? Czy jest lista chorób, które uprawniają do bezterminowego orzeczenia? Te kwestie wciąż budzą wątpliwości, zwłaszcza po ostatnich zmianach przepisów. Jakie zasady będą obowiązywały w 2026 roku?

WIBOR w umowach kredytowych - banki znów stoją nad przepaścią i… robią krok do przodu. Sedno sporu: nie „czy WIBOR istnieje”, tylko czy bank zagrał fair

W polemice opublikowanej na Infor.pl, stanowiącej bezpośrednią odpowiedź na mój artykuł dotyczący wadliwości umów kredytowych opartych o WIBOR, mec. Wojciech Wandzel przekonuje, że kredyty te „nie są wadliwe”, nie będzie „masowego podważania umów”, a wizja „eldorado dla kancelarii” to publicystyczna przesada. To brzmi aż nazbyt znajomo.

Mieszkanie otrzymane w spadku: sprzedać czy wynająć? Co się bardziej opłaca?

Odziedziczenie mieszkania to dla wielu osób nie tylko emocjonalne przeżycie, ale również poważna decyzja finansowa. Czy lepiej sprzedać nieruchomość i zyskać szybki zastrzyk gotówki, czy zdecydować się na wynajem i budować stały dochód? Piotr Zdanowski, ekspert rynku najmu i właściciel ZdanInvest, tłumaczy od czego zależy opłacalność każdej z tych opcji.

REKLAMA

Chwilówki na święta to często odsetkowa pułapka. Na szczęście Sąd Najwyższy uchyla nakaz zapłaty z odsetkami 3285% rocznie. Konsument wpadł w spiralę zadłużenia i przez 20 lat miał płacić lichwę za chwilówkę 500 zł, a odsetki narosły do 328500 zł

Sąd Najwyższy uchylił prawomocny już nakaz zapłaty, na mocy którego konsumentowi naliczano przez 20 lat odsetki w wysokości 9% dziennie (sic!) od pożyczki 500 zł. W skali roku dawało to astronomiczne 3285% oprocentowania czyli 328500 zł samych odsetek! Wyrok otwiera drogę do skuteczniejszej ochrony konsumentów przed nieuczciwymi praktykami firm pożyczkowych i tzw. lichwą. Uważajcie na chwilówki.

W Sejmie m.in. weto tzw. ustawy łańcuchowej i kryptowaluty. Transmisja online

W środę Sejm rozpocznie trzydniowe już ostatnie w tym roku posiedzenie. Posłowie zajmą się projektem ustawy o rynku kryptoaktywów i odrzuceniem prezydenckiego weta do „ustawy łańcuchowej”.

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA