REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

Polska odpowiedź na ChatGPT: PLLuM - modele językowe AI wyspecjalizowane w języku polskim. Już można korzystać

Subskrybuj nas na Youtube
Dołącz do ekspertów Dołącz do grona ekspertów
PLLuM Chat - strona główna
PLLuM - modele językowe wyspecjalizowane w języku polskim już udostępnione. Lepsze od ChatGPT?
Źródło zewnętrzne

REKLAMA

REKLAMA

Staraliśmy się, by polskie modele językowe PLLuM były bezpieczne, dostosowane do języka polskiego i "wytrenowane" na legalnie pozyskanych danych — powiedział PAP dr hab. Szymon Łukasik z NASK, ośrodka zaangażowanego w prace nad opublikowanymi w lutym modelami AI.

rozwiń >

PLLuM - rodzina dużych polskich modeli językowych

PLLuM (Polish Large Language Universal Model) to rodzina dużych polskich modeli językowych. Tego typu programy sztucznej inteligencji (AI) umożliwiają generowanie tekstu oraz przetwarzanie języka naturalnego. Dzięki nim komunikacja z maszyną nie wymaga od użytkownika stosowania sztywnych kodów i mechanicznych poleceń, ale przypominać może dialog z człowiekiem.

W odróżnieniu od komercyjnych modeli LLM (takich jak ChatGPT, Claude czy Gemini), modele PLLuM wyspecjalizowane są w języku polskim, choć do ich trenowania używano również tekstów w innych językach słowiańskich, bałtyckich oraz oczywiście w języku angielskim.

"Model jest dostosowany do języka i kultury polskiej. Prace w ramach tego projektu wspierają zaś polskich ekspertów i rozwój kompetencji w dziedzinie sztucznej inteligencji" — wyjaśnił w rozmowie z PAP uczestnik projektu dr hab. Szymon Łukasik, prof. AGH i dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK. Ośrodek ten ma koordynować teraz prace nad dalszymi pracami i wdrożeniem modeli w prace administracji publicznej — w ramach działań konsorcjum HIVE.

Do doszkalania modeli wykorzystano największy w Polsce, bo liczący 40 tys. interakcji, zbiór zapytań, w tym około 3,5 tys. dłuższych dialogów między tutejszymi trenerami a maszyną. Dzięki tej mrówczej pracy tzw. anotatorów AI ma sobie lepiej radzić ze specyfiką polskiego języka i polskiej kultury.

REKLAMA

Bezpieczeństwo i etyka

Badacz tłumaczy, jak ważne były w ramach prac kwestie bezpieczeństwa i etycznego podejścia do budowy AI. "Filozofią przyświecającą budowie tego modelu było to, żeby kwestie zbierania danych były maksymalnie przejrzyste. Żebyśmy mieli pewność, na jakim polu modele zbudowane z ich użyciem można wykorzystać" — powiedział dr hab. Łukasik. Wskazał, że przedstawiciele projektu zawierali np. umowy z redakcjami i pozyskiwali oficjalne zgody na korzystanie z archiwów polskich tekstów.

PLLuM — jak zapewniają jego twórcy — powstaje zgodnie z krajowymi i unijnymi wytycznymi dotyczącymi sztucznej inteligencji. I uwzględnia aktualne standardy ochrony danych.

30 miliardów tokenów

Ekspert z NASK tłumaczy, że język polski jest językiem o niskich zasobach. A to znaczy, że danych, które można wykorzystać do budowy modeli, nie ma zbyt dużo. Modele PLLuM do użytku komercyjnego są trenowane na ok. 30 miliardach tokenów (token to kawałek przetwarzanego tekstu - np. słowo lub jego fragment); zaś modele do użytku niekomercyjnego – dla takiego celu zasobów jest znacznie więcej – były trenowane na około 150 miliardach.

Wykorzystanie w administracji państwowej

Modele PLLuM docelowo mają być używane w administracji państwowej, a to oznacza kolejne wyzwania związane z bezpieczeństwem. Twórcy projektu musieli zadbać o to, by model stawiał w swoich odpowiedziach granice i by nie padały tam jakieś nielegalne, nieprawdziwe lub kontrowersyjne treści.

PLLuM Chat i PLLuM dla programistów

Modele PLLuM udostępnione są bezpłatnie w formie czatu wszystkim zainteresowanym https://pllum.clarin-pl.eu/. Ministerstwo Cyfryzacji opublikowało też dotąd 18 otwartych wersji modelu PLLuM dla programistów https://huggingface.co/CYFRAGOVPL. Do dyspozycji wszystkich zainteresowanych są więc zarówno lekkie, ale mniej dokładne wersje modeli, które można ściągnąć na laptopa, jak i mocniejsze, ale wymagające wielu kart graficznych modele do bardziej zaawansowanych zastosowań - np. badawczych. W przypadku obu typów istnieje możliwość uruchomienia modeli na własnej infrastrukturze, bez konieczności przekazywania zapytań do podmiotów zewnętrznych.

Dalszy ciąg materiału pod wideo

Generatory - wyspecjalizowane modele RAG-owe

W ramach projektu powstały też generatory, czyli wyspecjalizowane modele RAG-owe (ang. Retrieval Augmented Generation). Dzięki takim modelom można np. przeszukiwać i analizować swoje lokalne bazy danych i tworzyć wirtualnych asystentów analizujących zbiory własnych dokumentów. Zespół PLLuM zbudował najmniejszy (8 mld parametrów) ale wiodący w rankingach dla polskiego języka generator tego typu.

PLLuM i HIVE

Dr Łukasik odniósł się też do zmiany nazwy projektu z PLLuM na HIVE. "Nasze modele nazywają się PLLuM, a ich rodzina będzie dalej rozwijana w ramach konsorcjum HIVE. Chcieliśmy w ten sposób nawiązać do idea współpracy wielu badaczy, inżynierów i instytucji, działających niczym pszczoły w jednym ekosystemie, wymieniając się wiedzą i zasobami (np. danymi, kodem, modelami). Natomiast być może kiedyś będziemy chcieli wypuścić jakąś nową rodzinę modeli - z nową nazwą. Rozmawiamy o tym z Ministerstwem Cyfryzacji" - wskazał dr Łukasik.

Ludwika Tomala (PAP)
lt/ zan/ ktl/

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
W Sejmie petycja o zmiany zasad waloryzacji subkonta ZUS. I to od 2014 r.

Przez lata konto główne w ZUS miało wyższą waloryzacją (np. 14,41% w 2025 r.) niż subkonto ZUS (np. 9,49% w 2025 r.). Sejm zajmie się propozycją zrównania tych wartości i to wstecznie (aż od 2014 r.). To są spore pieniądze. Propozycja obywatela jest uczciwa, ale należy ocenić szanse jej przeprowadzenia przez parlament na 0%. Ta petycja obywatela będzie procedowana przez odpowiednią komisję, ale konkluzja będzie najpewniej taka „Nie ma na to pieniędzy w budżecie”.

Krótszy czas pracy w Polsce: Ministerstwo podało pierwsze dane z pilotażu

W trakcie pierwszego tygodnia od rozpoczęcia pilotażu skrócenia czasu pracy do Ministerstwa Rodziny, Pracy i Polityki Społecznej wpłynęło 150 kompletnych wniosków od pracodawców, którzy chcieliby wziąć udział w programie. Kolejne są w trakcie przygotowywania.

Duże zmiany w Karcie Nauczyciela od września 2025 r. M.in. godziny ponadwymiarowe, nagrody, odprawy ochrona przedemerytalna. Prezydent podpisał nowelizację

W dniu 21 sierpnia 2025 r. Prezydent RP podpisał ustawę z 25 lipca 2025 r. o zmianie ustawy – Karta nauczyciela oraz niektórych innych ustaw. Nowe przepisy mają w większości wejść w życie 1 września 2025 r. Nowelizacja ta zmienia także kilka innych ustaw - np. ustawę o nauczycielskich świadczeniach kompensacyjnych i Prawo oświatowe.

Sprzedaż spadku z problemami. Notariusze ostrzegają przed pułapkami w nowych przepisach. Czy będą odmawiać sporządzania aktów notarialnych?

Kolejna nowelizacja ustawy o podatku od spadków i darowizn, choć w założeniu ma ograniczyć biurokrację, w praktyce może prowadzić do licznych problemów interpretacyjnych – ostrzegają notariusze z Izby Notarialnej w Poznaniu. Chodzi o ustawę z 25 lipca 2025 r. o zmianie ustawy o podatku od spadków i darowizn, która weszła w życie 20 sierpnia 2025 r.

REKLAMA

Poczta Polska wstrzymuje przyjmowanie paczek do USA od 25 sierpnia 2025 r. Powodem są nowe amerykańskie cła

Ze względu na wejście w życie 29 sierpnia amerykańskich ceł, Poczta Polska od poniedziałku czasowo wstrzymuje przyjmowanie przesyłek do USA zawierających towary - poinformował 22 sierpnia operator. Możliwe będzie wysyłanie m.in. korespondencji i dokumentów.

Zdolność kredytowa 2025: para (dwie średnie krajowe) z dzieckiem dostanie z banku prawie 900 tys. złotych

W ciągu ostatnich 12 miesięcy zdolność kredytowa trzyosobowej rodziny dysponującej dwiema średnimi krajowymi wzrosła o ponad 23%. Dziś takiej familii przeciętny bank skłonny jest pożyczyć na zakup mieszkania prawie 900 tysięcy złotych. To najwyższy wynik w historii. Łatwiejszemu dostępowi do kredytów sprzyjają rosnące wynagrodzenia i spadające oprocentowanie kredytów.

Sankcja kredytu darmowego - łatwy zysk kredytobiorcy kosztem banku? Adwokat wyjaśnia co naprawdę oznaczają wyroki TSUE i statystyki sądowe?

Sankcja kredytu darmowego występuje w debacie publicznej jako obietnica łatwego zysku kosztem banku. Obietnice te składają przede wszystkim parakancelarie (a więc podmioty, które nie są kancelariami adwokackimi lub radcowski) i firmy odszkodowawcze. W mediach znajdziemy wiele nagłówków sugerujących, że banki nagminnie łamały prawo, a teraz muszą oddać miliony złotych. Rzeczywistość jest jednak znacznie bardziej złożona – a dla wielu konsumentów (prawie 90 proc.) droga sądowa wcale nie kończy się happy endem.

Wypadek w pracy: ZUS wyjaśnia jakie świadczenia należą się pracownikowi. Jakie odszkodowanie za 1% uszczerbku na zdrowiu?

Wypadek w czasie wykonywania pracy może zdarzyć się każdemu pracownikowi, niezależnie od rodzaju wykonywanego zawodu czy zajmowanego stanowiska. Krystyna Michałek, regionalna rzeczniczka prasowa ZUS w województwie kujawsko-pomorskim wyjaśnia jakie świadczenia należą się aktualnie pracownikom z tytułu takiego wypadku.

REKLAMA

Pies w galerii handlowej? Polacy są podzieleni, ale trend rośnie – zakupy z czworonogiem stają się codziennością

Jeszcze kilka lat temu pies w centrum handlowym budził zdziwienie, a nawet oburzenie. Dziś? Coraz częściej towarzyszy nam w butikach, kawiarniach czy na food courtach. Najnowsze ogólnopolskie badanie Posnanii, jednego z największych centrów handlowych w Polsce, przeprowadzone z firmą Inquiry pokazuje, że zakupy z pupilem to już codzienność – 60% Polaków jest na „tak”, a ponad połowie opiekunów czworonogów zdarza się zabierać je do galerii handlowych. Ale uwaga – nie wszyscy klienci witają psy z otwartymi ramionami.

Za wypalanie traw, rozniecanie ognia czy rozpalenie grilla w niedozwolonym miejscu, palenie tytoniu poza miejscami wyznaczonymi, nieostrożne obchodzenie się z ogniem: do 30 tys. zł grzywny i do 5 tys. zł mandatu

Za wypalanie traw, rozniecanie ognia, palenie tytoniu poza miejscami wyznaczonymi, nieostrożne obchodzenie się z ogniem: do 30 tys. zł grzywny i do 5 tys. zł mandatu. Dlaczego? Bo nowelizacja przepisów to odpowiedź na rosnące zagrożenie pożarowe w Polsce. Wprowadzając surowe kary finansowe, rząd ma nadzieję skuteczniej walczyć z niebezpiecznymi zachowaniami i zapobiegać tragediom.

REKLAMA