REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

Polska odpowiedź na ChatGPT: PLLuM - modele językowe AI wyspecjalizowane w języku polskim. Już można korzystać

PLLuM Chat - strona główna
PLLuM - modele językowe wyspecjalizowane w języku polskim już udostępnione. Lepsze od ChatGPT?
Źródło zewnętrzne

REKLAMA

REKLAMA

Staraliśmy się, by polskie modele językowe PLLuM były bezpieczne, dostosowane do języka polskiego i "wytrenowane" na legalnie pozyskanych danych — powiedział PAP dr hab. Szymon Łukasik z NASK, ośrodka zaangażowanego w prace nad opublikowanymi w lutym modelami AI.

rozwiń >

PLLuM - rodzina dużych polskich modeli językowych

PLLuM (Polish Large Language Universal Model) to rodzina dużych polskich modeli językowych. Tego typu programy sztucznej inteligencji (AI) umożliwiają generowanie tekstu oraz przetwarzanie języka naturalnego. Dzięki nim komunikacja z maszyną nie wymaga od użytkownika stosowania sztywnych kodów i mechanicznych poleceń, ale przypominać może dialog z człowiekiem.

W odróżnieniu od komercyjnych modeli LLM (takich jak ChatGPT, Claude czy Gemini), modele PLLuM wyspecjalizowane są w języku polskim, choć do ich trenowania używano również tekstów w innych językach słowiańskich, bałtyckich oraz oczywiście w języku angielskim.

"Model jest dostosowany do języka i kultury polskiej. Prace w ramach tego projektu wspierają zaś polskich ekspertów i rozwój kompetencji w dziedzinie sztucznej inteligencji" — wyjaśnił w rozmowie z PAP uczestnik projektu dr hab. Szymon Łukasik, prof. AGH i dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK. Ośrodek ten ma koordynować teraz prace nad dalszymi pracami i wdrożeniem modeli w prace administracji publicznej — w ramach działań konsorcjum HIVE.

Do doszkalania modeli wykorzystano największy w Polsce, bo liczący 40 tys. interakcji, zbiór zapytań, w tym około 3,5 tys. dłuższych dialogów między tutejszymi trenerami a maszyną. Dzięki tej mrówczej pracy tzw. anotatorów AI ma sobie lepiej radzić ze specyfiką polskiego języka i polskiej kultury.

REKLAMA

REKLAMA

Bezpieczeństwo i etyka

Badacz tłumaczy, jak ważne były w ramach prac kwestie bezpieczeństwa i etycznego podejścia do budowy AI. "Filozofią przyświecającą budowie tego modelu było to, żeby kwestie zbierania danych były maksymalnie przejrzyste. Żebyśmy mieli pewność, na jakim polu modele zbudowane z ich użyciem można wykorzystać" — powiedział dr hab. Łukasik. Wskazał, że przedstawiciele projektu zawierali np. umowy z redakcjami i pozyskiwali oficjalne zgody na korzystanie z archiwów polskich tekstów.

PLLuM — jak zapewniają jego twórcy — powstaje zgodnie z krajowymi i unijnymi wytycznymi dotyczącymi sztucznej inteligencji. I uwzględnia aktualne standardy ochrony danych.

30 miliardów tokenów

Ekspert z NASK tłumaczy, że język polski jest językiem o niskich zasobach. A to znaczy, że danych, które można wykorzystać do budowy modeli, nie ma zbyt dużo. Modele PLLuM do użytku komercyjnego są trenowane na ok. 30 miliardach tokenów (token to kawałek przetwarzanego tekstu - np. słowo lub jego fragment); zaś modele do użytku niekomercyjnego – dla takiego celu zasobów jest znacznie więcej – były trenowane na około 150 miliardach.

Wykorzystanie w administracji państwowej

Modele PLLuM docelowo mają być używane w administracji państwowej, a to oznacza kolejne wyzwania związane z bezpieczeństwem. Twórcy projektu musieli zadbać o to, by model stawiał w swoich odpowiedziach granice i by nie padały tam jakieś nielegalne, nieprawdziwe lub kontrowersyjne treści.

REKLAMA

PLLuM Chat i PLLuM dla programistów

Modele PLLuM udostępnione są bezpłatnie w formie czatu wszystkim zainteresowanym https://pllum.clarin-pl.eu/. Ministerstwo Cyfryzacji opublikowało też dotąd 18 otwartych wersji modelu PLLuM dla programistów https://huggingface.co/CYFRAGOVPL. Do dyspozycji wszystkich zainteresowanych są więc zarówno lekkie, ale mniej dokładne wersje modeli, które można ściągnąć na laptopa, jak i mocniejsze, ale wymagające wielu kart graficznych modele do bardziej zaawansowanych zastosowań - np. badawczych. W przypadku obu typów istnieje możliwość uruchomienia modeli na własnej infrastrukturze, bez konieczności przekazywania zapytań do podmiotów zewnętrznych.

Dalszy ciąg materiału pod wideo

Generatory - wyspecjalizowane modele RAG-owe

W ramach projektu powstały też generatory, czyli wyspecjalizowane modele RAG-owe (ang. Retrieval Augmented Generation). Dzięki takim modelom można np. przeszukiwać i analizować swoje lokalne bazy danych i tworzyć wirtualnych asystentów analizujących zbiory własnych dokumentów. Zespół PLLuM zbudował najmniejszy (8 mld parametrów) ale wiodący w rankingach dla polskiego języka generator tego typu.

PLLuM i HIVE

Dr Łukasik odniósł się też do zmiany nazwy projektu z PLLuM na HIVE. "Nasze modele nazywają się PLLuM, a ich rodzina będzie dalej rozwijana w ramach konsorcjum HIVE. Chcieliśmy w ten sposób nawiązać do idea współpracy wielu badaczy, inżynierów i instytucji, działających niczym pszczoły w jednym ekosystemie, wymieniając się wiedzą i zasobami (np. danymi, kodem, modelami). Natomiast być może kiedyś będziemy chcieli wypuścić jakąś nową rodzinę modeli - z nową nazwą. Rozmawiamy o tym z Ministerstwem Cyfryzacji" - wskazał dr Łukasik.

Ludwika Tomala (PAP)
lt/ zan/ ktl/

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
5 ważnych praw osób z niepełnosprawnościami w 2026 roku [LISTA]

Wszystkie prawa osób z niepełnosprawnościami są ważne. My wybraliśmy pięć przykładowych, o których warto pamiętać w 2026 roku. Kto może z nich korzystać? Jakie orzeczenie jest wymagane? Czy trzeba spełnić dodatkowe warunki? Odpowiadamy!

Były mąż sprzedał auto – samotna matka płaci 16 tys. zł kary za brak OC!

Stan faktyczny jest taki: samotna matka po rozwodzie, bez pracy, opiekująca się dzieckiem, dostaje rachunek na ponad 16 tys. zł za brak OC w samochodzie, którego nie posiada od lat. Okazuje się, że to były mąż sprzedał pojazd potajemnie, nie zgłosił tego nigdzie, a Ubezpieczeniowy Fundusz Gwarancyjny (UFG) ściga właśnie ją. Rzecznik Praw Obywatelskich prowadzi interwencję w tej bulwersującej sprawie.

Stażowe 2026: nowe przepisy i zaświadczenia [komunikat ZUS]. Do stażu pracy można doliczyć inne okresy niż zatrudnienie na umowę o pracę

Zakład Ubezpieczeń Społecznych informuje, że od 1 stycznia 2026 r. osoby zatrudnione będą mogły doliczyć do stażu pracy okresy inne niż zatrudnienie na podstawie umowy o pracę. Nowe przepisy będą miały zastosowanie: od 1 stycznia 2026 r. do pracodawców będących jednostkami sektora finansów publicznych, natomiast od 1 maja 2026 r. – do pozostałych pracodawców.

Córka odrzuciła spadek, a i tak „dostała” długi. Co poszło nie tak? Głośna sprawa [SPADKI I DŁUGI: PORADNIK 2026]

W polskim prawie spadkowym wciąż zdarzają się sytuacje budzące gorące dyskusje. Jedna z nich dotyczy tego, że sąd stwierdził nabycie spadku przez córkę, chociaż ta wcześniej spadek odrzuciła. Efekt? Wierzyciele zaczęli dochodzić należności z długów matki. Sprawa trafiła do Rzecznika Praw Obywatelskich, który złożył skargę nadzwyczajną wskazując rażące naruszenia prawa. Wyjaśniamy przepisy, orzecznictwo, pułapki terminów i podpowiadamy, jak nie odziedziczyć długu w 2026 r.— także gdy w grę wchodzi małoletnie dziecko.

REKLAMA

Koniec z awizo od listonosza? Wielka zmiana w kontakcie z urzędami właśnie weszła w życie

Papierowe listy z urzędów właśnie stały się przeszłością. Od Nowego Roku e-Doręczenia są już podstawowym kanałem kontaktu administracji z obywatelami. Większość mediów dopiero teraz o tym informuje. Co to oznacza dla milionów Polaków? Czy musisz coś zrobić? A co z seniorami bez Internetu? Sprawdź, zanim przegapisz ważne pismo z urzędu.

Komornik nie ściągnie już długów z emerytury czy renty – „obecne przepisy są formą dyskryminacji osób starszych, schorowanych, czyli jednej z najsłabszych grup społecznych”? Sprawą zajmuje się MRPiPS

W związku z dużą dysproporcją w zakresie wysokości kwoty wolnej od potrąceń pomiędzy świadczeniami emerytalno-rentowymi, a wynagrodzeniem za pracę – do Sejmu trafił postulat zmiany przepisów w taki sposób, aby dla każdego obywatela, kwota wolna od zajęcia komorniczego wynosiła tyle samo. Sejmowe BEOS uznało, że konsekwencją wprowadzenia powyższej zmiany byłoby to, że – „przeważająca większość emerytów i rencistów ze względu na wysokość pobieranych przez nich świadczeń nie podlegałaby egzekucji należności, do których uiszczenia są zobowiązani”, jednak pomimo tego – posłowie zdecydowali się skierować sprawę do MRPiPS.

Zmiany od 1 stycznia 2026 r.: wolne piątki i dodatkowe 13 dni urlopu. Pracodawcy mogą wybrać dogodne rozwiązanie. Kto się załapie?

Skrócony czas pracy staje się rzeczywistością dla tysięcy pracowników. Od 1 stycznia 2026 roku rusza testowanie pilotażowego programu MRPiPS. To oznacza wolne piątki, krótszy czas pracy lub dodatkowy urlop – pracodawcy będą mieli kilka modeli do wyboru. Jeśli program się sprawdzi, może zostać zastosowany ogólnokrajowo.

Czy dyżur w noc sylwestrową się opłacał? Przepisy są w tym zakresie jasne, choć niekoniecznie łaskawe

Dyżur to specyficzny czas, w którym pracownik pozostaje w gotowości do pracy, ale niekoniecznie ją świadczy. Czy w związku z tym należy go za ten okres wynagrodzić? A może przysługują mu inne, szczególne uprawnienia?

REKLAMA

Zmiany w stażu pracy od 2026 r. ZUS wyda zaświadczenia do „stażowego” ale trzeba złożyć wniosek USP albo US-7 (za okresy sprzed 1999 roku)

Od 2026 roku do stażu pracy będzie można doliczyć także inne aktywności zawodowe niż praca na etacie, a ich potwierdzaniem zajmie się ZUS. Nowe zasady od 1 stycznia obejmą sektor finansów publicznych, a od 1 maja – pozostałych pracodawców (prywatnych).

Czy kąpiel i czas na przebranie się należy wliczyć do czasu pracy? SN nie miał wątpliwości i odmówił rozpoznania skargi w tej sprawie

Czy czas niezbędny na zdanie narzędzi, wzięcie kąpieli i przebranie się należy zaliczać do czasu pracy pracownika? Skarga kasacyjna w sprawie, która dotyczyła tej tematyki trafiła do Sądu Najwyższego. Ten jednak odmówił przyjęcia jej do rozpoznania. Dlaczego?

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA