REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

Polska odpowiedź na ChatGPT: PLLuM - modele językowe AI wyspecjalizowane w języku polskim. Już można korzystać

Subskrybuj nas na Youtube
Dołącz do ekspertów Dołącz do grona ekspertów
PLLuM Chat - strona główna
PLLuM - modele językowe wyspecjalizowane w języku polskim już udostępnione. Lepsze od ChatGPT?
Źródło zewnętrzne

REKLAMA

REKLAMA

Staraliśmy się, by polskie modele językowe PLLuM były bezpieczne, dostosowane do języka polskiego i "wytrenowane" na legalnie pozyskanych danych — powiedział PAP dr hab. Szymon Łukasik z NASK, ośrodka zaangażowanego w prace nad opublikowanymi w lutym modelami AI.

rozwiń >

PLLuM - rodzina dużych polskich modeli językowych

PLLuM (Polish Large Language Universal Model) to rodzina dużych polskich modeli językowych. Tego typu programy sztucznej inteligencji (AI) umożliwiają generowanie tekstu oraz przetwarzanie języka naturalnego. Dzięki nim komunikacja z maszyną nie wymaga od użytkownika stosowania sztywnych kodów i mechanicznych poleceń, ale przypominać może dialog z człowiekiem.

W odróżnieniu od komercyjnych modeli LLM (takich jak ChatGPT, Claude czy Gemini), modele PLLuM wyspecjalizowane są w języku polskim, choć do ich trenowania używano również tekstów w innych językach słowiańskich, bałtyckich oraz oczywiście w języku angielskim.

"Model jest dostosowany do języka i kultury polskiej. Prace w ramach tego projektu wspierają zaś polskich ekspertów i rozwój kompetencji w dziedzinie sztucznej inteligencji" — wyjaśnił w rozmowie z PAP uczestnik projektu dr hab. Szymon Łukasik, prof. AGH i dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK. Ośrodek ten ma koordynować teraz prace nad dalszymi pracami i wdrożeniem modeli w prace administracji publicznej — w ramach działań konsorcjum HIVE.

Do doszkalania modeli wykorzystano największy w Polsce, bo liczący 40 tys. interakcji, zbiór zapytań, w tym około 3,5 tys. dłuższych dialogów między tutejszymi trenerami a maszyną. Dzięki tej mrówczej pracy tzw. anotatorów AI ma sobie lepiej radzić ze specyfiką polskiego języka i polskiej kultury.

REKLAMA

REKLAMA

Bezpieczeństwo i etyka

Badacz tłumaczy, jak ważne były w ramach prac kwestie bezpieczeństwa i etycznego podejścia do budowy AI. "Filozofią przyświecającą budowie tego modelu było to, żeby kwestie zbierania danych były maksymalnie przejrzyste. Żebyśmy mieli pewność, na jakim polu modele zbudowane z ich użyciem można wykorzystać" — powiedział dr hab. Łukasik. Wskazał, że przedstawiciele projektu zawierali np. umowy z redakcjami i pozyskiwali oficjalne zgody na korzystanie z archiwów polskich tekstów.

PLLuM — jak zapewniają jego twórcy — powstaje zgodnie z krajowymi i unijnymi wytycznymi dotyczącymi sztucznej inteligencji. I uwzględnia aktualne standardy ochrony danych.

30 miliardów tokenów

Ekspert z NASK tłumaczy, że język polski jest językiem o niskich zasobach. A to znaczy, że danych, które można wykorzystać do budowy modeli, nie ma zbyt dużo. Modele PLLuM do użytku komercyjnego są trenowane na ok. 30 miliardach tokenów (token to kawałek przetwarzanego tekstu - np. słowo lub jego fragment); zaś modele do użytku niekomercyjnego – dla takiego celu zasobów jest znacznie więcej – były trenowane na około 150 miliardach.

Wykorzystanie w administracji państwowej

Modele PLLuM docelowo mają być używane w administracji państwowej, a to oznacza kolejne wyzwania związane z bezpieczeństwem. Twórcy projektu musieli zadbać o to, by model stawiał w swoich odpowiedziach granice i by nie padały tam jakieś nielegalne, nieprawdziwe lub kontrowersyjne treści.

REKLAMA

PLLuM Chat i PLLuM dla programistów

Modele PLLuM udostępnione są bezpłatnie w formie czatu wszystkim zainteresowanym https://pllum.clarin-pl.eu/. Ministerstwo Cyfryzacji opublikowało też dotąd 18 otwartych wersji modelu PLLuM dla programistów https://huggingface.co/CYFRAGOVPL. Do dyspozycji wszystkich zainteresowanych są więc zarówno lekkie, ale mniej dokładne wersje modeli, które można ściągnąć na laptopa, jak i mocniejsze, ale wymagające wielu kart graficznych modele do bardziej zaawansowanych zastosowań - np. badawczych. W przypadku obu typów istnieje możliwość uruchomienia modeli na własnej infrastrukturze, bez konieczności przekazywania zapytań do podmiotów zewnętrznych.

Dalszy ciąg materiału pod wideo

Generatory - wyspecjalizowane modele RAG-owe

W ramach projektu powstały też generatory, czyli wyspecjalizowane modele RAG-owe (ang. Retrieval Augmented Generation). Dzięki takim modelom można np. przeszukiwać i analizować swoje lokalne bazy danych i tworzyć wirtualnych asystentów analizujących zbiory własnych dokumentów. Zespół PLLuM zbudował najmniejszy (8 mld parametrów) ale wiodący w rankingach dla polskiego języka generator tego typu.

PLLuM i HIVE

Dr Łukasik odniósł się też do zmiany nazwy projektu z PLLuM na HIVE. "Nasze modele nazywają się PLLuM, a ich rodzina będzie dalej rozwijana w ramach konsorcjum HIVE. Chcieliśmy w ten sposób nawiązać do idea współpracy wielu badaczy, inżynierów i instytucji, działających niczym pszczoły w jednym ekosystemie, wymieniając się wiedzą i zasobami (np. danymi, kodem, modelami). Natomiast być może kiedyś będziemy chcieli wypuścić jakąś nową rodzinę modeli - z nową nazwą. Rozmawiamy o tym z Ministerstwem Cyfryzacji" - wskazał dr Łukasik.

Ludwika Tomala (PAP)
lt/ zan/ ktl/

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
Kolejne pytanie do TSUE o kredyty z WIBOR-em. Czy polskie prawo wystarczająco chroni kredytobiorców?

Sąd Okręgowy w Krakowie w osobie sędzi Anny Baran postanowił skierować do Trybunału Sprawiedliwości Unii Europejskiej (TSUE), pytanie czy polskie regulacje dotyczące zasad oprocentowania kredytów hipotecznych są zgodne z unijnym prawem chroniącym konsumentów. Analizy pytania prejudycjalnego i jego uzasadnienia, dokonuje radca prawny Paweł Stalski, specjalizujący się w prawie ochronnych konsumentów i w sporach sądowych z bankami.

Kto może dostać orzeczenie o niepełnosprawności na stałe? Przepisy w 2025 r.

W czerwcu 2025 r. weszły w życie nowe przepisy, które określają minimalne okresy, na jakie – w określonych przypadkach – można otrzymać orzeczenie o niepełnosprawności lub jej stopniu. Czy zmianom uległy również zasady dotyczące wydawania orzeczeń na stałe? Jakie są aktualnie zasady? Rozwiewamy wątpliwości.

Jeśli stać cię na zakup zwierzaka, to musi być cię stać na podatek. Urzędy są zgodne i każą płacić miłośnikom zwierząt. Trzeba też dopełnić formalności

Czy cena psa, kota, czy żółwia to jedyny koszt, jaki ponosimy zapraszając go pod swój dach? Wiele osób tak myśli i nie bierze pod uwagę tego, że zakup zwierzaka może wiązać się z koniecznością zapłaty podatku.

Dajesz pieniądze dzieciom? Musisz zachować te warunki, aby fiskus się nie przyczepił - karna stawka to nawet 20% darowizny

Któż z nas nie otrzymał lub nie przekazał komuś w rodzinie choćby drobnych sum pieniędzy, na przykład w związku z okazją taką jak rocznica urodzin, czy imieniny? Nie można jednak tego czynić dowolnie, aby nie znaleźć się w polu zainteresowania fiskusa. Nieprawidłowo dokonana darowizna może bowiem oznaczać konieczność zapłacenia karnej stawki podatku, która wynosi 20%, a także odpowiedzialność karno-skarbową! A wystarczy dokonać stosunkowo prostych formalności, by tego uniknąć.

REKLAMA

Sektor przemysłowy w Polsce w 2025 roku: między presją kosztową a inwestycjami w przyszłość [Raport wynagrodzeń w sektorze przemysłowym]

Sektor przemysłowy w Polsce w 2025 roku mierzy się z ograniczonym popytem, spadkiem zamówień, zwłaszcza eksportowych oraz rosnącymi kosztami działalności. Z „Raportu wynagrodzeń w sektorze przemysłowym” Grafton Recruitment wynika, że w przetwórstwie przemysłowym odnotowano spadki zatrudnienia, a przedsiębiorstwa koncentrują się na utrzymaniu ciągłości operacyjnej i dostosowaniu do trudnych warunków gospodarczych.

Rząd: Po śmierci bliscy nie odziedziczą Twoich składek. Dostaną je inni emeryci

Emerytka skierowała zapytanie, czy jest możliwe przedłużenie możliwości dziedziczenia środków z subkonta (ZUS). Opisała, że dziś środki zgromadzone w ZUS prócz środków znajdujących się na subkoncie, po osiągnięciu 60 roku życia przez kobiety, przy wyliczaniu ich emerytur są dzielone przez dalsze średnie trwanie życia. Inaczej jest z subkontem – te środki czekają do osiągnięcia 65 r. życia.

Zapadły przełomowe wyroki NSA i WSA: Opłaty pobierane przez cmentarze nielegalne – teraz tysiące Polaków może dochodzić od zarządców cmentarzy niesłusznie pobranych kwot

Organy samorządowe nie mogą ustanawiać (a cmentarze – na tej postawie) pobierać jakichkolwiek opłat, które są niezwiązane z pochówkiem zmarłych, tj. m.in. opłat za dochowanie zmarłego do już opłaconego grobu, wjazd na cmentarz i korzystanie z cmentarza – orzekł WSA w Olsztynie. WSA w Warszawie dodał do tego natomiast – ustalane przez samorządy cen grobów i płyt, opłaty za ekshumację zwłok, uprzątnięcie szczątków, przechowywanie zwłok w chłodni, udostępnienie sali do ubierania zwłok i wiele innych. NSA potwierdza w swoich wyrokach, że – organ gminy może ustalić (a cmentarz – na tej postawie) pobierać tylko takie opłaty, które są związane z pochowaniem zwłok.

Sejm na żywo: 42. posiedzenie Sejmu (7, 8, 9 października 2025) [Transmisja online]

We wtorek, 7 października rozpocznie się trzydniowe posiedzenie Sejmu. Głównym punktem 42. posiedzenia Sejmu, będzie pierwsze czytanie rządowego projektu ustawy budżetowej na rok 2026 (druk nr 1749) oraz projektu ustawy o szczególnych rozwiązaniach służących realizacji ustawy budżetowej na rok 2026 (druk nr 1750). Prace nad tymi punktami przewidziane są na czwartek, 9 października.

REKLAMA

Długi weekend w listopadzie. Rząd podjął decyzję

Listopad 2025 roku przyniesie wyjątkowo korzystny układ dni wolnych. Rząd zdecydował, że 10 listopada część Polaków dostanie dodatkowy dzień wolny, co pozwoli cieszyć się aż czterodniowym weekendem. Sprawdź, kogo obejmuje decyzja i jakie prawa gwarantuje Kodeks pracy.

Podwyżki dla samorządowców już obowiązują! Od dziś wójtowie i urzędnicy z nowymi limitami. Co dokładnie się zmienia?

Dziś wchodzą w życie przepisy, które podnoszą maksymalne wynagrodzenia dla kluczowych stanowisk w samorządach. Sprawdzamy, ile wyniesie podwyżka i czy dotknie ona każdego urzędnika gminnego, a także co zmieni się w katalogu stanowisk samorządowych.

REKLAMA