REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

Polska odpowiedź na ChatGPT: PLLuM - modele językowe AI wyspecjalizowane w języku polskim. Już można korzystać

PLLuM Chat - strona główna
PLLuM - modele językowe wyspecjalizowane w języku polskim już udostępnione. Lepsze od ChatGPT?
Źródło zewnętrzne

REKLAMA

REKLAMA

Staraliśmy się, by polskie modele językowe PLLuM były bezpieczne, dostosowane do języka polskiego i "wytrenowane" na legalnie pozyskanych danych — powiedział PAP dr hab. Szymon Łukasik z NASK, ośrodka zaangażowanego w prace nad opublikowanymi w lutym modelami AI.

rozwiń >

PLLuM - rodzina dużych polskich modeli językowych

PLLuM (Polish Large Language Universal Model) to rodzina dużych polskich modeli językowych. Tego typu programy sztucznej inteligencji (AI) umożliwiają generowanie tekstu oraz przetwarzanie języka naturalnego. Dzięki nim komunikacja z maszyną nie wymaga od użytkownika stosowania sztywnych kodów i mechanicznych poleceń, ale przypominać może dialog z człowiekiem.

W odróżnieniu od komercyjnych modeli LLM (takich jak ChatGPT, Claude czy Gemini), modele PLLuM wyspecjalizowane są w języku polskim, choć do ich trenowania używano również tekstów w innych językach słowiańskich, bałtyckich oraz oczywiście w języku angielskim.

"Model jest dostosowany do języka i kultury polskiej. Prace w ramach tego projektu wspierają zaś polskich ekspertów i rozwój kompetencji w dziedzinie sztucznej inteligencji" — wyjaśnił w rozmowie z PAP uczestnik projektu dr hab. Szymon Łukasik, prof. AGH i dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK. Ośrodek ten ma koordynować teraz prace nad dalszymi pracami i wdrożeniem modeli w prace administracji publicznej — w ramach działań konsorcjum HIVE.

Do doszkalania modeli wykorzystano największy w Polsce, bo liczący 40 tys. interakcji, zbiór zapytań, w tym około 3,5 tys. dłuższych dialogów między tutejszymi trenerami a maszyną. Dzięki tej mrówczej pracy tzw. anotatorów AI ma sobie lepiej radzić ze specyfiką polskiego języka i polskiej kultury.

REKLAMA

REKLAMA

Bezpieczeństwo i etyka

Badacz tłumaczy, jak ważne były w ramach prac kwestie bezpieczeństwa i etycznego podejścia do budowy AI. "Filozofią przyświecającą budowie tego modelu było to, żeby kwestie zbierania danych były maksymalnie przejrzyste. Żebyśmy mieli pewność, na jakim polu modele zbudowane z ich użyciem można wykorzystać" — powiedział dr hab. Łukasik. Wskazał, że przedstawiciele projektu zawierali np. umowy z redakcjami i pozyskiwali oficjalne zgody na korzystanie z archiwów polskich tekstów.

PLLuM — jak zapewniają jego twórcy — powstaje zgodnie z krajowymi i unijnymi wytycznymi dotyczącymi sztucznej inteligencji. I uwzględnia aktualne standardy ochrony danych.

30 miliardów tokenów

Ekspert z NASK tłumaczy, że język polski jest językiem o niskich zasobach. A to znaczy, że danych, które można wykorzystać do budowy modeli, nie ma zbyt dużo. Modele PLLuM do użytku komercyjnego są trenowane na ok. 30 miliardach tokenów (token to kawałek przetwarzanego tekstu - np. słowo lub jego fragment); zaś modele do użytku niekomercyjnego – dla takiego celu zasobów jest znacznie więcej – były trenowane na około 150 miliardach.

Wykorzystanie w administracji państwowej

Modele PLLuM docelowo mają być używane w administracji państwowej, a to oznacza kolejne wyzwania związane z bezpieczeństwem. Twórcy projektu musieli zadbać o to, by model stawiał w swoich odpowiedziach granice i by nie padały tam jakieś nielegalne, nieprawdziwe lub kontrowersyjne treści.

REKLAMA

PLLuM Chat i PLLuM dla programistów

Modele PLLuM udostępnione są bezpłatnie w formie czatu wszystkim zainteresowanym https://pllum.clarin-pl.eu/. Ministerstwo Cyfryzacji opublikowało też dotąd 18 otwartych wersji modelu PLLuM dla programistów https://huggingface.co/CYFRAGOVPL. Do dyspozycji wszystkich zainteresowanych są więc zarówno lekkie, ale mniej dokładne wersje modeli, które można ściągnąć na laptopa, jak i mocniejsze, ale wymagające wielu kart graficznych modele do bardziej zaawansowanych zastosowań - np. badawczych. W przypadku obu typów istnieje możliwość uruchomienia modeli na własnej infrastrukturze, bez konieczności przekazywania zapytań do podmiotów zewnętrznych.

Dalszy ciąg materiału pod wideo

Generatory - wyspecjalizowane modele RAG-owe

W ramach projektu powstały też generatory, czyli wyspecjalizowane modele RAG-owe (ang. Retrieval Augmented Generation). Dzięki takim modelom można np. przeszukiwać i analizować swoje lokalne bazy danych i tworzyć wirtualnych asystentów analizujących zbiory własnych dokumentów. Zespół PLLuM zbudował najmniejszy (8 mld parametrów) ale wiodący w rankingach dla polskiego języka generator tego typu.

PLLuM i HIVE

Dr Łukasik odniósł się też do zmiany nazwy projektu z PLLuM na HIVE. "Nasze modele nazywają się PLLuM, a ich rodzina będzie dalej rozwijana w ramach konsorcjum HIVE. Chcieliśmy w ten sposób nawiązać do idea współpracy wielu badaczy, inżynierów i instytucji, działających niczym pszczoły w jednym ekosystemie, wymieniając się wiedzą i zasobami (np. danymi, kodem, modelami). Natomiast być może kiedyś będziemy chcieli wypuścić jakąś nową rodzinę modeli - z nową nazwą. Rozmawiamy o tym z Ministerstwem Cyfryzacji" - wskazał dr Łukasik.

Ludwika Tomala (PAP)
lt/ zan/ ktl/

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Dziedziczenie pieniędzy z subkonta w ZUS i konta w OFE. Kto z rodziny je otrzyma po śmierci ubezpieczonego? Co to jest wypłata gwarantowana?

Środki (pieniądze) zapisane na subkoncie w Zakładzie Ubezpieczeń Społecznych mogą być podzielone i wypłacone po śmierci osoby ubezpieczonej. Podobnie, jak to dzieje się ze środkami zgromadzonymi w otwartym funduszu emerytalnym (OFE). Kto otrzyma te pieniądze po śmierci osoby ubezpieczonej?

Wyrzucasz butelki z kaucją do śmieci? Oto czym to grozi w 2026 r. i ile na tym tracisz

Nowy system kaucyjny budzi wiele emocji i wątpliwości. Co jednak, jeśli ktoś nie ma ochoty lub możliwości oddawać opakowań? Czy w 2026 r. nadal będzie wolno wrzucać butelki do zielonego pojemnika, a puszki i plastik do żółtego? Mimo intensywnej kampanii informacyjnej odpowiedź wciąż zaskakuje. Tymczasem produkty oznaczone kaucją już pojawiają się na sklepowych półkach.

Prawo Bez Tajemnic [Prawo Administracyjne]

Mecenas Artur Jaroszek z Kancelarii Salvar odpowiada na pytania i prezentuje ważny wyrok Trybunału Konstytucyjnego.

Ranking najlepiej oprocentowanych lokat bankowych i kont oszczędnościowych - koniec grudnia 2025 r. [tabela]

W grudniu 2025 r. nastąpiło istotne pogorszenie ofert promocyjnych lokat i rachunków oszczędnościowych. Aż 11 banków dokonało w tym zakresie cięć w porównaniu z sytuacją z sprzed miesiąca. Co więcej, żaden bank nie zdecydował się na poprawienie promocyjnej oferty depozytowej. Aktualnie średnie oprocentowanie najlepszych lokat i rachunków oszczędnościowych wynosi ok. 4,8%. To mniej niż przed miesiącem (spadek o 0,25 pkt. proc.) i mniej niż przed rokiem (o ponad 0,7 pkt. proc.).

REKLAMA

Ile z pensji komornik może zabrać na alimenty? Przykład na 2026 rok

W 2026 r. nie zmienią się zasady dotyczące dokonywania potrąceń przez pracodawcę. Co z minimalnym wynagrodzeniem za pracę? Czy ma ono wpływ na kwotę wolną od potrąceń? Wyjaśniamy!

W całej Polsce osoby niepełnosprawne z kodem 12C tracą pkt 7. Wyjaśniło się dlaczego. Bo dzieci umieją się same ubrać i umyć

Do redakcji Infor.pl stale wpływają listy rodziców, których niepełnosprawne dzieci tracą pkt 7 w orzeczeniu o niepełnosprawności. Wszystko odbywa się według tego samego schematu. I mam coraz więcej wątpliwości, czy ten schemat postępowania wobec osób niepełnosprawnych jest prawidłowy. Badanie w PZON sprowadza się do rozpoznawania autyzmu poprzez krótką rozmowę z dzieckiem i zebranie informacji przez lekarza o jego samodzielności w zakresie takich czynności jak zdolność ubrania się, umycia. Czy tak naprawdę wygląda medycyna w 2025 r. i rozpoznawanie autyzmu?

Od 1 stycznia 2026 r. rusza "stażowe". To do ZUS składa się USP: wniosek o wydanie zaświadczenia o ubezpieczeniu dla celów doliczenia okresów do stażu pracy

Dla części zatrudnionych - już od 1 stycznia 2026 r., a dla pozostałych - od 1 maja 2026 r. znaczenie będzie miał wniosek o wydanie zaświadczenia o ubezpieczeniu dla celów doliczenia okresów do stażu pracy – USP. To dokument, który umożliwi uzyskanie dłuższego stażu pracy, od którego zależy wiele uprawnień pracowniczych.

Niepełnosprawni! Nie cieszcie się z asystentów. Dla MOPS asystent to pretekst do odmowy świadczeń

Osoby niepełnosprawne liczą na pomoc asystentów. Przyszła ustawa o asystencji osobistej to prawo do asystent w wymiarze od 20 do 240 godzin (to dla osób w najcięższym stanie zdrowia) opieki miesięcznie. Niestety potwierdza się moja obawa, że urzędnicy po przyznaniu asystenta potraktują to świadczenie niepieniężne jako pretekst do zabrania innych świadczeń. Tym razem pieniężnych. Dziś sądy próbują blokować urzędy w tych sprawach wskazując dobitnie: "20 h opieki miesięcznie nie ma żadnego związku z przesłankami przyznania np. świadczenia pielęgnacyjnego". Omówiony w artykule wyrok to ostrzeżenie dla osób niepełnosprawnych i ich opiekunów. Skandaliczny sposób argumentacji GOPS warto wziąć pod uwagę przy uchwaleniu ustawy o asystencji osobistej - powinien tam się znaleźć przepis: "Przyznanie asystenta dla osoby niepełnosprawnej nie jest przesłanką do odebrania innych świadczeń osobom niepełnosprawnym". Nie ma na to co liczyć, ale przynajmniej rozmawiajmy o złych praktykach w MOPS.

REKLAMA

Mały ZUS plus od 2026 r. – nowe zasady liczenia ulg. Nawet 36 miesięcy niższych składek co 60 miesięcy

Od 1 stycznia 2026 r. wchodzą w życie nowe zasady korzystania z ulgi „mały ZUS plus”. Przedsiębiorcy prowadzący pozarolniczą działalność gospodarczą będą mogli – niezależnie od wcześniejszego korzystania z ulgi – płacić niższe składki przez maksymalnie 36 miesięcy w każdym 60-miesięcznym okresie prowadzenia działalności.

Osoby zatrudnione na stanowiskach kierowniczych mają prawo do wynagrodzenia za godziny nadliczbowe [wyrok Sądu Najwyższego]

Czy kadra zarządzająca ma prawo do wynagrodzenia za pracę w godzinach nadliczbowych? Zgodnie z powszechnie znaną zasadą wynikającą z obowiązujących przepisów, nie. Jak się jednak okazuje, nie zawsze tak jest. Sąd Najwyższy nie ma co do tego wątpliwości.

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA