REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

Polska odpowiedź na ChatGPT: PLLuM - modele językowe AI wyspecjalizowane w języku polskim. Już można korzystać

PLLuM Chat - strona główna
PLLuM - modele językowe wyspecjalizowane w języku polskim już udostępnione. Lepsze od ChatGPT?
Źródło zewnętrzne

REKLAMA

REKLAMA

Staraliśmy się, by polskie modele językowe PLLuM były bezpieczne, dostosowane do języka polskiego i "wytrenowane" na legalnie pozyskanych danych — powiedział PAP dr hab. Szymon Łukasik z NASK, ośrodka zaangażowanego w prace nad opublikowanymi w lutym modelami AI.

rozwiń >

PLLuM - rodzina dużych polskich modeli językowych

PLLuM (Polish Large Language Universal Model) to rodzina dużych polskich modeli językowych. Tego typu programy sztucznej inteligencji (AI) umożliwiają generowanie tekstu oraz przetwarzanie języka naturalnego. Dzięki nim komunikacja z maszyną nie wymaga od użytkownika stosowania sztywnych kodów i mechanicznych poleceń, ale przypominać może dialog z człowiekiem.

W odróżnieniu od komercyjnych modeli LLM (takich jak ChatGPT, Claude czy Gemini), modele PLLuM wyspecjalizowane są w języku polskim, choć do ich trenowania używano również tekstów w innych językach słowiańskich, bałtyckich oraz oczywiście w języku angielskim.

"Model jest dostosowany do języka i kultury polskiej. Prace w ramach tego projektu wspierają zaś polskich ekspertów i rozwój kompetencji w dziedzinie sztucznej inteligencji" — wyjaśnił w rozmowie z PAP uczestnik projektu dr hab. Szymon Łukasik, prof. AGH i dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK. Ośrodek ten ma koordynować teraz prace nad dalszymi pracami i wdrożeniem modeli w prace administracji publicznej — w ramach działań konsorcjum HIVE.

Do doszkalania modeli wykorzystano największy w Polsce, bo liczący 40 tys. interakcji, zbiór zapytań, w tym około 3,5 tys. dłuższych dialogów między tutejszymi trenerami a maszyną. Dzięki tej mrówczej pracy tzw. anotatorów AI ma sobie lepiej radzić ze specyfiką polskiego języka i polskiej kultury.

REKLAMA

REKLAMA

Bezpieczeństwo i etyka

Badacz tłumaczy, jak ważne były w ramach prac kwestie bezpieczeństwa i etycznego podejścia do budowy AI. "Filozofią przyświecającą budowie tego modelu było to, żeby kwestie zbierania danych były maksymalnie przejrzyste. Żebyśmy mieli pewność, na jakim polu modele zbudowane z ich użyciem można wykorzystać" — powiedział dr hab. Łukasik. Wskazał, że przedstawiciele projektu zawierali np. umowy z redakcjami i pozyskiwali oficjalne zgody na korzystanie z archiwów polskich tekstów.

PLLuM — jak zapewniają jego twórcy — powstaje zgodnie z krajowymi i unijnymi wytycznymi dotyczącymi sztucznej inteligencji. I uwzględnia aktualne standardy ochrony danych.

30 miliardów tokenów

Ekspert z NASK tłumaczy, że język polski jest językiem o niskich zasobach. A to znaczy, że danych, które można wykorzystać do budowy modeli, nie ma zbyt dużo. Modele PLLuM do użytku komercyjnego są trenowane na ok. 30 miliardach tokenów (token to kawałek przetwarzanego tekstu - np. słowo lub jego fragment); zaś modele do użytku niekomercyjnego – dla takiego celu zasobów jest znacznie więcej – były trenowane na około 150 miliardach.

Wykorzystanie w administracji państwowej

Modele PLLuM docelowo mają być używane w administracji państwowej, a to oznacza kolejne wyzwania związane z bezpieczeństwem. Twórcy projektu musieli zadbać o to, by model stawiał w swoich odpowiedziach granice i by nie padały tam jakieś nielegalne, nieprawdziwe lub kontrowersyjne treści.

REKLAMA

PLLuM Chat i PLLuM dla programistów

Modele PLLuM udostępnione są bezpłatnie w formie czatu wszystkim zainteresowanym https://pllum.clarin-pl.eu/. Ministerstwo Cyfryzacji opublikowało też dotąd 18 otwartych wersji modelu PLLuM dla programistów https://huggingface.co/CYFRAGOVPL. Do dyspozycji wszystkich zainteresowanych są więc zarówno lekkie, ale mniej dokładne wersje modeli, które można ściągnąć na laptopa, jak i mocniejsze, ale wymagające wielu kart graficznych modele do bardziej zaawansowanych zastosowań - np. badawczych. W przypadku obu typów istnieje możliwość uruchomienia modeli na własnej infrastrukturze, bez konieczności przekazywania zapytań do podmiotów zewnętrznych.

Dalszy ciąg materiału pod wideo

Generatory - wyspecjalizowane modele RAG-owe

W ramach projektu powstały też generatory, czyli wyspecjalizowane modele RAG-owe (ang. Retrieval Augmented Generation). Dzięki takim modelom można np. przeszukiwać i analizować swoje lokalne bazy danych i tworzyć wirtualnych asystentów analizujących zbiory własnych dokumentów. Zespół PLLuM zbudował najmniejszy (8 mld parametrów) ale wiodący w rankingach dla polskiego języka generator tego typu.

PLLuM i HIVE

Dr Łukasik odniósł się też do zmiany nazwy projektu z PLLuM na HIVE. "Nasze modele nazywają się PLLuM, a ich rodzina będzie dalej rozwijana w ramach konsorcjum HIVE. Chcieliśmy w ten sposób nawiązać do idea współpracy wielu badaczy, inżynierów i instytucji, działających niczym pszczoły w jednym ekosystemie, wymieniając się wiedzą i zasobami (np. danymi, kodem, modelami). Natomiast być może kiedyś będziemy chcieli wypuścić jakąś nową rodzinę modeli - z nową nazwą. Rozmawiamy o tym z Ministerstwem Cyfryzacji" - wskazał dr Łukasik.

Ludwika Tomala (PAP)
lt/ zan/ ktl/

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
TSUE: Polska musi uznać małżeństwo jednopłciowe legalnie zawarte w Niemczech i nie może odmówić transkrypcji aktu małżeństwa

W dniu 25 listopada 2025 r. Trybunał Sprawiedliwości Unii Europejskiej wydał wyrok, zgodnie z którym państwo członkowskie ma obowiązek uznać małżeństwo dwóch obywateli Unii Europejskiej tej samej płci legalnie zawarte w innym państwie członkowskim, w którym korzystali oni z przysługującej im swobody przemieszczania się i pobytu. Zdaniem TSUE jako że transkrypcja jest jedynym przewidzianym w prawie polskim środkiem pozwalającym na to, aby małżeństwo zawarte w innym państwie członkowskim zostało faktycznie uznane przez organy administracyjne - Polska jest zobowiązana stosować transkrypcję bez rozróżnienia do małżeństw osób tej samej płci oraz małżeństw zawieranych przez osoby odmiennej płci.

Przekształcenie umów cywilnoprawnych w stosunek pracy. Będą odszkodowania dla przymusowych pracodawców

Jakie konsekwencje pociągnie za sobą przekształcenie umowy cywilnoprawnej w stosunek pracy, jeśli decyzja podjęta w tym zakresie przez inspektora pracy będzie niesłuszna? Zmieniła się treść projektu, który ma wprowadzać te zmiany, a w planowanych przepisach jest mowa o odszkodowaniu.

Podwyżki dla tych pracowników z negatywną opinią. Czy i o ile od stycznia 2026 roku wzrosną wynagrodzenia?

Podwyżka płacy minimalnej zawsze pociąga za sobą konieczność wprowadzenia szeregu dalszych zmian. To jednak często nie jest wcale łatwe. Choć MPRiPS pracuje nad zmianami, to jednak przygotowane przez nie przepisy wzbudziły negatywne emocje.

ZUS limituje świadczenia wiekiem. Młodszemu wypłaci 2255 zł, a starszemu 1504 zł. Obaj tak samo niepełnosprawni [stopień znaczny]

Czytelnicy Infor.pl przekazali nam dokument Wytycznych, które strona rządowa wysłała do WZON. Było to w grudniu 2024 r. Dokument potwierdza to, o czym wielokrotnie pisały do nas w listach osoby niepełnosprawne. Test niesamodzielności osób niepełnosprawnych pozwala na otrzymanie maksymalnie 100 punktów (tzw. poziom potrzeby wsparcia), co daje 4134 zł. W przypadku osób niepełnosprawnych w wieku 75 lat maksymalna wysokość 100 punktów jest według wytycznych obniżana nawet o 11,7 punktu. Dlatego, że Wytyczne przyjmują założenie, że osoba w wieku 75 jest niesamodzielna z dwóch przyczyn - 1) niepełnosprawność + 2) ograniczenia wynikające z wieku. Oba te czynniki nakładają się na siebie. Trzeba je oddzielić. Dlatego - co do zasady - osoba niepełnosprawna w wieku 75 lat (i więcej) musi mieć obniżoną punktację przyznającą świadczenie wspierające - o tą część niesamodzielności, która wynika z wieku. Argumentacja strony rządowej jest logiczna. Ma tylko jeden słaby punkt - nie przewidują możliwości jej zastosowania (poprzez Wytyczne) przepisy ustawowe.

REKLAMA

Przekształcanie zleceń w umowy o pracę – uprawnienia PIP istotnie ograniczone. Co wynika z najnowszej wersji projektu?

Choć przekształcanie przez PIP umów cywilnoprawnych w umowy o pracę nadal jest pomysłem, który może zostać zrealizowany, to jednak zmieniła się treść projektu. Pozostało w nim wiele kontrowersyjnych pomysłów, ale równocześnie zaszły ważne zmiany.

“Pełną piersią? Polki i Polacy o smogu i jakości powietrza” [RAPORT]

Niemal wszyscy Polacy – zgadzają się, że zła jakość powietrza negatywnie wpływa na zdrowie. I wskazują nie tylko na kaszel, bóle głowy i podrażnienia oczu, ale także na alergie, astmę oraz problemy z sercem jako dolegliwości, które bezpośrednio wiążą z zanieczyszczeniami powietrza. Poniżej analiza raportu: “Pełną piersią? Polki i Polacy o smogu i jakości powietrza”.

Orzeczenie o niepełnosprawności dziecka. Lista praw i świadczeń na 2026 rok

Orzeczenie o niepełnosprawności dziecka to ważny dokument, który uprawnia do wielu ulg, świadczeń i przywilejów. Jakich? Oto najważniejsze formy wsparcia i kwoty na 2026 rok.

Wytyczne dla WZON. Obniżają świadczenia. Nawet o 11,7 punktu. I zamiast wspierającego 1504 zł (82 punkty) wypłata 1128 zł (75 punkty)

Infor.pl publikuje dokument Wytycznych dla WZON z grudnia 2024 r. sygnowany godłem Ministerstwa Rodziny z pismem przewodnim Pełnomocnika do Spraw Osób Niepełnosprawnych (11 plików jpg jest na końcu artykułu). Dokument otrzymaliśmy od czytelników. Od roku środowisko osób niepełnosprawnych huczy mitami o dokumencie Wytycznych - że każda starsza osoba jest ograniczana w 9 czynnościach testu niesamodzielności do niskiego kwalifikatora WC-C, co zaniża wysokość świadczenia wspierającego (WC-C daje 2,7 punktu przy maksymalnym poziomie 4 punkty). Podstawowe pytanie jest takie - czy to jest prawda? Z dokumentu Wytycznych wynika, że "Tak, osoby niepełnosprawne mówiły prawdę".

REKLAMA

Obowiązek oznakowania ścian oddzielenia przeciwpożarowego od początku 2026 r. Których budynków dotyczy?

Od 1 stycznia 2026 r. oznakowanie miejsca połączenia ściany oddzielenia przeciwpożarowego ze ścianą zewnętrzną oraz z dachem staje się obowiązkowe w obiektach handlowych, produkcyjnych i magazynowych - przypomniał w rozmowie z PAP rzecznik prasowy KG PSP st. bryg. Karol Kierzkowski.

Państwo nie może działać przeciwko obywatelom. ZUS nie może pozbawiać prawa do zasiłku przez jedno wyjście z domu [wyrok]

Kontrola prawidłowości korzystania ze zwolnień lekarskich to temat, który budzi wiele emocji. Z jednej strony ZUS mówi o nadużywaniu świadczeń i zapowiada wzmożone kontrole, z drugiej ubezpieczeni czują się prześladowani i traktowani niesprawiedliwie.

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA