REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

Polska odpowiedź na ChatGPT: PLLuM - modele językowe AI wyspecjalizowane w języku polskim. Już można korzystać

Subskrybuj nas na Youtube
Dołącz do ekspertów Dołącz do grona ekspertów
PLLuM Chat - strona główna
PLLuM - modele językowe wyspecjalizowane w języku polskim już udostępnione. Lepsze od ChatGPT?
Źródło zewnętrzne

REKLAMA

REKLAMA

Staraliśmy się, by polskie modele językowe PLLuM były bezpieczne, dostosowane do języka polskiego i "wytrenowane" na legalnie pozyskanych danych — powiedział PAP dr hab. Szymon Łukasik z NASK, ośrodka zaangażowanego w prace nad opublikowanymi w lutym modelami AI.

rozwiń >

PLLuM - rodzina dużych polskich modeli językowych

PLLuM (Polish Large Language Universal Model) to rodzina dużych polskich modeli językowych. Tego typu programy sztucznej inteligencji (AI) umożliwiają generowanie tekstu oraz przetwarzanie języka naturalnego. Dzięki nim komunikacja z maszyną nie wymaga od użytkownika stosowania sztywnych kodów i mechanicznych poleceń, ale przypominać może dialog z człowiekiem.

W odróżnieniu od komercyjnych modeli LLM (takich jak ChatGPT, Claude czy Gemini), modele PLLuM wyspecjalizowane są w języku polskim, choć do ich trenowania używano również tekstów w innych językach słowiańskich, bałtyckich oraz oczywiście w języku angielskim.

"Model jest dostosowany do języka i kultury polskiej. Prace w ramach tego projektu wspierają zaś polskich ekspertów i rozwój kompetencji w dziedzinie sztucznej inteligencji" — wyjaśnił w rozmowie z PAP uczestnik projektu dr hab. Szymon Łukasik, prof. AGH i dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK. Ośrodek ten ma koordynować teraz prace nad dalszymi pracami i wdrożeniem modeli w prace administracji publicznej — w ramach działań konsorcjum HIVE.

Do doszkalania modeli wykorzystano największy w Polsce, bo liczący 40 tys. interakcji, zbiór zapytań, w tym około 3,5 tys. dłuższych dialogów między tutejszymi trenerami a maszyną. Dzięki tej mrówczej pracy tzw. anotatorów AI ma sobie lepiej radzić ze specyfiką polskiego języka i polskiej kultury.

REKLAMA

Bezpieczeństwo i etyka

Badacz tłumaczy, jak ważne były w ramach prac kwestie bezpieczeństwa i etycznego podejścia do budowy AI. "Filozofią przyświecającą budowie tego modelu było to, żeby kwestie zbierania danych były maksymalnie przejrzyste. Żebyśmy mieli pewność, na jakim polu modele zbudowane z ich użyciem można wykorzystać" — powiedział dr hab. Łukasik. Wskazał, że przedstawiciele projektu zawierali np. umowy z redakcjami i pozyskiwali oficjalne zgody na korzystanie z archiwów polskich tekstów.

PLLuM — jak zapewniają jego twórcy — powstaje zgodnie z krajowymi i unijnymi wytycznymi dotyczącymi sztucznej inteligencji. I uwzględnia aktualne standardy ochrony danych.

30 miliardów tokenów

Ekspert z NASK tłumaczy, że język polski jest językiem o niskich zasobach. A to znaczy, że danych, które można wykorzystać do budowy modeli, nie ma zbyt dużo. Modele PLLuM do użytku komercyjnego są trenowane na ok. 30 miliardach tokenów (token to kawałek przetwarzanego tekstu - np. słowo lub jego fragment); zaś modele do użytku niekomercyjnego – dla takiego celu zasobów jest znacznie więcej – były trenowane na około 150 miliardach.

Wykorzystanie w administracji państwowej

Modele PLLuM docelowo mają być używane w administracji państwowej, a to oznacza kolejne wyzwania związane z bezpieczeństwem. Twórcy projektu musieli zadbać o to, by model stawiał w swoich odpowiedziach granice i by nie padały tam jakieś nielegalne, nieprawdziwe lub kontrowersyjne treści.

PLLuM Chat i PLLuM dla programistów

Modele PLLuM udostępnione są bezpłatnie w formie czatu wszystkim zainteresowanym https://pllum.clarin-pl.eu/. Ministerstwo Cyfryzacji opublikowało też dotąd 18 otwartych wersji modelu PLLuM dla programistów https://huggingface.co/CYFRAGOVPL. Do dyspozycji wszystkich zainteresowanych są więc zarówno lekkie, ale mniej dokładne wersje modeli, które można ściągnąć na laptopa, jak i mocniejsze, ale wymagające wielu kart graficznych modele do bardziej zaawansowanych zastosowań - np. badawczych. W przypadku obu typów istnieje możliwość uruchomienia modeli na własnej infrastrukturze, bez konieczności przekazywania zapytań do podmiotów zewnętrznych.

Dalszy ciąg materiału pod wideo

Generatory - wyspecjalizowane modele RAG-owe

W ramach projektu powstały też generatory, czyli wyspecjalizowane modele RAG-owe (ang. Retrieval Augmented Generation). Dzięki takim modelom można np. przeszukiwać i analizować swoje lokalne bazy danych i tworzyć wirtualnych asystentów analizujących zbiory własnych dokumentów. Zespół PLLuM zbudował najmniejszy (8 mld parametrów) ale wiodący w rankingach dla polskiego języka generator tego typu.

PLLuM i HIVE

Dr Łukasik odniósł się też do zmiany nazwy projektu z PLLuM na HIVE. "Nasze modele nazywają się PLLuM, a ich rodzina będzie dalej rozwijana w ramach konsorcjum HIVE. Chcieliśmy w ten sposób nawiązać do idea współpracy wielu badaczy, inżynierów i instytucji, działających niczym pszczoły w jednym ekosystemie, wymieniając się wiedzą i zasobami (np. danymi, kodem, modelami). Natomiast być może kiedyś będziemy chcieli wypuścić jakąś nową rodzinę modeli - z nową nazwą. Rozmawiamy o tym z Ministerstwem Cyfryzacji" - wskazał dr Łukasik.

Ludwika Tomala (PAP)
lt/ zan/ ktl/

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
Ci, którzy mają mieszkania z balkonem słono za to zapłacą. I nie ma litości

Nie wszystkich stać na dom z ogrodem, czy choćby własna, niewielką działkę. Niektórzy swoim kwiatowym i kulinarnym pasjom oddają się na balkonach blokowisk. I tu zaczyna się problem, który może się skończyć zapłaceniem słonej kary.

Już od 14 sierpnia 2025 r. będzie łatwiej o orzeczenie o niepełnosprawności i stopniu niepełnosprawności, uprawniające do szeregu świadczeń, ulg i uprawnień. Nowe przepisy wchodzą w życie

W dniu 14 sierpnia 2025 r. wchodzi w życie rozporządzenie Ministra Rodziny, Pracy i Polityki Społecznej z dnia 28.07.2025 r. zmieniające rozporządzenie w sprawie orzekania o niepełnosprawności i stopniu niepełnosprawności, dzięki któremu będzie można szybciej uzyskać orzeczenie o niepełnosprawności (i odpowiednio – stopniu niepełnosprawności), a co się z tym wiąże – szybciej korzystać z przysługujących na jego podstawie świadczeń, ulg i innych uprawnień.

To już przesądzone: Co najmniej dwie niedziele handlowe w miesiącu, zakupy w pierwszą i trzecią niedzielę każdego miesiąca, koniec z zakazem handlu w kolejne 20 niedziel w roku?

Na III czytanie sejmowej Komisji Gospodarki i Rozwoju oczekuje projekt ustawy o zmianie ustawy o ograniczeniu handlu w niedziele i święta oraz w niektóre inne dni oraz ustawy - Kodeks pracy (druk sejmowy nr 384), który ma na celu zmianę regulacji dotyczących zasad prowadzenia handlu i czynności związanych z handlem w niedziele, poprzez wprowadzenie co najmniej dwóch niedziel handlowych w każdym miesiącu roku kalendarzowego. Dotychczasowe 4 niedziele handlowe (wyznaczone na ostatnią niedzielę w styczniu, kwietniu, czerwcu i sierpniu) – zostałyby zatem zastąpione aż 24 takimi niedzielami, w które nie obowiązywałby zakaz handlu. W związku z wyborem Karola Nawrockiego na nowego Prezydenta RP i jego deklaracjami, które padły w tym zakresie w czasie kampanii prezydenckiej – wydaje się, że dalsze losy tego projektu są już jednak przesądzone.

133 korzystne wyroki sądów powszechnych w sprawach dot. wyroku TK z 4 czerwca 2024 r. SK 140/20, w tym 16 prawomocnych – uruchomienie pierwszej w Polsce wyszukiwarki wyroków

Orzecznictwo w sprawach art. 25 ust. 1b ustawy emerytalnej po wyroku Trybunału Konstytucyjnego z 4 czerwca 2024 r. sygn. akt SK 140/20 jest bardzo niejednolite. Wskazana niejednolitość przejawia się na wielu płaszczyznach, przede wszystkim niektóre sądy powszechne orzekają na korzyść emerytów poprzez zmianę decyzji ZUS, inne z kolei orzekają na niekorzyść, oddalając odwołania emerytów. Również w ramach orzeczeń korzystnych, można zaobserwować spore różnice. We wpisie przedstawiam zbiór znanych mi korzystnych orzeczeń dotyczących art. 25 ust. 1b ustawy emerytalnej, wydanych po wyroku TK z 4 czerwca 2024 roku sygn. akt SK 140/20.

REKLAMA

Czas pracy w 2026 roku – dni robocze, święta, Wigilia [TABELA]

W 2026 roku obowiązuje 14 dni ustawowo wolnych od pracy, w tym Wigilia (24 grudnia), która od 2025 roku również jest dniem wolnym. W efekcie pracownicy na pełnym etacie będą mieli do przepracowania 2008 godzin w ciągu roku, przy 251 dniach roboczych i 114 dniach wolnych (wliczając weekendy).

Renta wdowia miała być wsparciem: Dziś wielu czuje się pominiętych. Nowe przepisy źródłem frustracji i oburzenia

Renta wdowia – dla wielu miała być finansowym wsparciem i symboliczną pomocą po utracie najbliższej osoby. Dziś coraz więcej osób mówi o rozczarowaniu, a nawet o poczuciu wykluczenia. Dlaczego świadczenie, które miało łagodzić życiowy dramat, stało się źródłem frustracji i oburzenia?

4 043 zł z PFRON na wózek lub skuter elektryczny – ruszył nabór wniosków

Masz wózek lub skuter z napędem elektrycznym? PFRON rusza z nowym wsparciem – możesz dostać nawet 4 043 zł na serwis, naprawę lub wymianę akumulatorów. O dofinansowanie mogą wnioskować osoby z umiarkowanym lub znacznym stopniem niepełnosprawności. Wnioski przyjmowane są do 31 sierpnia przez system SOW.

Język ukraiński jako drugi język obcy w szkołach podstawowych – jest nowa podstawa programowa

25 lipca 2025 r. opublikowano nową podstawę programową do nauczania języka ukraińskiego jako drugiego języka obcego dla klas VII–VIII szkół podstawowych w Polsce. Dokument ten został opracowany z myślą o nauczycielach języka ukraińskiego pracujących w szkołach podstawowych.

REKLAMA

Podatek katastralny - jak to działa w praktyce. Przewodnik dla Polaków kupujących nieruchomości w Hiszpanii

Coraz więcej Polaków kupuje mieszkania czy domy w Hiszpanii, dlatego rośnie zainteresowanie hiszpańskim systemem podatkowym. Jednym z kluczowych obciążeń w tym państwie jest podatek katastralny, zwany lokalnie IBI (Impuesto sobre Bienes Inmuebles).

Wielki powrót użytkowania wieczystego w mieszkalnictwie, a jeszcze niedawno – miliony Polaków zapłaciło (lub cały czas jeszcze płaci) za wykup od Skarbu Państwa udziału w nieruchomości związanego z posiadanym mieszkaniem

Podczas posiedzenia Senatu, które odbyło się w dniu 17 lipca 2025 r. – wiceminister rozwoju i technologii Tomasz Lewandowski ujawnił, że resort ma już gotowy projekt ustawy mającej na celu przywrócenie użytkowania wieczystego nieruchomości gruntowych zabudowanych na cele mieszkaniowe. Co więcej – przewiduje on nie tylko powrót do budownictwa na gruntach należących do Skarbu Państwa lub samorządu terytorialnego, ale również zupełnie nową kategorię użytkowania wieczystego, z którą związane będą odmienne niż dotychczas (tj. sprzed zmiany stanu prawnego, która miała miejsce 1 stycznia 2019 r.) opłaty.

REKLAMA