REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

Polska odpowiedź na ChatGPT: PLLuM - modele językowe AI wyspecjalizowane w języku polskim. Już można korzystać

Subskrybuj nas na Youtube
Dołącz do ekspertów Dołącz do grona ekspertów
PLLuM Chat - strona główna
PLLuM - modele językowe wyspecjalizowane w języku polskim już udostępnione. Lepsze od ChatGPT?
Źródło zewnętrzne

REKLAMA

REKLAMA

Staraliśmy się, by polskie modele językowe PLLuM były bezpieczne, dostosowane do języka polskiego i "wytrenowane" na legalnie pozyskanych danych — powiedział PAP dr hab. Szymon Łukasik z NASK, ośrodka zaangażowanego w prace nad opublikowanymi w lutym modelami AI.

rozwiń >

PLLuM - rodzina dużych polskich modeli językowych

PLLuM (Polish Large Language Universal Model) to rodzina dużych polskich modeli językowych. Tego typu programy sztucznej inteligencji (AI) umożliwiają generowanie tekstu oraz przetwarzanie języka naturalnego. Dzięki nim komunikacja z maszyną nie wymaga od użytkownika stosowania sztywnych kodów i mechanicznych poleceń, ale przypominać może dialog z człowiekiem.

W odróżnieniu od komercyjnych modeli LLM (takich jak ChatGPT, Claude czy Gemini), modele PLLuM wyspecjalizowane są w języku polskim, choć do ich trenowania używano również tekstów w innych językach słowiańskich, bałtyckich oraz oczywiście w języku angielskim.

"Model jest dostosowany do języka i kultury polskiej. Prace w ramach tego projektu wspierają zaś polskich ekspertów i rozwój kompetencji w dziedzinie sztucznej inteligencji" — wyjaśnił w rozmowie z PAP uczestnik projektu dr hab. Szymon Łukasik, prof. AGH i dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK. Ośrodek ten ma koordynować teraz prace nad dalszymi pracami i wdrożeniem modeli w prace administracji publicznej — w ramach działań konsorcjum HIVE.

Do doszkalania modeli wykorzystano największy w Polsce, bo liczący 40 tys. interakcji, zbiór zapytań, w tym około 3,5 tys. dłuższych dialogów między tutejszymi trenerami a maszyną. Dzięki tej mrówczej pracy tzw. anotatorów AI ma sobie lepiej radzić ze specyfiką polskiego języka i polskiej kultury.

REKLAMA

Bezpieczeństwo i etyka

Badacz tłumaczy, jak ważne były w ramach prac kwestie bezpieczeństwa i etycznego podejścia do budowy AI. "Filozofią przyświecającą budowie tego modelu było to, żeby kwestie zbierania danych były maksymalnie przejrzyste. Żebyśmy mieli pewność, na jakim polu modele zbudowane z ich użyciem można wykorzystać" — powiedział dr hab. Łukasik. Wskazał, że przedstawiciele projektu zawierali np. umowy z redakcjami i pozyskiwali oficjalne zgody na korzystanie z archiwów polskich tekstów.

PLLuM — jak zapewniają jego twórcy — powstaje zgodnie z krajowymi i unijnymi wytycznymi dotyczącymi sztucznej inteligencji. I uwzględnia aktualne standardy ochrony danych.

30 miliardów tokenów

Ekspert z NASK tłumaczy, że język polski jest językiem o niskich zasobach. A to znaczy, że danych, które można wykorzystać do budowy modeli, nie ma zbyt dużo. Modele PLLuM do użytku komercyjnego są trenowane na ok. 30 miliardach tokenów (token to kawałek przetwarzanego tekstu - np. słowo lub jego fragment); zaś modele do użytku niekomercyjnego – dla takiego celu zasobów jest znacznie więcej – były trenowane na około 150 miliardach.

Wykorzystanie w administracji państwowej

Modele PLLuM docelowo mają być używane w administracji państwowej, a to oznacza kolejne wyzwania związane z bezpieczeństwem. Twórcy projektu musieli zadbać o to, by model stawiał w swoich odpowiedziach granice i by nie padały tam jakieś nielegalne, nieprawdziwe lub kontrowersyjne treści.

PLLuM Chat i PLLuM dla programistów

Modele PLLuM udostępnione są bezpłatnie w formie czatu wszystkim zainteresowanym https://pllum.clarin-pl.eu/. Ministerstwo Cyfryzacji opublikowało też dotąd 18 otwartych wersji modelu PLLuM dla programistów https://huggingface.co/CYFRAGOVPL. Do dyspozycji wszystkich zainteresowanych są więc zarówno lekkie, ale mniej dokładne wersje modeli, które można ściągnąć na laptopa, jak i mocniejsze, ale wymagające wielu kart graficznych modele do bardziej zaawansowanych zastosowań - np. badawczych. W przypadku obu typów istnieje możliwość uruchomienia modeli na własnej infrastrukturze, bez konieczności przekazywania zapytań do podmiotów zewnętrznych.

Dalszy ciąg materiału pod wideo

Generatory - wyspecjalizowane modele RAG-owe

W ramach projektu powstały też generatory, czyli wyspecjalizowane modele RAG-owe (ang. Retrieval Augmented Generation). Dzięki takim modelom można np. przeszukiwać i analizować swoje lokalne bazy danych i tworzyć wirtualnych asystentów analizujących zbiory własnych dokumentów. Zespół PLLuM zbudował najmniejszy (8 mld parametrów) ale wiodący w rankingach dla polskiego języka generator tego typu.

PLLuM i HIVE

Dr Łukasik odniósł się też do zmiany nazwy projektu z PLLuM na HIVE. "Nasze modele nazywają się PLLuM, a ich rodzina będzie dalej rozwijana w ramach konsorcjum HIVE. Chcieliśmy w ten sposób nawiązać do idea współpracy wielu badaczy, inżynierów i instytucji, działających niczym pszczoły w jednym ekosystemie, wymieniając się wiedzą i zasobami (np. danymi, kodem, modelami). Natomiast być może kiedyś będziemy chcieli wypuścić jakąś nową rodzinę modeli - z nową nazwą. Rozmawiamy o tym z Ministerstwem Cyfryzacji" - wskazał dr Łukasik.

Ludwika Tomala (PAP)
lt/ zan/ ktl/

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
Co się stało w Austrii? Ogłoszono 3 dniową żałobę

Co się stało w Austrii? Ogłoszono 3 dniową żałobę. Doszło do tragicznego wydarzenia! Co gorsza takich zdarzeń jest coraz więcej w Europie, nie tylko w Stanach Zjednoczonych Ameryki.

Kredyty w złotówkach pod lupą TSUE. Dr P. Szcześniak: WIBOR jest zgodny z polską ustawą o kredycie hipotecznym i unijnym rozporządzeniem BMR

WIBOR jest zgodny zarówno z polską ustawą o kredycie hipotecznym, jak i z unijnym rozporządzeniem BMR. Podlega w związku z tym szczególnym wymogom informacyjnym i zaostrzonej kontroli jego wyznaczania. Wykluczone więc wydaje się, aby postanowienia odwołujące się do WIBOR zostały przez Trybunał Sprawiedliwości lub sąd krajowy kwalifikowane jako niedozwolone postanowienia umowne w rozumieniu tzw. abuzywności – pisze dr hab. Paweł Szczęśniak z Katedry Prawa Finansowego Uniwersytetu Marii Curie-Skłodowskiej.

Podwyżka zasiłku pogrzebowego od 1 stycznia 2026 r. do 7 tys. zł. Obawy Polskiej Izby Branży Pogrzebowej. Co z waloryzacją? Kiedy koszt usług pogrzebowych rośnie?

30 maja 2025 r. prezydent Andrzej Duda podpisał nowelizację ustawy o emeryturach i rentach z Funduszu Ubezpieczeń Społecznych oraz niektórych innych ustaw. Nowela ta zakłada zwiększenie zasiłku pogrzebowego do kwoty 7 tys. zł. Nowa wysokość zasiłku pogrzebowego ma zacząć obowiązywać 1 stycznia 2026 r. Obawy Polskiej Izby Branży Pogrzebowej.

Karol Nawrocki odbierze zaświadczenie o wyborze na prezydenta 11 czerwca na Zamku Królewskim

Karol Nawrocki 11 czerwca oficjalnie odbierze zaświadczenie Państwowej Komisji Wyborczej o wyborze na prezydenta RP. Uroczystość odbędzie się o godz. 17:30 na Zamku Królewskim w Warszawie. To kluczowy krok przed objęciem urzędu 6 sierpnia – decyzję o ważności wyborów musi jeszcze podjąć Sąd Najwyższy. z członków PKW Ryszard Kalisz.

REKLAMA

Czy 800 plus jest zagrożone? ZUS może bez zgody strony zmienić lub uchylić prawo do świadczenia wychowawczego. Coraz więcej spraw w sądach i ważny wyrok WSA z 21 maja 2025 r.

Nie ma się co dziwić, że są obawy co do utraty miesięcznie: 4 800 zł, 4 000 zł, czy 3 200 zł itd., aż do 800 przy odpowiednio 6. dzieci, 5., 4. czy przy 1. Wiele osób już pyta: Kiedy traci się prawo do 800 plus? Komu zabiorą 800 plus?Czasami dzieje się tak, że traci się prawo do świadczenia (nie żadko na skutek donosu "życzliwego" sąsiada) i sądy, najczęściej administracyjne, WSA i NSA orzekają w sprawie uchylenia prawa do świadczenia rodzinnego. Wcześniej w sprawę wkracza ZUS. Czy 800 plus jest w takim razie zagrożone - pytają zaniepokojeni świadczeniobiorcy. Coraz więcej spraw jest w sądach - czy spotka to i nas? Opisujemy jedną z trudniejszych spraw przed WSA z 21.05.2025 r.: decyzja uchylająca lub zmieniająca prawo do 800 plus ma charakter konstytutywny i działa ze skutkiem ex nunc.

Polska 2050 skierowała list do Donalda Tuska. Zawiera 5 punktów

Polska 2050 skierowała oficjalny list do premiera Donalda Tuska, przedstawiając pięć kluczowych postulatów programowych, które partia chce, by znalazły się w jego nadchodzącym exposé. Wśród propozycji znalazły się m.in. ustawa o odpolitycznieniu mediów publicznych, profesjonalizacja Spółek Skarbu Państwa oraz wprowadzenie zakazu używania smartfonów w szkołach podstawowych.

Etykieta komunikacji mailowej w biznesie

W dobie cyfrowego obiegu informacji, wiadomość e-mail stała się jednym z najważniejszych narzędzi komunikacji w biznesie. To, jak piszemy i wysyłamy wiadomości, świadczy nie tylko o naszym profesjonalizmie, ale też o szacunku do odbiorcy. Niniejszy tekst przybliża zasady etykiety mailowej, które pomagają budować wiarygodność i pozytywny wizerunek w relacjach zawodowych.

Pożyczkę zaciągnął oszust, na Twoje skradzione dane? To nic – sąd wyda nakaz zapłaty, a komornik ją od Ciebie wyegzekwuje (łącznie z odsetkami i kosztami sądowymi). Tak orzekają polskie sądy [prawomocny wyrok]

Oszust zaciągnął pożyczkę na wyłudzone od kobiety dane osobowe, w następstwie czego – sąd wydał nakaz zapłaty, w którym zobowiązał ją do jej zwrotu (wraz z odsetkami i kosztami sądowymi), a komornik nakaz ten „wykonał” doprowadzając do wyegzekwowania należności od ofiary przestępstwa. Wyrok jest prawomocny (i wszystkie postanowienia sądu, które odrzucają „próby” obrony kobiety przed jego wykonaniem również), nie zgodził się z nim jedynie Rzecznik Praw Obywatelskich (RPO).

REKLAMA

Krótszy czas pracy coraz bliżej: Jest rządowy pilotaż, już wkrótce poznamy szczegóły

W Polsce rusza pierwszy w Europie Środkowo-Wschodniej ogólnokrajowy pilotaż skróconego czasu pracy. Już wkrótce poznamy szczegóły programu, który ma na celu poprawę dobrostanu pracowników przy jednoczesnym utrzymaniu efektywności pracy i poziomu wynagrodzeń. Inicjatywa budzi duże zainteresowanie zarówno wśród pracodawców, jak i ekspertów rynku pracy.

Komunikat PKW: Nieprawidłowości w maksymalnie 10 komisjach; będzie sprawozdanie z wyborów prezydenckich

Państwowa Komisja Wyborcza przygotowuje obecnie sprawozdanie analizując m.in. informacje przekazywane przez okręgowe komisje wyborcze - podała 10 czerwca PKW w komunikacie. Szef PKW Sylwester Marciniak powiedział mediom, że sygnały o możliwych nieprawidłowościach dotyczą nie więcej niż 10 komisji, co na tym etapie nie powinno mieć wpływu na wynik wyborów.

REKLAMA