REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

Polska odpowiedź na ChatGPT: PLLuM - modele językowe AI wyspecjalizowane w języku polskim. Już można korzystać

PLLuM Chat - strona główna
PLLuM - modele językowe wyspecjalizowane w języku polskim już udostępnione. Lepsze od ChatGPT?
Źródło zewnętrzne

REKLAMA

REKLAMA

Staraliśmy się, by polskie modele językowe PLLuM były bezpieczne, dostosowane do języka polskiego i "wytrenowane" na legalnie pozyskanych danych — powiedział PAP dr hab. Szymon Łukasik z NASK, ośrodka zaangażowanego w prace nad opublikowanymi w lutym modelami AI.

rozwiń >

PLLuM - rodzina dużych polskich modeli językowych

PLLuM (Polish Large Language Universal Model) to rodzina dużych polskich modeli językowych. Tego typu programy sztucznej inteligencji (AI) umożliwiają generowanie tekstu oraz przetwarzanie języka naturalnego. Dzięki nim komunikacja z maszyną nie wymaga od użytkownika stosowania sztywnych kodów i mechanicznych poleceń, ale przypominać może dialog z człowiekiem.

W odróżnieniu od komercyjnych modeli LLM (takich jak ChatGPT, Claude czy Gemini), modele PLLuM wyspecjalizowane są w języku polskim, choć do ich trenowania używano również tekstów w innych językach słowiańskich, bałtyckich oraz oczywiście w języku angielskim.

"Model jest dostosowany do języka i kultury polskiej. Prace w ramach tego projektu wspierają zaś polskich ekspertów i rozwój kompetencji w dziedzinie sztucznej inteligencji" — wyjaśnił w rozmowie z PAP uczestnik projektu dr hab. Szymon Łukasik, prof. AGH i dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK. Ośrodek ten ma koordynować teraz prace nad dalszymi pracami i wdrożeniem modeli w prace administracji publicznej — w ramach działań konsorcjum HIVE.

Do doszkalania modeli wykorzystano największy w Polsce, bo liczący 40 tys. interakcji, zbiór zapytań, w tym około 3,5 tys. dłuższych dialogów między tutejszymi trenerami a maszyną. Dzięki tej mrówczej pracy tzw. anotatorów AI ma sobie lepiej radzić ze specyfiką polskiego języka i polskiej kultury.

REKLAMA

REKLAMA

Bezpieczeństwo i etyka

Badacz tłumaczy, jak ważne były w ramach prac kwestie bezpieczeństwa i etycznego podejścia do budowy AI. "Filozofią przyświecającą budowie tego modelu było to, żeby kwestie zbierania danych były maksymalnie przejrzyste. Żebyśmy mieli pewność, na jakim polu modele zbudowane z ich użyciem można wykorzystać" — powiedział dr hab. Łukasik. Wskazał, że przedstawiciele projektu zawierali np. umowy z redakcjami i pozyskiwali oficjalne zgody na korzystanie z archiwów polskich tekstów.

PLLuM — jak zapewniają jego twórcy — powstaje zgodnie z krajowymi i unijnymi wytycznymi dotyczącymi sztucznej inteligencji. I uwzględnia aktualne standardy ochrony danych.

30 miliardów tokenów

Ekspert z NASK tłumaczy, że język polski jest językiem o niskich zasobach. A to znaczy, że danych, które można wykorzystać do budowy modeli, nie ma zbyt dużo. Modele PLLuM do użytku komercyjnego są trenowane na ok. 30 miliardach tokenów (token to kawałek przetwarzanego tekstu - np. słowo lub jego fragment); zaś modele do użytku niekomercyjnego – dla takiego celu zasobów jest znacznie więcej – były trenowane na około 150 miliardach.

Wykorzystanie w administracji państwowej

Modele PLLuM docelowo mają być używane w administracji państwowej, a to oznacza kolejne wyzwania związane z bezpieczeństwem. Twórcy projektu musieli zadbać o to, by model stawiał w swoich odpowiedziach granice i by nie padały tam jakieś nielegalne, nieprawdziwe lub kontrowersyjne treści.

REKLAMA

PLLuM Chat i PLLuM dla programistów

Modele PLLuM udostępnione są bezpłatnie w formie czatu wszystkim zainteresowanym https://pllum.clarin-pl.eu/. Ministerstwo Cyfryzacji opublikowało też dotąd 18 otwartych wersji modelu PLLuM dla programistów https://huggingface.co/CYFRAGOVPL. Do dyspozycji wszystkich zainteresowanych są więc zarówno lekkie, ale mniej dokładne wersje modeli, które można ściągnąć na laptopa, jak i mocniejsze, ale wymagające wielu kart graficznych modele do bardziej zaawansowanych zastosowań - np. badawczych. W przypadku obu typów istnieje możliwość uruchomienia modeli na własnej infrastrukturze, bez konieczności przekazywania zapytań do podmiotów zewnętrznych.

Dalszy ciąg materiału pod wideo

Generatory - wyspecjalizowane modele RAG-owe

W ramach projektu powstały też generatory, czyli wyspecjalizowane modele RAG-owe (ang. Retrieval Augmented Generation). Dzięki takim modelom można np. przeszukiwać i analizować swoje lokalne bazy danych i tworzyć wirtualnych asystentów analizujących zbiory własnych dokumentów. Zespół PLLuM zbudował najmniejszy (8 mld parametrów) ale wiodący w rankingach dla polskiego języka generator tego typu.

PLLuM i HIVE

Dr Łukasik odniósł się też do zmiany nazwy projektu z PLLuM na HIVE. "Nasze modele nazywają się PLLuM, a ich rodzina będzie dalej rozwijana w ramach konsorcjum HIVE. Chcieliśmy w ten sposób nawiązać do idea współpracy wielu badaczy, inżynierów i instytucji, działających niczym pszczoły w jednym ekosystemie, wymieniając się wiedzą i zasobami (np. danymi, kodem, modelami). Natomiast być może kiedyś będziemy chcieli wypuścić jakąś nową rodzinę modeli - z nową nazwą. Rozmawiamy o tym z Ministerstwem Cyfryzacji" - wskazał dr Łukasik.

Ludwika Tomala (PAP)
lt/ zan/ ktl/

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
EKUZ – gwarancja opieki zdrowotnej na wakacjach w krajach Unii Europejskiej

Osoby wyjeżdżające za granicę na wakacje lub do pracy na krócej niż 12 miesięcy powinny zadbać o uzyskanie Europejskiej Karty Ubezpieczenia Zdrowotnego. EKUZ potwierdza prawo do leczenia w krajach Unii Europejskiej i EFTA.

Dane osobowe obywateli ujawnione przez burmistrza Myślenic. Prezes UODO ukarał go karą pieniężną

Prezes Urzędu Ochrony Danych Osobowych (UODO) po przeprowadzonym postępowaniu stwierdził naruszenie ochrony danych osobowych przez administratora danych – Burmistrza Miasta i Gminy Myślenice. Sprawa dotyczy udostępnienia danych osobowych obywateli, którzy poparli petycję opublikowaną następnie przez Urząd Miasta i Gminy Myślenice w Biuletynie Informacji Publicznej.

Nowe ceny paliwa na piątek. Jutro zapłacimy mniej za benzynę i olej napędowy

Minister energii wydał nowe obwieszczenie, w którym określił maksymalne ceny detaliczne benzyny i oleju napędowego obowiązujące w piątek 29 maja. Nadal utrzyma się tendencja spadkowa cen paliw. O ile stanieją benzyna i diesel? Sprawdzamy!

Sprawy frankowe zapychają sądy – 70% spraw w apelacji to frankowicze. Winne kredyty CHF?

Myślisz, że sprawa frankowa Cię nie dotyczy? Błąd. Jeśli czekasz na rozwód, podział majątku po rodzicach czy odszkodowanie – stoisz w kolejce. W sądach apelacyjnych aż 70% wszystkich spraw to właśnie sprawy frankowe. Ministerstwo Sprawiedliwości pokazuje dane: polskie sądy II instancji stały się sądami jednej sprawy. Ustawa frankowa ma to zmienić.

REKLAMA

Pułapka w prawie budowlanym: Szopa w przydomowym ogrodzie nielegalna bez pozwolenia na budowę w 2026 r. czy wystarczy samo zgłoszenie?

Szopa ogrodowa (zwana również domkiem narzędziowym) to bardzo przydatna, dodatkowa przestrzeń do przechowywania. Niejedna pomieści nie tylko narzędzia ogrodowe, ale również rowery, zapasowe opony do samochodu, składane meble ogrodowe i wiele innych rzeczy, których nie chce się trzymać w domu. Czy jednak taki niewielki budynek (gdyż w znacznej większości przypadków, szopa ogrodowa stanowi budynek, w rozumieniu przepisów prawa budowlanego), można wykonać w przydomowym ogrodzie bez uprzedniego uzyskania wymaganych zgód administracyjnych (takich jak decyzja o pozwoleniu na budowę czy decyzja o warunkach zabudowy) oraz bez dokonania zgłoszenia do właściwego organu administracji architektoniczno-budowlanej? Warto, w tym zakresie, dokładnie sprawdzić przepisy prawa budowlanego, ponieważ – pomyłka, może być dla właściciela nieruchomości bardzo kosztowna.

Pracodawca zwolni pracownika, który często choruje. Sądy są zgodne – celem stosunku pracy nie jest utrzymywanie pracownika

Częste nieobecności pracownika dezorganizują pracę. Ale czy mogą uzasadniać wypowiedzenie umowy? Sądy nie mają wątpliwości co do tego, co jest celem stosunku pracy. W wydawanych wyrokach zauważają też trudności, z którymi mierzą się pracodawcy.

Traktat między Polską a Wielką Brytanią dot. bezpieczeństwa i obronności z 27 maja 2026 r. [treść]. Jakie postanowienia zawiera?

W dniu 27 maja 2026 r. prezes Rady Ministrów Donald Tusk oraz premier brytyjskiego rządu Keir Starmer podpisali Traktat o Partnerstwie w Dziedzinie Bezpieczeństwa i Obronności w wojskowej bazie lotniczej Northolt. „Chcemy bronić bezpiecznej Polski i Wielkiej Brytanii oraz chronić nasze wartości” - zaznaczył Prezes Rady Ministrów. Warszawa i Londyn wyniosły relacje dwustronne na najwyższy poziom. Traktat z Northolt przewiduje współdziałanie w obszarze wojskowości, przemysłu zbrojeniowego oraz cyberbezpieczeństwa. Celem obu państw jest skuteczne odstraszanie potencjalnego agresora - Rosji. To kolejne strategiczne porozumienie zawarte przez nasz kraj, po podpisaniu w 2025 roku podobnego traktatu z Francją. Traktat ten wejdzie w życie po upływie 30 dni od dnia otrzymania późniejszej z notyfikacji, w których Strony poinformują się wzajemnie o wypełnieniu odpowiednich wewnętrznych procedur (ratyfikacyjnych) wymaganych do wejścia w życie tego Traktatu.

Czy każdą ocenę można poprawić? Wątpliwości mają nie tylko uczniowie i rodzice, ale i nauczyciele. Co na to przepisy?

Choć w przestrzeni internetowej rodzice grzmią o tym, że oceny dziecka nie mają dla nich znaczenia, to jednocześnie większość z nich domu przelicza średnią ocen swoich dzieci i zachęca do poprawiania ocen. Trudno się temu dziwić, skoro w polskim systemie edukacji od ocen nadal wiele zależy.

REKLAMA

Obowiązek alimentacyjny w Polsce

Obowiązek alimentacyjny w Polsce polega na zapewnieniu środków utrzymania osobom, które nie mogą zapewnić ich sobie samodzielnie. Obowiązek ten w prawie regulują przepisy Kodeksu rodzinnego i opiekuńczego. Dotyczy on głównie rodziców, dzieci i dziadków, a w niektórych przypadkach także małżonków oraz rodzeństwa.

Ceny paliwa w czwartek. Ile kierowcy zapłacą za benzynę i olej napędowy dzisiaj, 28 maja

W kolejnym obwieszczeniu minister energii określił maksymalne ceny detaliczne benzyny i oleju napędowego obowiązujące w czwartek 28 maja. Czy tym razem paliwo zdrożało? Sprawdzamy!

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA