REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

Polska odpowiedź na ChatGPT: PLLuM - modele językowe AI wyspecjalizowane w języku polskim. Już można korzystać

PLLuM Chat - strona główna
PLLuM - modele językowe wyspecjalizowane w języku polskim już udostępnione. Lepsze od ChatGPT?
Źródło zewnętrzne

REKLAMA

REKLAMA

Staraliśmy się, by polskie modele językowe PLLuM były bezpieczne, dostosowane do języka polskiego i "wytrenowane" na legalnie pozyskanych danych — powiedział PAP dr hab. Szymon Łukasik z NASK, ośrodka zaangażowanego w prace nad opublikowanymi w lutym modelami AI.

rozwiń >

PLLuM - rodzina dużych polskich modeli językowych

PLLuM (Polish Large Language Universal Model) to rodzina dużych polskich modeli językowych. Tego typu programy sztucznej inteligencji (AI) umożliwiają generowanie tekstu oraz przetwarzanie języka naturalnego. Dzięki nim komunikacja z maszyną nie wymaga od użytkownika stosowania sztywnych kodów i mechanicznych poleceń, ale przypominać może dialog z człowiekiem.

W odróżnieniu od komercyjnych modeli LLM (takich jak ChatGPT, Claude czy Gemini), modele PLLuM wyspecjalizowane są w języku polskim, choć do ich trenowania używano również tekstów w innych językach słowiańskich, bałtyckich oraz oczywiście w języku angielskim.

"Model jest dostosowany do języka i kultury polskiej. Prace w ramach tego projektu wspierają zaś polskich ekspertów i rozwój kompetencji w dziedzinie sztucznej inteligencji" — wyjaśnił w rozmowie z PAP uczestnik projektu dr hab. Szymon Łukasik, prof. AGH i dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK. Ośrodek ten ma koordynować teraz prace nad dalszymi pracami i wdrożeniem modeli w prace administracji publicznej — w ramach działań konsorcjum HIVE.

Do doszkalania modeli wykorzystano największy w Polsce, bo liczący 40 tys. interakcji, zbiór zapytań, w tym około 3,5 tys. dłuższych dialogów między tutejszymi trenerami a maszyną. Dzięki tej mrówczej pracy tzw. anotatorów AI ma sobie lepiej radzić ze specyfiką polskiego języka i polskiej kultury.

REKLAMA

REKLAMA

Bezpieczeństwo i etyka

Badacz tłumaczy, jak ważne były w ramach prac kwestie bezpieczeństwa i etycznego podejścia do budowy AI. "Filozofią przyświecającą budowie tego modelu było to, żeby kwestie zbierania danych były maksymalnie przejrzyste. Żebyśmy mieli pewność, na jakim polu modele zbudowane z ich użyciem można wykorzystać" — powiedział dr hab. Łukasik. Wskazał, że przedstawiciele projektu zawierali np. umowy z redakcjami i pozyskiwali oficjalne zgody na korzystanie z archiwów polskich tekstów.

PLLuM — jak zapewniają jego twórcy — powstaje zgodnie z krajowymi i unijnymi wytycznymi dotyczącymi sztucznej inteligencji. I uwzględnia aktualne standardy ochrony danych.

30 miliardów tokenów

Ekspert z NASK tłumaczy, że język polski jest językiem o niskich zasobach. A to znaczy, że danych, które można wykorzystać do budowy modeli, nie ma zbyt dużo. Modele PLLuM do użytku komercyjnego są trenowane na ok. 30 miliardach tokenów (token to kawałek przetwarzanego tekstu - np. słowo lub jego fragment); zaś modele do użytku niekomercyjnego – dla takiego celu zasobów jest znacznie więcej – były trenowane na około 150 miliardach.

Wykorzystanie w administracji państwowej

Modele PLLuM docelowo mają być używane w administracji państwowej, a to oznacza kolejne wyzwania związane z bezpieczeństwem. Twórcy projektu musieli zadbać o to, by model stawiał w swoich odpowiedziach granice i by nie padały tam jakieś nielegalne, nieprawdziwe lub kontrowersyjne treści.

REKLAMA

PLLuM Chat i PLLuM dla programistów

Modele PLLuM udostępnione są bezpłatnie w formie czatu wszystkim zainteresowanym https://pllum.clarin-pl.eu/. Ministerstwo Cyfryzacji opublikowało też dotąd 18 otwartych wersji modelu PLLuM dla programistów https://huggingface.co/CYFRAGOVPL. Do dyspozycji wszystkich zainteresowanych są więc zarówno lekkie, ale mniej dokładne wersje modeli, które można ściągnąć na laptopa, jak i mocniejsze, ale wymagające wielu kart graficznych modele do bardziej zaawansowanych zastosowań - np. badawczych. W przypadku obu typów istnieje możliwość uruchomienia modeli na własnej infrastrukturze, bez konieczności przekazywania zapytań do podmiotów zewnętrznych.

Dalszy ciąg materiału pod wideo

Generatory - wyspecjalizowane modele RAG-owe

W ramach projektu powstały też generatory, czyli wyspecjalizowane modele RAG-owe (ang. Retrieval Augmented Generation). Dzięki takim modelom można np. przeszukiwać i analizować swoje lokalne bazy danych i tworzyć wirtualnych asystentów analizujących zbiory własnych dokumentów. Zespół PLLuM zbudował najmniejszy (8 mld parametrów) ale wiodący w rankingach dla polskiego języka generator tego typu.

PLLuM i HIVE

Dr Łukasik odniósł się też do zmiany nazwy projektu z PLLuM na HIVE. "Nasze modele nazywają się PLLuM, a ich rodzina będzie dalej rozwijana w ramach konsorcjum HIVE. Chcieliśmy w ten sposób nawiązać do idea współpracy wielu badaczy, inżynierów i instytucji, działających niczym pszczoły w jednym ekosystemie, wymieniając się wiedzą i zasobami (np. danymi, kodem, modelami). Natomiast być może kiedyś będziemy chcieli wypuścić jakąś nową rodzinę modeli - z nową nazwą. Rozmawiamy o tym z Ministerstwem Cyfryzacji" - wskazał dr Łukasik.

Ludwika Tomala (PAP)
lt/ zan/ ktl/

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Zwolnienia lekarskie na przełomie roku: jak prawidłowo rozliczać wynagrodzenie i zasiłek chorobowy? Jak długo można być na L4? Limit 14 czy 33 dni? [przykłady z praktyki]

Wielkimi krokami zbliża się koniec 2025 roku ale sezon zwiększonej zachorowalności już trwa. Chłodniejsze dni, zmienna pogoda oraz wzrost infekcji wirusowych sprawiają, że w wielu firmach rośnie liczba pracowników korzystających ze zwolnień lekarskich. Przełom roku to jednak specyficzny moment, który rodzi wiele pytań dotyczących prawidłowego rozliczenia wynagrodzenia chorobowego, zasiłku chorobowego oraz liczenia okresu zasiłkowego.

Ustawa o rynku kryptoaktywów – dlaczego musimy ją przyjąć i dlaczego nie w kształcie sprzed weta Prezydenta? Czy ustawą można zwalczyć oszustwa? Wyjaśnia adwokat

Rynek kryptoaktywów znajduje się dziś w punkcie zwrotnym, w którym unijne regulacje spotykają się z krajową praktyką legislacyjną i realnymi interesami przedsiębiorców oraz obywateli. Jako adwokat zajmujący się prawem nowych technologii i regulacjami finansowymi obserwuję ten proces nie przez pryzmat sporów politycznych, lecz przez skutki prawne, gospodarcze i systemowe, jakie niesie dla rynku i państwa.

Komunikat ZUS: Od 2026 r. nowy tytuł ubezpieczeń - 24 00. Marynarze będą mogli samodzielnie opłacać wszystkie składki. Jest możliwość wstecznego zapłacenia składek za lata 2021-2025

Od nowego roku wejdą w życie przepisy, które uregulują opłacanie składek na ubezpieczenia społeczne i zdrowotne przez marynarzy. Oznacza to utworzenie nowego tytułu do ubezpieczeń – 24 00. Dzięki temu marynarze, bez względu na banderę statku, będą mogli samodzielnie opłacać składki jako płatnicy. Nowe rozwiązania obejmą zarówno osoby, które pływają pod banderą państw trzecich, jak i tych zatrudnionych w krajach UE i EFTA. To krok, który ma uporządkować dotychczasowe zasady i ułatwić marynarzom dostęp do świadczeń emerytalno-rentowych i zdrowotnych. Z nowych regulacji skorzystać będzie mogło blisko 18 tys. osób.

Kupując nieruchomość możesz nie uchronić się przed długami zbywcy, nawet jeżeli sprawdziłeś księgę wieczystą. Komornik dopisze kolejnych wierzycieli i zlicytuje nowy dobytek

Pułapkę, w jaką można wpaść nabywając nieruchomość, pokazuje sprawa jednej z mieszkanek Poznania, która kupiła dom obciążony długami zbywcy nieruchomości, nie będąc świadoma tych długów, ponieważ nie były one ujawnione w księdze wieczystej nieruchomości. Teraz dom zlicytuje komornik, ponieważ ustawodawca pozostawił do tego „furtkę”.

REKLAMA

Listonosz już nie zapuka i nie zostawi awizo? Od stycznia rewolucja w kontakcie z urzędami i doręczeniach listów!

Od 1 stycznia 2026 roku papierowe listy z urzędów będą rzadkością. Ministerstwo Cyfryzacji ogłosiło, że e-Doręczenia staną się podstawowym kanałem komunikacji podmiotów publicznych. Co to oznacza dla milionów Polaków i dlaczego warto działać już teraz?

Czy można podpisać umowę o pracę od 1 stycznia? Jak nie wpaść w kłopoty, gdy pierwszy dzień miesiąca to święto

Jak prawidłowo zawrzeć umowę o pracę? Czasami jeden dzień nie robi różnicy, ale w niektórych przypadkach może mieć z punktu widzenia pracownika duże znaczenie, choćby pod kątem zachowania ciągłości pracy. Jak więc postąpić, gdy pierwszym dniem miesiąca jest święto?

UOKiK: Play ma zapłacić ponad 108 mln zł kary za zabieranie klientom po 5 zł! Ponadto Prezes Tomasz Chróstny decyzją nakazuje Playowi zwrot pieniędzy klientom za nielegalne odbieranie rabatów - możesz odzyskać stracone zniżki!

Operator sieci Play musi zapłacić rekordową karę ponad 108 milionów złotych za stosowanie nieuczciwych praktyk wobec konsumentów. Prezes UOKiK uznał, że mechanizm odbierania rabatu za e-fakturę przy opóźnieniu w płatności to nielegalna kara umowna. Co więcej, firma będzie musiała zwrócić pieniądze wszystkim poszkodowanym klientom. Sprawdź, czy należy Ci się zwrot.

RPO i UOKiK: Szokujące 9861 zł (3287 zł×3) opłaty za przyznanie świadczenia pielęgnacyjnego. To i tak lepiej niż 25 000 zł przy świadczeniu wspierającym. Płacą niepełnosprawni

Od miesięcy osoby niepełnosprawne informują o pobieraniu wysokich prowizji za wykonanie zadań pełnomocnika w postępowaniu o przyznaniu punktów poziomu potrzeby wsparcia (WZON) oraz przyznaniu świadczenia wspierającego (ZUS). Opłata pobierana od osób niepełnosprawnych z największymi deficytami w niesamodzielności może wynosić nawet równowartość świadczenia za 6 miesięcy. Powszechnie takie opłaty są traktowane jako naruszające zasady współżycia społecznego. Przy maksymalnej wysokości świadczenia wspierającego opłata "za załatwienie sprawy" może więc wynosić 4134 x 6 = 24 804 zł. Okazuje się, że podobne opłaty w wymiarze 3 miesięcy - 6 miesięcy są także za przyznanie świadczenia pielęgnacyjnego np. 9861 zł (3287 zł×3 miesiące).

REKLAMA

Nowe prawo w rękach spadkobierców. Kogo dotyczą planowane zmiany?

Stwierdzenie nabycia spadku stanowi ważny dokument potwierdzający prawa spadkobiercy. Co jednak w sytuacji, gdy w obrocie prawnym pojawi się kilka takich dokumentów? Takie sytuacje się zdarzają i stanowią nie lada problem dla rodziny zmarłego. Czy nowe przepisy poprawią sytuację spadkobierców?

Weekendowe spotkania z dzieckiem to nie jest wykonywanie władzy rodzicielskiej. Organy podatkowe prezentują jednolite stanowisko

Ulga na dziecko, inaczej ulga prorodzinna, to najczęściej wykorzystywana preferencja podatkowa w PIT. Jednak czy każdy rodzic może z niej skorzystać? Organy podatkowe nie mają wątpliwości – nie wystarczy płacić alimentów.

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA