REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

Polska odpowiedź na ChatGPT: PLLuM - modele językowe AI wyspecjalizowane w języku polskim. Już można korzystać

PLLuM Chat - strona główna
PLLuM - modele językowe wyspecjalizowane w języku polskim już udostępnione. Lepsze od ChatGPT?
Źródło zewnętrzne

REKLAMA

REKLAMA

Staraliśmy się, by polskie modele językowe PLLuM były bezpieczne, dostosowane do języka polskiego i "wytrenowane" na legalnie pozyskanych danych — powiedział PAP dr hab. Szymon Łukasik z NASK, ośrodka zaangażowanego w prace nad opublikowanymi w lutym modelami AI.
rozwiń >

PLLuM - rodzina dużych polskich modeli językowych

PLLuM (Polish Large Language Universal Model) to rodzina dużych polskich modeli językowych. Tego typu programy sztucznej inteligencji (AI) umożliwiają generowanie tekstu oraz przetwarzanie języka naturalnego. Dzięki nim komunikacja z maszyną nie wymaga od użytkownika stosowania sztywnych kodów i mechanicznych poleceń, ale przypominać może dialog z człowiekiem.

W odróżnieniu od komercyjnych modeli LLM (takich jak ChatGPT, Claude czy Gemini), modele PLLuM wyspecjalizowane są w języku polskim, choć do ich trenowania używano również tekstów w innych językach słowiańskich, bałtyckich oraz oczywiście w języku angielskim.

"Model jest dostosowany do języka i kultury polskiej. Prace w ramach tego projektu wspierają zaś polskich ekspertów i rozwój kompetencji w dziedzinie sztucznej inteligencji" — wyjaśnił w rozmowie z PAP uczestnik projektu dr hab. Szymon Łukasik, prof. AGH i dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK. Ośrodek ten ma koordynować teraz prace nad dalszymi pracami i wdrożeniem modeli w prace administracji publicznej — w ramach działań konsorcjum HIVE.

Do doszkalania modeli wykorzystano największy w Polsce, bo liczący 40 tys. interakcji, zbiór zapytań, w tym około 3,5 tys. dłuższych dialogów między tutejszymi trenerami a maszyną. Dzięki tej mrówczej pracy tzw. anotatorów AI ma sobie lepiej radzić ze specyfiką polskiego języka i polskiej kultury.

REKLAMA

Bezpieczeństwo i etyka

Badacz tłumaczy, jak ważne były w ramach prac kwestie bezpieczeństwa i etycznego podejścia do budowy AI. "Filozofią przyświecającą budowie tego modelu było to, żeby kwestie zbierania danych były maksymalnie przejrzyste. Żebyśmy mieli pewność, na jakim polu modele zbudowane z ich użyciem można wykorzystać" — powiedział dr hab. Łukasik. Wskazał, że przedstawiciele projektu zawierali np. umowy z redakcjami i pozyskiwali oficjalne zgody na korzystanie z archiwów polskich tekstów.

PLLuM — jak zapewniają jego twórcy — powstaje zgodnie z krajowymi i unijnymi wytycznymi dotyczącymi sztucznej inteligencji. I uwzględnia aktualne standardy ochrony danych.

30 miliardów tokenów

Ekspert z NASK tłumaczy, że język polski jest językiem o niskich zasobach. A to znaczy, że danych, które można wykorzystać do budowy modeli, nie ma zbyt dużo. Modele PLLuM do użytku komercyjnego są trenowane na ok. 30 miliardach tokenów (token to kawałek przetwarzanego tekstu - np. słowo lub jego fragment); zaś modele do użytku niekomercyjnego – dla takiego celu zasobów jest znacznie więcej – były trenowane na około 150 miliardach.

Wykorzystanie w administracji państwowej

Modele PLLuM docelowo mają być używane w administracji państwowej, a to oznacza kolejne wyzwania związane z bezpieczeństwem. Twórcy projektu musieli zadbać o to, by model stawiał w swoich odpowiedziach granice i by nie padały tam jakieś nielegalne, nieprawdziwe lub kontrowersyjne treści.

PLLuM Chat i PLLuM dla programistów

Modele PLLuM udostępnione są bezpłatnie w formie czatu wszystkim zainteresowanym https://pllum.clarin-pl.eu/. Ministerstwo Cyfryzacji opublikowało też dotąd 18 otwartych wersji modelu PLLuM dla programistów https://huggingface.co/CYFRAGOVPL. Do dyspozycji wszystkich zainteresowanych są więc zarówno lekkie, ale mniej dokładne wersje modeli, które można ściągnąć na laptopa, jak i mocniejsze, ale wymagające wielu kart graficznych modele do bardziej zaawansowanych zastosowań - np. badawczych. W przypadku obu typów istnieje możliwość uruchomienia modeli na własnej infrastrukturze, bez konieczności przekazywania zapytań do podmiotów zewnętrznych.

Dalszy ciąg materiału pod wideo

Generatory - wyspecjalizowane modele RAG-owe

W ramach projektu powstały też generatory, czyli wyspecjalizowane modele RAG-owe (ang. Retrieval Augmented Generation). Dzięki takim modelom można np. przeszukiwać i analizować swoje lokalne bazy danych i tworzyć wirtualnych asystentów analizujących zbiory własnych dokumentów. Zespół PLLuM zbudował najmniejszy (8 mld parametrów) ale wiodący w rankingach dla polskiego języka generator tego typu.

PLLuM i HIVE

Dr Łukasik odniósł się też do zmiany nazwy projektu z PLLuM na HIVE. "Nasze modele nazywają się PLLuM, a ich rodzina będzie dalej rozwijana w ramach konsorcjum HIVE. Chcieliśmy w ten sposób nawiązać do idea współpracy wielu badaczy, inżynierów i instytucji, działających niczym pszczoły w jednym ekosystemie, wymieniając się wiedzą i zasobami (np. danymi, kodem, modelami). Natomiast być może kiedyś będziemy chcieli wypuścić jakąś nową rodzinę modeli - z nową nazwą. Rozmawiamy o tym z Ministerstwem Cyfryzacji" - wskazał dr Łukasik.

Ludwika Tomala (PAP)
lt/ zan/ ktl/

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
Zasada: świadek ustanawia pełnomocnika bez konieczności zgody sądu lub prokuratora - projekt nowelizacji kpk (petycja NRA)

Naczelna Rada Adwokacka proponuje, aby wprowadzić jako zasadę prawo świadków do ustanowienia pełnomocnika, bez wyjątków i konieczności zgody sądu lub prokuratora. Adwokatura skierowała petycje w tej sprawie do prezydenta, rządu i parlamentu, która zawiera projekt nowelizacji kodeksu postępowania karnego.

Komunikat ZUS: Ograniczenia w komunikacji elektronicznej

Zakład Ubezpieczeń Społecznych informuje o ograniczeniach w komunikacji elektronicznej z ZUS.

7 mniej znanych praw osób z niepełnoprawnościami w Polsce

Osoby z niepełnosprawnościami mogą korzystać z szeregu uprawnień. Wiele z nich zależy od stopnia niepełnosprawności czy dodatkowych kryteriów. Tym razem wymieniamy 7 przykładów, o których nie każdy być może pamięta.

Bezpłatna konferencja: Cyfryzacja wymiaru sprawiedliwości - korzyści i wyzwania dla wierzycieli

Już 26 marca w Warszawie odbędzie się bezpłatna konferencja Cyfryzacja wymiaru sprawiedliwości - korzyści i wyzwania dla wierzycieli, której inicjatorem i opiekunem merytorycznym jest Kancelaria Maciej Panfil i Partnerzy. Wydarzenie zgromadzi około 100 uczestników, w tym przedstawicieli biznesu, ekspertów ze środowiska prawniczego, sektora technologicznego oraz reprezentantów instytucji publicznych.

REKLAMA

88-latek oszukany na blisko 1,2 mln zł

Kolejna ofiara oszustwa, tym razem na Podlasiu. 88-latek stracił łącznie blisko 1,2 mln zł, bo uwierzył w szybki zysk z inwestycji. Pieniądze przekazywał w reklamówkach.

Dla nich nie będzie przeliczenia emerytur. Tracą 1000 zł miesiąc w miesiąc. Od lat. ZUS nie poinformował [wyrok TK z 4 czerwca 2024 r.]

Wyrok TK z 4 czerwca 2024 r. daje prawo do dużych pieniędzy emerytom, którym ZUS nawet przez 12 lat (w okresie od 2013 r. w zależności od daty przejścia na emeryturę) pomniejszał miesiąc w miesiąc ich emeryturę. Mówimy o kwotach 1000 zł miesięcznie i stratach na kolejnych waloryzacjach. Żeby to naprawić trzeba od razu (w 2025 r.) podnieść emeryturę o 1000 zł. Niestety ten wyrok daje prawo do podwyżki emerytury o 1000 zł (średnio) i wyrównania około 60 000 zł (średnio) tylko niektórym poszkodowanym emerytom. TK wziął pod swoją ochronę tylko osoby, które były na wcześniejszej emeryturze przed 2013 r. Jeżeli ktoś znalazł się na wcześniejszej emeryturze np. w 2013 r. w 2014 r., to nie podlega ochronie TK. Gdzie jest więc problem? Gdzie jest temat? Emeryci (w 2013 r., 2014 r., 2015 r. itd.) przechodząc na wcześniejszą emeryturę powinnien otrzymać informację o tym, że nie opłaca mu się, gdyż straci on np. 1000 zł za takie przejście. W artykule dwie historie, gdzie strata wynosi 1000 zł miesięcznie. Miesiąc w miesiąc.

Rozliczenie podatku PIT za pomocą karty płatniczej. Uruchomiono możliwość płatności kartą płatniczą zobowiązań podatkowych

Wszyscy podatnicy mogą regulować zobowiązania podatkowe w zakresie rozliczenia PIT w serwisie e-US i w usłudze Twój e-PIT za pomocą karty płatniczej. Podatnicy nie ponoszą dodatkowych opłat z tego tytułu. Usługa działa od 20 marca 2025 r.

Czyste Powietrze w nowej odsłonie, już od kwietnia: Co się zmieni w programie? Jest sporo nowości

Nowa odsłona programu "Czyste Powietrze" rusza z początkiem kwietnia – zapowiedziała dzisiaj minister klimatu Paulina Hennig-Kloska. W programie jest sporo nowości, m.in. obowiązkowy audyt energetyczny przed wykonaniem termomodernizacji, wyższe progi dochodowe czy brak dotacji do kotłów gazowych.

REKLAMA

1000 zł świadczenia rodzicielskiego w 2025 r. Wydłużenie świadczenia rodzicielskiego od 19 marca 2025 r. Nowe przepisy już obowiązują

Świadczenie rodzicielskie w 2025 r. wynosi 1000 zł miesięcznie. Świadczenie rodzicielskie przysługuje rodzicom, którzy nie otrzymują zasiłku macierzyńskiego ani innego świadczenia odpowiadającemu za okres urlopu macierzyńskiego lub urlopu rodzicielskiego. Pobierać je można przez okres od 52 do 71 tygodni w zależności od liczby urodzonych, objętych opieką lub przysposobionych dzieci.

Czynsz, opłaty za śmieci, prąd. Czy w 2025 r. mogę dostać jakieś dodatki? [Przykłady]

Wiele osób boryka się z wysokimi rachunkami, szukając dostępnych form finansowego wsparcia. Prezentujemy kilka przykładowych świadczeń. Jakie kryteria trzeba spełnić w 2025 r.?

REKLAMA