REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

Polska odpowiedź na ChatGPT: PLLuM - modele językowe AI wyspecjalizowane w języku polskim. Już można korzystać

PLLuM Chat - strona główna
PLLuM - modele językowe wyspecjalizowane w języku polskim już udostępnione. Lepsze od ChatGPT?
Źródło zewnętrzne

REKLAMA

REKLAMA

Staraliśmy się, by polskie modele językowe PLLuM były bezpieczne, dostosowane do języka polskiego i "wytrenowane" na legalnie pozyskanych danych — powiedział PAP dr hab. Szymon Łukasik z NASK, ośrodka zaangażowanego w prace nad opublikowanymi w lutym modelami AI.

rozwiń >

PLLuM - rodzina dużych polskich modeli językowych

PLLuM (Polish Large Language Universal Model) to rodzina dużych polskich modeli językowych. Tego typu programy sztucznej inteligencji (AI) umożliwiają generowanie tekstu oraz przetwarzanie języka naturalnego. Dzięki nim komunikacja z maszyną nie wymaga od użytkownika stosowania sztywnych kodów i mechanicznych poleceń, ale przypominać może dialog z człowiekiem.

W odróżnieniu od komercyjnych modeli LLM (takich jak ChatGPT, Claude czy Gemini), modele PLLuM wyspecjalizowane są w języku polskim, choć do ich trenowania używano również tekstów w innych językach słowiańskich, bałtyckich oraz oczywiście w języku angielskim.

"Model jest dostosowany do języka i kultury polskiej. Prace w ramach tego projektu wspierają zaś polskich ekspertów i rozwój kompetencji w dziedzinie sztucznej inteligencji" — wyjaśnił w rozmowie z PAP uczestnik projektu dr hab. Szymon Łukasik, prof. AGH i dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK. Ośrodek ten ma koordynować teraz prace nad dalszymi pracami i wdrożeniem modeli w prace administracji publicznej — w ramach działań konsorcjum HIVE.

Do doszkalania modeli wykorzystano największy w Polsce, bo liczący 40 tys. interakcji, zbiór zapytań, w tym około 3,5 tys. dłuższych dialogów między tutejszymi trenerami a maszyną. Dzięki tej mrówczej pracy tzw. anotatorów AI ma sobie lepiej radzić ze specyfiką polskiego języka i polskiej kultury.

REKLAMA

REKLAMA

Bezpieczeństwo i etyka

Badacz tłumaczy, jak ważne były w ramach prac kwestie bezpieczeństwa i etycznego podejścia do budowy AI. "Filozofią przyświecającą budowie tego modelu było to, żeby kwestie zbierania danych były maksymalnie przejrzyste. Żebyśmy mieli pewność, na jakim polu modele zbudowane z ich użyciem można wykorzystać" — powiedział dr hab. Łukasik. Wskazał, że przedstawiciele projektu zawierali np. umowy z redakcjami i pozyskiwali oficjalne zgody na korzystanie z archiwów polskich tekstów.

PLLuM — jak zapewniają jego twórcy — powstaje zgodnie z krajowymi i unijnymi wytycznymi dotyczącymi sztucznej inteligencji. I uwzględnia aktualne standardy ochrony danych.

30 miliardów tokenów

Ekspert z NASK tłumaczy, że język polski jest językiem o niskich zasobach. A to znaczy, że danych, które można wykorzystać do budowy modeli, nie ma zbyt dużo. Modele PLLuM do użytku komercyjnego są trenowane na ok. 30 miliardach tokenów (token to kawałek przetwarzanego tekstu - np. słowo lub jego fragment); zaś modele do użytku niekomercyjnego – dla takiego celu zasobów jest znacznie więcej – były trenowane na około 150 miliardach.

Wykorzystanie w administracji państwowej

Modele PLLuM docelowo mają być używane w administracji państwowej, a to oznacza kolejne wyzwania związane z bezpieczeństwem. Twórcy projektu musieli zadbać o to, by model stawiał w swoich odpowiedziach granice i by nie padały tam jakieś nielegalne, nieprawdziwe lub kontrowersyjne treści.

REKLAMA

PLLuM Chat i PLLuM dla programistów

Modele PLLuM udostępnione są bezpłatnie w formie czatu wszystkim zainteresowanym https://pllum.clarin-pl.eu/. Ministerstwo Cyfryzacji opublikowało też dotąd 18 otwartych wersji modelu PLLuM dla programistów https://huggingface.co/CYFRAGOVPL. Do dyspozycji wszystkich zainteresowanych są więc zarówno lekkie, ale mniej dokładne wersje modeli, które można ściągnąć na laptopa, jak i mocniejsze, ale wymagające wielu kart graficznych modele do bardziej zaawansowanych zastosowań - np. badawczych. W przypadku obu typów istnieje możliwość uruchomienia modeli na własnej infrastrukturze, bez konieczności przekazywania zapytań do podmiotów zewnętrznych.

Dalszy ciąg materiału pod wideo

Generatory - wyspecjalizowane modele RAG-owe

W ramach projektu powstały też generatory, czyli wyspecjalizowane modele RAG-owe (ang. Retrieval Augmented Generation). Dzięki takim modelom można np. przeszukiwać i analizować swoje lokalne bazy danych i tworzyć wirtualnych asystentów analizujących zbiory własnych dokumentów. Zespół PLLuM zbudował najmniejszy (8 mld parametrów) ale wiodący w rankingach dla polskiego języka generator tego typu.

PLLuM i HIVE

Dr Łukasik odniósł się też do zmiany nazwy projektu z PLLuM na HIVE. "Nasze modele nazywają się PLLuM, a ich rodzina będzie dalej rozwijana w ramach konsorcjum HIVE. Chcieliśmy w ten sposób nawiązać do idea współpracy wielu badaczy, inżynierów i instytucji, działających niczym pszczoły w jednym ekosystemie, wymieniając się wiedzą i zasobami (np. danymi, kodem, modelami). Natomiast być może kiedyś będziemy chcieli wypuścić jakąś nową rodzinę modeli - z nową nazwą. Rozmawiamy o tym z Ministerstwem Cyfryzacji" - wskazał dr Łukasik.

Ludwika Tomala (PAP)
lt/ zan/ ktl/

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Jak jest ustalany WIBOR. GPW Benchmark: Metoda Kaskady Danych jest zgodna z rozporządzeniem BMR [sprostowanie]

Zdaniem GPW Benchmark S.A., rozporządzenie BMR wprost dopuszcza tworzenie reprezentatywnych wskaźników referencyjnych z udziałem banków jako podmiotów przekazujących dane. Metoda Kaskady Danych jest zgodna z Załącznikiem I do Rozporządzenia BMR i art. 11 BMR, co zostało już wielokrotnie potwierdzone w toku czynności nadzorczych dokonanych przez właściwy organ.

Pracodawcy nie chcą wyrównywać dodatku stażowego, a pracownicy tracą należne im pieniądze. Skąd te wątpliwości?

Przepisy się zmieniły, pracownikom przysługują pieniądze, ale pracodawcy nie chcą ich wypłacać. Regionalne izby obrachunkowe nie mają wątpliwości i wydają wyjaśnienia korzystne dla pracowników. Na czym polega problem?

Czy w czwartek wzrosną ceny paliwa? Minister energii określił ceny maksymalne benzyny i diesla na 18 czerwca

Minister energii ogłosił maksymalne ceny detaliczne benzyny i oleju napędowego, które będą obowiązywać w dniu 18 czerwca. Ile kierowcy zapłacą za paliwo w czwartek? Czy ceny na stacjach benzynowych spadną?

Świadczenie wspierające. Ważny apel do osób z niepełnosprawnościami

Pełnomocniczka rządu ostrzega osoby z niepełnosprawnościami przed nieuczciwymi ofertami dotyczącymi świadczenia wspierającego. Pośrednicy żądają wysokich opłat za pomoc, a niektórzy obiecują nawet pewne uzyskanie punktów. Na co trzeba szczególnie uważać?

REKLAMA

5000 zł kary za odmowę otwarcia drzwi. Obce osoby legalnie wejdą do mieszkania. Nowe przepisy uderzą w lokatorów?

Masz obowiązek wpuścić zarządcę lub właściciela do mieszkania - w przeciwnym razie grozi Ci gigantyczna grzywna. Ministerstwo pracuje nad nowelizacją przepisów, która ma zlikwidować problem tzw. "dzikich lokatorów" oraz blokowania kontroli technicznych. Nowe uprawnienia budzą jednak potężne kontrowersje i opór Rzecznika Praw Obywatelskich. Czy to koniec prawa do prywatności w polskich realiach?

W 2027 duża nowelizacja zamówień publicznych. Dziś jednolita wersja ustawy [Dz.U. poz. 793]

Pod koniec roku powinien zostać skierowany do Sejmu projekt ustawy reformującej zamówienia publiczne. Mają być wyższe wpisy od odwołań, aby zachęcić wykonawców do spierania się tylko wtedy, gdy ich zarzuty są zasadne. Zmieniona będzie instytucja "rażąco niskiej ceny". Interpretacje przepisów i orzecznictwo będą ujednolicone. Nastąpi dalsza elektronizacja zamówień. Warto zwrócić uwagę na pojawienie się wreszcie jednolitej wersji ustawy o zamówieniach publicznych - wreszcie łatwiej będzie przedsiębiorcom, samorządom i administracji pracować z tą ustawą.

Można kupić używane mieszkanie na kredyt bez wkładu własnego. Tak działa RKM. Aktualne limity ceny 1 m2 mieszkania

Jaką kwotę trzeba dziś mieć aby starczyło na wkład własny przy kredycie mieszkaniowym? To oczywiście zależy zarówno od ceny kupowanego lokum, jak i wymagań danego banku. Załóżmy, że para chce kupić używany lokal o powierzchni 50 mkw. z minimalnym wkładem wynoszącym 10%. Dane GUS pokazują, że średnia ogólnopolska cena takiego mieszkania wynosi około 7500 zł/mkw. (w kilku miastach jest oczywiście dużo drożej). Przy tych założeniach otrzymujemy kwotę minimalnego wkładu własnego na poziomie 37 500 zł. To niemało - zwłaszcza dla osób płacących sporo za najem. Warto jednak pamiętać, że w dalszym ciągu działa rządowy program Rodzinny Kredyt Mieszkaniowy, który daje możliwość zaciągnięcia kredytu mieszkaniowego na 100% ceny mieszkania i to z państwową gwarancją, którą realizuje BGK. Ten Program obejmuje również wtórny rynek mieszkań.

Karty mobilizacyjne trafiają do Polaków. Nieodebranie listu z WCR to poważny błąd

Do skrzynek pocztowych w całym kraju trafiają oficjalne pisma z Wojskowych Centrów Rekrutacji. Kolorowy pasek na dokumencie i pieczątka WCR potrafią wywołać niepokój. Czy to oznacza wezwanie na front? Wyjaśniamy, czym są karty mobilizacyjne w 2026 roku, dlaczego unikanie listonosza nic nie da, jak odwołać się od decyzji wojska i jakie kary grożą za ignorowanie przepisów.

REKLAMA

30 tys. zł za mieszkanie TBS/SIM? Rząd chce obniżyć limit partycypacji do 10% kosztów budowy

Wymóg posiadania dużego wkładu własnego przy kredycie hipotecznym to jedna z największych barier mieszkaniowych dla młodych Polaków. Tym bardziej w sytuacji, gdy po opłaceniu czynszu, kosztów eksploatacji mieszkania oraz innych codziennych wydatków (choćby żywności), co miesiąc pozostaje w portfelu niewielka kwota. To wcale nie jest nowa sytuacja. Od połowy lat 90. receptą na problemy mieszkaniowe rodaków miały być towarzystwa budownictwa społecznego (TBS), które stosunkowo niedawno przemianowano na społeczne inicjatywy mieszkaniowe (SIM). Wzrosty kosztów budowy lokali z ostatnich lat wyeksponowały jednak problem, który był widoczny już wcześniej. Mianowicie, partycypacja wnoszona przez nowego najemcę SIM/TBS jest relatywnie wysoka. Aktualnie taka partycypacja wynosi 60 000 zł - 100 000 zł. Rząd chce zmienić tę sytuację. Planom resortu rozwoju i technologii przygląda się Leszek Markiewicz, warszawski agent nieruchomości. Warto wiedzieć że agenci nieruchomości też mają do czynienia z systemem TBS-ów.

Jeden dzień może uratować prawo nauczyciela do trzynastki. Warto to wiedzieć przed zakończeniem zajęć dydaktycznych

Czy nauczyciel może otrzymać trzynastkę, mimo nieprzepracowania w trakcie roku 6 miesięcy? Okazuje się, że jest na to prosty sposób, jednak nie każdy o tym wie i wiele osób traci na tym finansowo. Warto przed zakończeniem roku szkolnego 2025/2026 zapoznać się z obowiązującymi przepisami.

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA