REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

REKLAMA

 

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Ważny komunikat RCB dla wszystkich właścicieli domów i zarządców nieruchomości – niedopełnienie tego obowiązku grozi poważnym niebezpieczeństwem i odpowiedzialnością karną

W związku występującymi w ostatnich dniach intensywnymi opadami śniegu w wielu częściach kraju – RCB wydało komunikat, w którym przypomina o ważnym obowiązku wszystkich właścicieli domów (jak również budynków niemieszkalnych) oraz zarządców nieruchomości. Nie wszyscy o tym pamiętają, a niezastosowanie się do zaleceń stwarza poważne zagrożenie dla osób znajdujących się wewnątrz budynku, jak i jego otoczeniu oraz może skutkować odpowiedzialnością karną.

Mandat nawet 3000 zł za nieodśnieżone auto. Zimowe wykroczenia kierowców i punkty karne w 2026 roku

Mróz, śnieg i poranny pośpiech to złe połączenie. Zimą wielu kierowców skupia się na tym, by jak najszybciej ruszyć spod domu, nie zdając sobie sprawy, że kilka minut zaoszczędzonego czasu, może kosztować nie tylko wysoki mandat, ale też sporą liczbę punktów karnych. Policja przypomina: zimą kontrola często zaczyna się jeszcze na parkingu pod blokiem.

5 ważnych praw osób z niepełnosprawnościami w 2026 roku [LISTA]

Wszystkie prawa osób z niepełnosprawnościami są ważne. My wybraliśmy pięć przykładowych, o których warto pamiętać w 2026 roku. Kto może z nich korzystać? Jakie orzeczenie jest wymagane? Czy trzeba spełnić dodatkowe warunki? Odpowiadamy!

Były mąż sprzedał auto – samotna matka płaci 16 tys. zł kary za brak OC!

Stan faktyczny jest taki: samotna matka po rozwodzie, bez pracy, opiekująca się dzieckiem, dostaje rachunek na ponad 16 tys. zł za brak OC w samochodzie, którego nie posiada od lat. Okazuje się, że to były mąż sprzedał pojazd potajemnie, nie zgłosił tego nigdzie, a Ubezpieczeniowy Fundusz Gwarancyjny (UFG) ściga właśnie ją. Rzecznik Praw Obywatelskich prowadzi interwencję w tej bulwersującej sprawie.

REKLAMA

Stażowe 2026: nowe przepisy i zaświadczenia [komunikat ZUS]. Do stażu pracy można doliczyć inne okresy niż zatrudnienie na umowę o pracę

Zakład Ubezpieczeń Społecznych informuje, że od 1 stycznia 2026 r. osoby zatrudnione będą mogły doliczyć do stażu pracy okresy inne niż zatrudnienie na podstawie umowy o pracę. Nowe przepisy będą miały zastosowanie: od 1 stycznia 2026 r. do pracodawców będących jednostkami sektora finansów publicznych, natomiast od 1 maja 2026 r. – do pozostałych pracodawców.

Córka odrzuciła spadek, a i tak „dostała” długi. Co poszło nie tak? Głośna sprawa [SPADKI I DŁUGI: PORADNIK 2026]

W polskim prawie spadkowym wciąż zdarzają się sytuacje budzące gorące dyskusje. Jedna z nich dotyczy tego, że sąd stwierdził nabycie spadku przez córkę, chociaż ta wcześniej spadek odrzuciła. Efekt? Wierzyciele zaczęli dochodzić należności z długów matki. Sprawa trafiła do Rzecznika Praw Obywatelskich, który złożył skargę nadzwyczajną wskazując rażące naruszenia prawa. Wyjaśniamy przepisy, orzecznictwo, pułapki terminów i podpowiadamy, jak nie odziedziczyć długu w 2026 r.— także gdy w grę wchodzi małoletnie dziecko.

Koniec z awizo od listonosza? Wielka zmiana w kontakcie z urzędami właśnie weszła w życie

Od 1 stycznia 2026 roku e-Doręczenia stały się obowiązkowym sposobem komunikacji urzędów z obywatelami i firmami. To koniec ery papierowych listów poleconych i awizo w skrzynce. Ale co jeśli nie masz jeszcze skrzynki do e-Doręczeń? Czy grożą Ci jakieś konsekwencje? I jak szybko założyć adres? Wyjaśniamy krok po kroku – również dla przedsiębiorców, którzy mają różne terminy obowiązku założenia skrzynki do e-Doręczeń.

Komornik nie ściągnie już długów z emerytury czy renty – „obecne przepisy są formą dyskryminacji osób starszych, schorowanych, czyli jednej z najsłabszych grup społecznych”? Sprawą zajmuje się MRPiPS

W związku z dużą dysproporcją w zakresie wysokości kwoty wolnej od potrąceń pomiędzy świadczeniami emerytalno-rentowymi, a wynagrodzeniem za pracę – do Sejmu trafił postulat zmiany przepisów w taki sposób, aby dla każdego obywatela, kwota wolna od zajęcia komorniczego wynosiła tyle samo. Sejmowe BEOS uznało, że konsekwencją wprowadzenia powyższej zmiany byłoby to, że – „przeważająca większość emerytów i rencistów ze względu na wysokość pobieranych przez nich świadczeń nie podlegałaby egzekucji należności, do których uiszczenia są zobowiązani”, jednak pomimo tego – posłowie zdecydowali się skierować sprawę do MRPiPS.

REKLAMA

Nie przepracowałeś całego roku? Nic nie szkodzi i tak możesz dostać trzynastkę! Wielu pracowników nadal nie korzysta z tego sposobu

Po rozpoczęciu nowego roku kalendarzowego pracownicy sfery budżetowej niecierpliwie czekają na wypłatę dodatkowego wynagrodzenia rocznego, tzw. trzynastki. Niestety nie każdy ją dostanie, bo obowiązujące przepisy stawiają pracownikom określone wymagania.

Zmiany od 1 stycznia 2026 r.: wolne piątki i dodatkowe 13 dni urlopu. Pracodawcy mogą wybrać dogodne rozwiązanie. Kto się załapie?

Skrócony czas pracy staje się właśnie rzeczywistością dla tysięcy pracowników. Od 1 stycznia 2026 roku rusza testowanie pilotażowego programu MRPiPS. To oznacza wolne piątki, krótszy czas pracy lub dodatkowy urlop – pracodawcy będą mieli kilka modeli do wyboru. Jeśli program się sprawdzi, może zostać zastosowany ogólnokrajowo.

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA