REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

REKLAMA

 

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
ZUS dla osób z niepełnosprawnościami. Orzeczenia, świadczenia i zmiany planowane na 2026 rok

Osoby z niepełnosprawnościami mogą z Zakładu Ubezpieczeń Społecznych otrzymywać różnego rodzaju świadczenia takie jak renty, dodatki i inne. Jakie kryteria trzeba spełnić? Kto może uzyskać? Co może się zmienić w 2026 roku? Prezentujemy najważniejsze przepisy i kwoty.

500 zł, 1300 zł, 1700 zł, czy 2333 zł dla każdego dorosłego? Ile ostatecznie będzie wynosił bezwarunkowy dochód podstawowy?

Powraca temat bezwarunkowego dochodu podstawowego. Jednak od początku dyskusji o tym rozwiązaniu kwoty, które padają bardzo się od siebie różnią. Jak to więc ostatecznie będzie? Nad jakim rozwiązaniem toczą się prace?

Osoby niepełnosprawne wprost pytają PZON i WZON: Dlaczego nam to robicie?

PZON: Przez 3 lata niepełnosprawności świadczenie pielęgnacyjne. I nagle w 2025 r. cudowne ozdrowienie. Stan zdrowia bez zmian osoby niepełnosprawnej, ale orzeczenie o niepełnosprawności zmienia się. W mojej ocenie (być może mylnej) narasta problem „cudownych” ozdrowień dzieci i młodych ludzi obciążonych zespołem Aspergera. To samo dotyczy autyzmu. Chodzi o to, że PZON zmieniły praktykę orzeczniczą. Przy niezmienionym stanie zdrowia 10-latek otrzymywał za okres 2022 r. - 2025 r. pkt 7 i 8. Dziś otrzymuje tylko pkt 8. W przypadku osób pełnoletnich następuje zmiana stopnia znacznego na umiarkowany.

Czy osoby niewidome mają obniżane świadczenie wspierające?

Do redakcji Infor.pl piszą listy osoby niepełnosprawne, które uważają, że we WZON zaniżono im punkty w procedurze przyznawania świadczenia wspierającego.

REKLAMA

Jakich zwierząt nie wolno hodować?

Coraz więcej osób interesuje się hodowlą zwierząt niebezpiecznych. Z pewnością sprzyja temu charakter obecnych czasów, kiedy to coraz trudniej jest komukolwiek czymś zaimponować z uwagi na wszechobecny dostęp do rozmaitych, luksusowych dóbr. Posiadanie więc małpy, niedźwiedzia, czy lwa, wydaje się dla wielu imponujące i przyciąga mnóstwo obserwatorów w social mediach. Warto wiedzieć, że droga do posiadania pewnych zwierząt nie jest łatwa, a czasem nawet niemożliwa.

Trzynastka dla nowej grupy pracowników. 1/12 wynagrodzenia rocznego. Projekt jest w Sejmie, a kiedy będą pieniądze?

Czy kolejna grupa pracowników dostanie trzynaste wynagrodzenie? Miałaby to być 1/12 wynagrodzenia rocznego. To nie jest pierwszy raz, gdy mówi się o konieczności wprowadzenia tych przepisów. Od kiedy można liczyć na pieniądze?

Od stycznia 2025 roku już 600 plus na dentystę. Dla każdego, kto opłaca składkę zdrowotną. Ale czy wiesz, jak skorzystać?

Od stycznia 2025 roku koszyk świadczeń stomatologicznych dostępnych w ramach NFZ uległ zmianie na lepsze. Od tego dnia każdy, kto opłaca składkę zdrowotną, może liczyć na 600 plus na dentystę. Czy to się zmieni w 2026 roku?

Czy można odmówić chrztu dziecku poczętemu dzięki in vitro?

Czy można odmówić chrztu dziecku poczętemu dzięki in vitro? Czy osoba w związku homoseksualnym może być chrzestnym? Czyw księdze chrztu mogą być wpisane dwie kobiety?

REKLAMA

Nowe zasady kontroli zwolnień lekarskich. Reforma orzecznictwa lekarskiego w ZUS

Sejm pracuje nad projektem nowelizacji ustawy dotyczącym reformy orzecznictwa lekarskiego w ZUS. Regulacja zakłada m.in. ujednolicenie zasad kontroli zwolnień lekarskich, podwyżki dla lekarzy orzeczników, doprecyzowuje także sytuacje, w których można stracić zasiłek chorobowy. Projekt został przygotowany przez Ministerstwo Rodziny, Pracy i Polityki Społeczne.

PILNE: od 19.11.2025 do 28.02.2026 r. całodobowe dyżury we wskazanych urzędach, a osoby wyznaczone do wykonywania zadań ochronny wyposażone w broń i amunicję. Weszło w życie zarządzenie premiera wprowadzające trzeci stopień alarmowy

Zarządzeniem wydanym w dniu 19 listopada 2025 r. premier Donald Tusk wprowadził trzeci stopień alarmowy CHARLIE. Obejmuje on obszary linii kolejowych zarządzanych przez PKP Polskie Linie Kolejowe S.A. oraz PKP Linia Hutnicza Szerokotorowa Sp. z o.o. i będzie obowiązywał w okresie od dnia 19 listopada 2025 r., od godz. 00.00, do dnia 28 lutego 2026 r., do godz. 23.59. Sprawdź, co poszczególne alarmy, oznaczają dla urzędów administracji publicznej i dla obywateli naszego kraju.

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA