REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

REKLAMA

 

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Ustawa frankowa w Sejmie. Co się zmieni w sytuacji prawnej frankowiczów? Zyskają konsumenci, stracą kancelarie

Obserwuję z uwagą to co dzieje się w świecie finansów. Czasem w pewnej odległości od tego, co jest na co dzień moją pracą. Patrzę też na to, co dzieje się z kredytami hipotecznymi we frankach. Nie jest tajemnicą, że od początku byłem w sprawie tych „frankowych” kredytów daleki od przesądzania, że winne problemów kredytobiorców są jedynie banki. Nie wierzę (i wiem co piszę), że wszyscy kredytobiorcy nie wiedzieli, co podpisują. Był jednak wyrok TSUE i sądy (według mnie bezrefleksyjnie) doprowadzają do unieważniania umów. To nie powoduje, że zmieniam zdanie, ale walczyć z wiatrakami nie będę.

Od 50 gr do 1 zł za butelkę po wodzie czy puszkę po napoju. Jak wygląda oznaczenie systemu kaucyjnego na opakowaniu. Trwa okres przejściowy

Od października 2025 r. działa w Polsce system kaucyjny. Za jedną butelkę można otrzymać zwrot od 50 gr do 1 zł. Szukaj znaku systemu kaucyjnego na butelce lub puszce. To się opłaca. Jak wygląda ten znak? Gdzie zwrócić opakowanie? Trwa okres przejściowy.

O okazjonalną pracę zdalną można wnioskować nawet wtedy, gdy nie przewiduje tego regulamin. Jakie są zasady?

Czy można wnioskować o pracę zdalną, gdy regulamin obowiązujący w firmie nie przewiduje takiej możliwości? O okazjonalną pracę zdalną może wnioskować każdy, ale czy pracodawca musi uwzględnić taki wniosek?

Czy pracodawca może wyznaczyć termin urlopu dla pracownika? Odpowiedź na to pytanie wcale nie jest oczywista

Już niedługo rozpocznie się nowy rok kalendarzowy, co oznacza, że trzeba będzie przyjrzeć się temu, jak przedstawia się stan urlopów wypoczynkowych przysługujących pracownikom i zaplanować terminy ich wykorzystania. Jak zrobić to prawidłowo?

REKLAMA

Epopeja frankowa: sąd zasądza 89 tys. zł z odsetkami - po 11 latach w sądach wszystkich instancji. Bank musi oddać wszystkie wpłacone raty

W dniu 18 listopada 2025 r. Sąd Apelacyjny w Warszawie ogłosił wyrok w sprawie rozpoznawanej z udziałem Rzecznika Finansowego. Sprawa była ponownie rozpoznawana po tym, jak Sąd Najwyższy uchylił wcześniejsze rozstrzygnięcie Sądu Apelacyjnego wskutek skargi kasacyjnej powodów. Stosowane przez bank klauzule walutowe i indeksacyjne były abuzywne i prowadziły do nieważności całej umowy – uznał Sąd Apelacyjny. Wyrok zapadł jedenastoletnim sporze sądowym, w którym po stronie klientów wystąpili Rzecznik Finansowy i Rzecznik Praw Obywatelskich. Dzięki temu na konta kredytobiorców trafi ponad 89 tys. zł (tj. suma wpłaconych bankowy rat odsetkowo-kapitałowych) wraz z odsetkami od 2014 r. Rzecznik Finansowy wskazuje, że wyrok ten jest ważny nie tylko dla samych zainteresowanych, ale też innych kredytobiorców znajdujących się w podobnej sytuacji.

Tworzenie planu urlopów na 2026 rok. Już w grudniu warto pomyśleć o planach na przyszłoroczny wypoczynek

Korzystanie z urlopu wypoczynkowego opiera się na uzgodnieniach dokonanych pomiędzy pracodawcą a pracownikiem. Czasami mają one formę planu urlopów, jednak nie zawsze musi tak być. Jak wobec tego poprawnie postępować w takich przypadkach?

Nowe formy pomocy dla seniorów już od 2026 r. Obejmą aż 5 sfer. Korzyści będą ogromne, a budżet jest liczony w setkach milionów

Nic nie wskazuje na to, by przyrost naturalny w Polsce w najbliższym czasie pozytywnie nas zaskoczył. To zaś oznacza, że uwaga rządzących musi skupić się najbliższym czasie na rozwoju polityki senioralnej. Jak planują poradzić sobie z tym wyzwaniem? Odpowiedzią będzie między innymi specjalny program z dużym budżetem.

Kolejne polskie miasto wprowadziło zakaz fajerwerków, petard, ogni sztucznych i innych widowiskowych materiałów pirotechnicznych. Dotyczy całego roku

Samorządy nie czekają na uchwalenie przepisów przez rządzących i we własnym zakresie dbają o porządek i bezpieczeństwo. Czy to skutecznie ograniczy skutki odpalania fajerwerków, petard, ogni sztucznych i innych widowiskowych materiałów pirotechnicznych?

REKLAMA

ZUS dla osób z niepełnosprawnościami. Orzeczenia, świadczenia i zmiany planowane na 2026 rok

Osoby z niepełnosprawnościami mogą z Zakładu Ubezpieczeń Społecznych otrzymywać różnego rodzaju świadczenia takie jak renty, dodatki i inne. Jakie kryteria trzeba spełnić? Kto może uzyskać? Co może się zmienić w 2026 roku? Prezentujemy najważniejsze przepisy i kwoty.

500 zł, 1300 zł, 1700 zł, czy 2333 zł dla każdego dorosłego? Ile ostatecznie będzie wynosił bezwarunkowy dochód podstawowy?

Powraca temat bezwarunkowego dochodu podstawowego. Jednak od początku dyskusji o tym rozwiązaniu kwoty, które padają bardzo się od siebie różnią. Jak to więc ostatecznie będzie? Nad jakim rozwiązaniem toczą się prace? Sytuacja jest dynamiczna, a jednocześnie nie idzie do przodu...

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA