REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

REKLAMA

 

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Już wkrótce kolejny produkt zostanie objęty opłatą kaucyjną – dwukrotnie wyższą

Od 1 października w Polsce oficjalnie wszedł w życie system kaucyjny. W sklepach pojawią się pierwsze plastikowe butelki objęte kaucją, a na ulicach i w punktach handlowych – butelkomaty. Tymczasem już niebawem system kaucyjny zostanie rozszerzony o kolejny produkt – tym razem z dwukrotnie wyższą kaucją.

Wakacje 2026: LOT-em na Kretę z Warszawy do Heraklionu 3 razy w tygodniu od 30 maja. Już można kupić bilety

W komunikacie z 27 listopada 2025 r. nasz narodowy przewoźnik lotniczy Polskie Linie Lotnicze LOT poinformowały, że uruchamiają sprzedaż biletów na połączenia między Warszawą a Heraklionem. Pierwszy rejs odbędzie się 30 maja 2026 r., a loty na trasie WAW-HER-WAW będą realizowane w sezonie letnim 2026 - 3 razy w tygodniu – w poniedziałki, piątki i soboty. Bilety na połączenia z Lotniska Chopina w Warszawie do Heraklionu są dostępne we wszystkich kanałach sprzedaży, w tym na stronie lot.com, w LOT Contact Center i w biurach LOT Travel.

Prawnik na LinkedIn. Od czego zacząć?

Jak prawnik może zacząć budowanie wizerunku? Najczęściej pierwszą myślą jest założenie profilu w mediach społecznościowych – to powszechne narzędzia, w których stosunkowo łatwo, szybko i tanio można dotrzeć do potencjalnych klientów. Obecnie funkcjonuje wiele różnych portali i aplikacji, jednak tylko jedna przeznaczona jest wyłącznie do komunikacji biznesowej. Mowa oczywiście o LinkedIn.

Dlaczego warto wdrożyć w swojej firmie program motywacyjny (ESOP, opcje na akcje itp.) i jak to zrobić?

Korzyści z wprowadzenia programu motywacyjnego dla firmy (ESOP, opcje menedżerskie, warranty, akcje fantomowe). Etapy projektowania, wymogi sprawozdawcze (MSSF 2), rozwiązania dla spółek akcyjnych oraz spółek z ograniczoną odpowiedzialnością – wskazówki biura aktuarialnego.

REKLAMA

Podatek od spadku. Nowe przepisy w 2026 roku?

Nowelizacja przepisów ma uporządkować sprawy dotyczące podatków od spadków. Dla członków najbliższej rodziny spadkodawcy zmiany oznaczają przede wszystkim możliwość przywrócenia terminu do złożenia zgłoszenia. Co jeszcze ma się zmienić?

Barbórka pod znakiem zapytania. Czy górnicy dostaną w 2025 roku przysługujące im nagrody? Niektórych ominie dodatkowe wynagrodzenie. W tle kryzys i straty

Niektórych pracowników ominie coroczna nagroda. To ważne, bo ma nie tylko wymiar finansowy, ale i symboliczny. Dlaczego górnikom nie zostanie wypłacona zwyczajowa barbórka? Ta dodatkowa wypłata jest istotnym elementem wynagrodzenia przysługującego tej grupie zawodowej.

Problemy osób niepełnosprawnych w podróży samolotem - RPO podejmuje działania

Z jakimi problemami spotykają się osoby niepełnosprawne w trakcie podróży samolotem? Okazuje się, że jest ich całkiem sporo. RPO wystąpił w tej sprawie do Prezesa Urzędu Lotnictwa Cywilnego oraz Pełnomocnika Rządu ds. Osób z Niepełnosprawnościami.

Co najmniej 7000 zł na rękę. Kto ma dostać takie wynagrodzenie? Uzasadnienie jest proste – to istotne dla bezpieczeństwa państwa

Państwo powinno zapobiegać odpływowi pracowników z kluczowych sektorów istotnych dla bezpieczeństwa obywateli. Trzeba podnieść ich wynagrodzenia i objąć je finansowaniem centralnym. Mowa o 7000 zł na rękę.

REKLAMA

Senat: Emerytowani żołnierze chcą przeliczenia emerytur ustalonych dekady temu

Emerytowani żołnierze wnoszą o ponowne przeliczenie emerytur i rent żołnierzy zawodowych, ustalonych przed dniem 1 stycznia 1999 r., z uwzględnieniem każdorazowej waloryzacji, przeprowadzanej nie później niż w ciągu 3 miesięcy od wprowadzenia zmian w uposażeniu zasadniczym żołnierzy zawodowych. Przeliczenie to powinno skutkować wypłatą wyrównania, stanowiącego różnicę pomiędzy wysokością świadczeń, jakie przysługiwałyby po uwzględnieniu każdej waloryzacji, a świadczeniami faktycznie otrzymywanymi. Natomiast w związku z wypłatą wyrównania uprawnionym przysługiwałoby również prawo do odsetek zgodnie z art. 48 ustawy z dnia 10 grudnia 1993 r. o zaopatrzeniu emerytalnym żołnierzy zawodowych oraz ich rodzin.

TSUE ws. uznawania małżeństw jednopłciowych. RPO: trzeba wykonać orzeczenie

Co dalej z orzeczeniem TSUE ws. uznawania małżeństw jednopłciowych? Rzecznik Praw Obywatelskich mówi jasno: trzeba wykonać. Należy zmienić polskie rozporządzenie określające wzory aktów stanu cywilnego.

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA