REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

REKLAMA

 

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Orzeczenie o niepełnosprawności dziecka. Lista praw i świadczeń na 2026 rok

Orzeczenie o niepełnosprawności dziecka to ważny dokument, który uprawnia do wielu ulg, świadczeń i przywilejów. Jakich? Oto najważniejsze formy wsparcia i kwoty na 2026 rok.

Od roku obniżanie świadczeń dla seniorów. Wytycznymi dla WZON. W grze kwalifikator WC-C [Dokumenty, przykłady]

Infor.pl publikuje dokument Wytycznych dla WZON z grudnia 2024 r. sygnowany godłem Ministerstwa Rodziny z pismem przewodnim Pełnomocnika do Spraw Osób Niepełnosprawnych. Dokument otrzymaliśmy od czytelników. Jest opatrzony odpowiednim podpisem elektronicznym, ale zwróciliśmy się do Ministerstwa Rodziny i Pełnomocnika prosząc o potwierdzenie jego autentyczności. Od roku środowisko osób niepełnosprawnych huczy mitami o dokumencie Wytycznych - że każda starsza osoba jest ograniczana w 9 czynnościach testu niesamodzielności do niskiego kwalifikatora WC-C, co zaniża wysokość świadczenia wspierającego. Podstawowe pytanie jest takie - czy to jest prawda?

Od stycznia 2026 r. wchodzi w życie obowiązek oznakowania ścian oddzielenia przeciwpożarowego. Jakich budynków dotyczy?

Od 1 stycznia 2026 r. oznakowanie miejsca połączenia ściany oddzielenia przeciwpożarowego ze ścianą zewnętrzną oraz z dachem staje się obowiązkowe w obiektach handlowych, produkcyjnych i magazynowych - przypomniał w rozmowie z PAP rzecznik prasowy KG PSP st. bryg. Karol Kierzkowski.

Państwo nie może działać przeciwko swoim obywatelom, orzekł sąd. ZUS nie może pozbawiać prawa do zasiłku przez jedno wyjście z domu

Kontrola prawidłowości korzystania ze zwolnień lekarskich to temat, który budzi wiele emocji. Z jednej strony ZUS mówi o nadużywaniu świadczeń i zapowiada wzmożone kontrole, z drugiej ubezpieczeni czują się prześladowani i traktowani niesprawiedliwie.

REKLAMA

Czy promocje w Black Friday są opłacalne?

Czy promocje w Black Friday są opłacalne? Okazuje się, że według najnowszych badań promocje oferowane w ramach Black Friday są uważane za opłacalne przez 47,6% dorosłych Polaków. Przeciwnego zdania jest 29% rodaków, a 23,4% nie ma jeszcze wyrobionej opinii w tym temacie. Korzyści z corocznych akcji rabatowych widzą głównie osoby w wieku 35-44 lat i z dochodami powyżej 9 tys. zł netto. Nie dostrzegają zysków z tego typu obniżek przede wszystkim seniorzy i konsumenci uzyskujący co miesiąc 5000-6999 zł na rękę.

Nowe limity dorabiania do emerytury i renty od grudnia 2025 r. Kto i ile może dorobić bez zmniejszenia lub zawieszenia świadczenia z ZUS?

Jest to bardzo ważna informacja dla rencistów i wcześniejszych emerytów, którzy dorabiają do swoich świadczeń. Od 1 grudnia 2025 r. zmieniają się graniczne kwoty przychodu, które powodują zmniejszenie lub zawieszenie świadczeń (emerytur i rent) z Zakładu Ubezpieczeń Społecznych. Limity te będą wyższe niż w poprzednich trzech miesiącach. Bezpieczny próg przychodu (do którego można zarabiać bez obawy o zmniejszenie lub zawieszenie emerytury lub renty) wzrośnie o 16,10 zł, do kwoty 6 140,20 zł brutto. A górna granica zwiększy się o 30 zł i wyniesie 11 403,30 zł brutto. Zarobki powyżej tej kwoty w grudniu 2025 r., styczniu i lutym 2026 r. sprawią, że ZUS zawiesi emeryturę lub rentę.

Nie opiekujesz się rodzicami? Stracisz spadek. Samorządy mają dość utrzymywania seniorów i domagają się zwrotu ponoszonych kosztów

Kto powinien ponosić koszt pobytu mieszkańca w DPS? Przepisy jasno wskazują kolejność. Niestety regulacje te narażają samorządy na ogromne koszty, których nigdy nie mogą odzyskać, nawet jest pensjonariusz posiada duży majątek.

Od umowy zlecenia czasami nie płaci się podatku według skali. Od czego to zależy? Warto znać przepisy, by nie popełnić tego błędu

W 2026 roku umowy cywilnoprawne, w tym umowa zlecenia, mają znaleźć się pod specjalnym nadzorem organów Państwowej Inspekcji Pracy. Warto więc pamiętać o tym, że czasami ich rozliczanie podlega szczególnym zasadom.

REKLAMA

Czy chory pracownik musi przywieźć laptop do firmy? Sprzęt stanowi własność pracodawcy, a z przepisów wynika, jak trzeba postępować

Czy na czas swojej nieobecności pracownik musi zwrócić do firmy laptop i telefon? Trzeba pamiętać o przestrzeganiu prostych zasad, w tym tej, że udostępnione pracownikowi narzędzia pracy stanowią własność pracodawcy.

Czy pracodawca odbierze pracownikowi ryczałt za pracę zdalną w czasie urlopu? Nie zawsze i nie każdemu. Od czego to zależy?

Czy nieobecność w pracy oznacza wypłatę ryczałtu za pracę zdalną w obniżonej wysokości? W obowiązujących przepisach nie znajdziemy jednoznacznej odpowiedzi na to pytanie. Jak więc prawidłowo postępować? Trzeba przemyśleć to zawczasu.

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA