REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

REKLAMA

 

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
To świadczenie nie podlega ochronie. To przykra niespodzianka przed urlopem. Komornik zajmie je w całości

Czy pracodawca powinien dokonywać potrąceń z należnego pracownikom świadczenia z zfśs? Choć pracownicy często uważają, że jako świadczenie socjalne jest ono spod niej wyłączone, to rzeczywistość jest inna

Ten nadajnik automatycznie przekaże informacje o trybie życia mieszkańców. Co będzie wynikało z profilu grzewczego?

Już od 1 stycznia 2027 r. zmienią się zasady rozliczania zużycia wody i ciepła. Z danych dotyczących zużycia będzie można stworzyć profil grzewczy. Czego będzie można się z niego dowiedzieć o mieszkańcach?

Osoby z niepełnosprawnościami coraz częściej pracują. Co z limitami w ZUS?

Z informacji przekazanych przez Ministerstwo Rodziny, Pracy i Polityki Społecznej wynika, iż w Polsce rośnie zatrudnienie osób z niepełnosprawnościami. Czy jest szansa na likwidację limitów dorabiania do rent socjalnych i chorobowych?

WZON: Podobno niepełnosprawny dostał miskę z wodą, żeby udowodnił, że potrafi sam umyć ręce. Kazali mu się podrapać po głowie, wstać z łóżka i chodzić po pokoju

Mamy przesunięcie w tym co jest ważne dla osoby niepełnosprawnej. Kiedyś najważniejsze było orzeczenie o niepełnosprawności. Dziś w posiadanie tego dokumentu jest tylko wstępem staraniach o np. świadczenie wspierające. Ważniejsze jest wykazanie przed komisją orzeczniczą przyznającą świadczenia faktycznej niesamodzielności. I odbywa się to poprzez pytania i odpowiedzi. Osoby niepełnosprawne mają dziś listy pytań sprawdzających ich samodzielność, które są zadawane w procesie przyznawania punktów, od których zależy wysokość świadczenia wspierającego (albo w ogóle jego przyznanie).

REKLAMA

Zasądzenie kwoty na rzecz małżonków bez solidarności oznacza podział kwoty po połowie - wtedy może być poniżej progu do skargi kasacyjnej

Sąd Najwyższy 27 lutego 2026 (I CSK 150/25) odrzucił skargę kasacyjną pozwanego w sprawie, gdzie małżonkowie żądali solidarnego zasądzenia 90 261 zł. Problem? Sąd zasądził tę kwotę, ale bez solidarności – więc z mocy prawa podzieliła się po połowie (art. 379 § 1 k.c.). Każdy małżonek dostał 45 131 zł, czyli poniżej progu 50 000 zł wymaganego dla skargi kasacyjnej. Co to oznacza, gdy majątek jest wspólny?

Najem krótkoterminowy: wysokie zyski czy kosztowna pułapka? Kiedy staje się działalnością gospodarczą?

Najem krótkoterminowy w Polsce wciąż jest trochę „między światami”. Nie ma jednej ustawy, która porządkuje go od A do Z, a wszystko zależy od charakteru najmu i jego skali. Oznacza to, że ten sam wynajem może być raz traktowany jako prywatny, innym razem jako działalność gospodarcza, a w pewnych sytuacjach nawet jako coś zbliżonego do usług hotelowych. I właśnie przez tę nieostrość wielu właścicieli porusza się w szarej strefie interpretacyjnej – dopóki nic się nie wydarzy, temat nie istnieje.

Ceny paliwa na środę. Tyle jutro zapłacimy za benzynę i olej napędowy

Minister energii wydał nowe obwieszczenie, w którym określił maksymalne ceny detaliczne benzyny i oleju napędowego obowiązujące w środę 27 maja. Czy nadal utrzymuje się tendencja spadkowa cen paliw? Sprawdzamy!

Czy banki celowo dawały kredytobiorcom wadliwe umowy do podpisu? Anatomia systemowego błędu

W debacie publicznej na temat wadliwych umów o kredyt konsumencki coraz częściej pojawia się narracja o celowym działaniu banków na szkodę klientów. Jej zwolennicy twierdzą, że instytucje finansowe świadomie wpisywały do umów klauzule niezgodne z prawem, licząc na niewiedzę konsumentów i nikłe prawdopodobieństwo zakwestionowania zapisów. Tezę tę chętnie podchwytują prawnicy reprezentujący kredytobiorców w sporach sądowych. Tymczasem rzeczywistość jest bardziej złożona - i właśnie dlatego bardziej niepokojąca. Jeśli błędy wynikały z chciwości, remedium jest proste: lepsza regulacja i dotkliwe sankcje. Jeśli jednak u ich podstaw leży splot strukturalnych dysfunkcji organizacyjnych, luk kompetencyjnych i nieprecyzyjnych przepisów - problem jest znacznie trudniejszy do wyeliminowania. I znacznie trudniejszy do zapobieżenia w przyszłości. Dlatego rozumiem zarówno stronę kredytobiorców przez których najczęściej przemawiają emocje oraz bankowców, którzy rozliczani są za swoje błędy po wielu latach bez względu na to ile w tych bledach było celowego działania.

REKLAMA

Polska coraz bardziej zależna od cudzoziemców na rynku pracy. Nowe dane

W 2025 r. pracujący i mieszkający w Polsce cudzoziemcy zwiększyli nasz PKB od 200 do 416 mld zł, czyli od 5,1 proc. do 10,7 proc. - wynika z raportu „Migracja w Polsce”, którego wyniki publikuje „Rz”.

Pracodawcy żądają rachunków potwierdzających zakup wakacyjnych wyjazdów. Bez tego nie chcą wypłacać pieniędzy. Czy to jest zgodne z prawem?

Prawo do świadczeń z ZFŚS budzi wiele emocji. Uprawnieni błędnie zakładają, że należą się one każdemu po równo, a pracodawcy często próbują w uchwalanych regulaminach niezgodnie z prawem ograniczać dostęp do świadczeń. Są też kwestie, których od lat nie udaje się ostatecznie wyjaśnić. Tymczasem każdemu zależy na przysługujących mu pieniądzach.

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA