REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

REKLAMA

 

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Awaria Cloudflare: wiele platform cyfrowych przestało dzisiaj działać

Awaria usługi chmurowej firmy Cloudflare spowodowała dzisiaj problemy techniczne u wielu platform cyfrowych m.in. X, Instagram i OpenAI - wynika z danych strony Downdetector. Użytkownicy zgłaszali także problemy z innymi stronami internetowymi. Firma przekazała, że usterka została już usunięta.

Włodzimierz Czarzasty - kim jest nowy marszałek Sejmu? Ile ma lat

Włodzimierz Czarzasty został nowym marszałkiem Sejmu po Szymonie Hołowni. Kim właściwie jest członek Nowej Lewicy? Ile ma lat? Jakie ma wykształcenie?

Jak polskie miasta dbają o zdrowie swoich mieszkańców? [Indeks Zdrowych Miast]

Jak polskie miasta dbają o zdrowie swoich mieszkańców? Najnowsza, czwarta edycja Indeksu Zdrowych Miast, przygotowana przez ekspertów SGH w Warszawie i UE w Krakowie we współpracy z Grupą LUX MED, przynosi jednoznaczne wyniki: w kategorii Zdrowie najlepiej wypadły Poznań, Warszawa i Rybnik - miasta, które konsekwentnie inwestują w profilaktykę, edukację i zdrowe środowisko życia.

Koncert chopinowski, czy Chopinowski? Zmiany w ortografii od 2026 roku. Nowe Zasady pisowni i interpunkcji polskiej Rady Języka Polskiego

Rada Języka Polskiego przy Prezydium Polskiej Akademii Nauk przygotowała szereg zmian zasad ortografii, które zaczną formalnie obowiązywać od 1 stycznia 2026 r. Ponadto Rada opublikowała – pierwszy raz w swej historii – kompleksowy zbiór wszystkich reguł ortograficznych i interpunkcyjnych pod nazwą „Zasady pisowni i interpunkcji polskiej”. Ten zbiór zasad pisowni i interpunkcji stanie się obowiązujący także z dniem 1 stycznia 2026 roku, łącznie z ww. nowościami.

REKLAMA

Włodzimierz Czarzasty nowym marszałkiem Sejmu

Włodzimierz Czarzasty (Lewica) został we wtorek wybrany na nowego marszałka Sejmu. Zastąpił na tej funkcji lidera Polski 2050 Szymona Hołownię.

Pellet Loss Regulation – nowe przepisy unijne nie trafiają w sedno problemu. Główne źródła mikroplastiku to syntetyczne tkaniny i opony samochodowe a nie granulat przemysłowy

W dniu 22 września 2025 r. Parlament Europejski przyjął rozporządzenie mające ograniczyć przedostawanie się do środowiska granulek tworzyw sztucznych – tzw. Pellet Loss Regulation. To ważny sygnał ze strony unijnych instytucji, pokazujący determinację w walce z emisją mikroplastików. W środowisku producentów i przetwórców tworzyw sztucznych, to rozporządzenie ma szerokie poparcie. Budzą się jednak także duże wątpliwości. Oczekiwana od dawna regulacja nie uderza bowiem w główne źródła problemu, a przy tym nakłada kolejne formalne obowiązki na sektor, który już dziś jest jednym z najbardziej regulowanych w Europie.

45. posiedzenie Sejmu [18, 19, 20, 21 listopada 2025]. Transmisja online

Dotychczasowy marszałek Sejmu Szymon Hołownia 13 listopada podpisał rezygnację z funkcji, realizując umowę koalicyjną, zgodnie z którą w drugiej połowie kadencji ma go zastąpić Włodzimierz Czarzasty. Zmiana marszałka ma nastąpić na 45 posiedzeniu Sejmu. Kandydata wybiera się bezwzględną większością głosów przy obecności co najmniej połowy posłów. KO, Lewica, Polska 2050 i PSL popierają Czarzastego, sprzeciw zapowiadają PiS, Konfederacja i Razem.

PZON: Osoby niepełnosprawne źle oceniają orzeczników. Mają premie za utrącenie niepełnosprawności? Uzdrawiają?

Kolejny list do Infor.pl, w którym osoby niepełnosprawne źle oceniają prace lekarzy orzeczników w PZON – zarzucają im „cudowne uzdrawiania”. Autor listu poszedł jeszcze dalej i stawia retoryczne pytanie „Czy lekarze mają premie za uzdrowienia?”. Oczywiście nie mają takiej premii, ale pokazuje to narastające (w mojej opinii) negatywne oceny co do pracy orzeczników - powszechnie są postrzegani jako osoby odbierające albo zaniżające stopnie niepełnosprawności.

REKLAMA

Świadczenie pielęgnacyjne a dodatek pielęgnacyjny – nie myl tych dwóch świadczeń! Jak się pomylisz, stracisz

Wiele osób korzystających z pomocy państwa w związku z niepełnosprawnością lub podeszłym wiekiem słyszało o świadczeniu pielęgnacyjnym oraz dodatku pielęgnacyjnym. Nazwy brzmią podobnie, ale są to dwa zupełnie różne świadczenia – przysługują innym osobom, wypłacane są z innych instytucji i na podstawie innych przepisów. Pomyłka może oznaczać nie tylko stratę czasu, ale także utratę pieniędzy, które faktycznie by się należały. Czym różni się świadczenie pielęgnacyjne od dodatku pielęgnacyjnego, komu przysługuje każde z nich, jak je uzyskać i na co zwrócić uwagę?

Unieważnienie umowy kredytowej – jakie rozliczenie banku z konsumentem. Polskie sądy orzekają wbrew wykładni Sądu Najwyższego

Kolejne postanowienia Sądu Najwyższego – wydane po wyroku Trybunału Sprawiedliwości Unii Europejskiej z 19 czerwca br. – wyraźnie wskazują: po unieważnieniu umowy „frankowej” strony powinny rozliczać się według teorii salda, a nie mnożyć roszczenia w dwóch kondykcjach. Mimo to część sądów powszechnych wciąż idzie pod prąd i „trzyma się” starej linii orzeczniczej - pisze Aneta Ciechowicz-Jaworska radca prawny z Kancelarii Radców Prawnych Aneta Ciechowicz-Jaworska Bartłomiej Ślażyński. Korzystają na tym głównie kancelarie, niekoniecznie kredytobiorcy – co zauważa Ministerstwo Sprawiedliwości.

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA