REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

REKLAMA

 

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Czy można zignorować system kaucyjny i dalej wyrzucać puszki, plastikowe i szklane butelki do odpadów segregowanych tak jak dotychczas? Czy grożą za to kary?

Przez ostatnie miesiące dużo mówiło się o systemie kaucyjnym, który polega na selektywnym zbieraniu określonych butelek szklanych, plastikowych oraz puszek aluminiowych. Wiele kwestii zostało już opisanych, ale pojawia się praktyczny problem: co z osobami, które nie chcą albo z różnych względów nie są w stanie przechowywać niezgniecionych butelek i puszek oraz nosić ich do punktów zwrotu (automatów lub sklepów uczestniczących w systemie)? Czy w dalszym ciągu zgodne z prawem będzie wyrzucanie takich opakowań tak jak dotychczas – czyli szklanych do pojemników zielonych, a plastikowych i aluminiowych do żółtych – razem z innymi odpadami segregowanymi?

Podatek katastralny – kogo obejmie, ile wyniesie i kiedy wejdzie w życie? Nowe ustalenia z Sejmu

Wraca sprawa podatku katastralnego. Lewica finalizuje projekt ustawy, który ma zostać złożony w grudniu, a jego szczegóły właśnie zaczynają wychodzić na światło dzienne. Choć propozycja ma charakter poselski, a nie rządowy, jej potencjalny wpływ na rynek nieruchomości i miliony właścicieli mieszkań może być znaczący.

Wielka reforma pracy. Nadchodzą dłuższe urlopy i rewolucja w L4. Wszystko od 1 stycznia 2026 roku

W ramach szeroko zakrojonej reformy orzecznictwa lekarskiego ZUS, w listopadzie 2025 roku Sejm procedował projekt nowelizacji w drugim czytaniu. Kluczowe zmiany w projekcie to m.in. likwidacja dotychczasowych trzyosobowych komisji lekarskich oraz modyfikacja regulacji dotyczących zaświadczeń L4, pozwalająca na podjęcie pracy przez ubezpieczonego w okresie trwania zwolnienia chorobowego.

Ważny komunikat z LUX MED: dotyczy osób z niepełnosprawnościami

Ważny komunikat z LUX MED: dotyczy osób z niepełnosprawnościami. Dzięki umowie z Grupą LUX MED OzN z PZSN START otrzymają dostęp do szerokiego zakresu usług medycznych, w tym m.in. opieki ambulatoryjnej, szpitalnej oraz innych świadczeń medycznych.

REKLAMA

TSUE nakazuje Polsce uznać małżeństwo dwóch osób tej samej płci legalnie zawarte w Niemczech i wydać polski akt małżeństwa w ramach tzw. transkrypcji

W dniu 25 listopada 2025 r. Trybunał Sprawiedliwości Unii Europejskiej wydał wyrok, zgodnie z którym państwo członkowskie ma obowiązek uznać małżeństwo dwóch obywateli Unii Europejskiej tej samej płci legalnie zawarte w innym państwie członkowskim, w którym korzystali oni z przysługującej im swobody przemieszczania się i pobytu. Zdaniem TSUE jako że transkrypcja jest jedynym przewidzianym w prawie polskim środkiem pozwalającym na to, aby małżeństwo zawarte w innym państwie członkowskim zostało faktycznie uznane przez organy administracyjne - Polska jest zobowiązana stosować transkrypcję bez rozróżnienia do małżeństw osób tej samej płci oraz małżeństw zawieranych przez osoby odmiennej płci.

Papież Leon XIV: małżeństwo wyłącznym związkiem kobiety i mężczyzny

Watykan w wydanym ostatnio dokumencie „Jedno ciało. Pochwała monogamii” zaznaczył, że małżeństwo jest wyłącznie związkiem kobiety i mężczyzny. Papież Leon XIV popiera dokument.

Zabójca prezydenta Adamowicza nie wniósł na czas kasacji wyroku. O przedterminowe zwolnienie będzie mógł starać się po 40 latach kary pozbawienia wolności

Zabójca prezydenta Gdańska, Pawła Adamowicza, nie ma już możliwości odwołania się od prawomocnego wyroku dożywotniego pozbawienia wolności. Obrońca nie złożył w odpowiednim czasie wniosku o doręczenie odpisu wyroku wraz z uzasadnieniem. Nie można więc wnieść kasacji.

Przekształcenie umów cywilnoprawnych w stosunek pracy. Będą odszkodowania dla przymusowych pracodawców

Jakie konsekwencje pociągnie za sobą przekształcenie umowy cywilnoprawnej w stosunek pracy, jeśli decyzja podjęta w tym zakresie przez inspektora pracy będzie niesłuszna? Zmieniła się treść projektu, który ma wprowadzać te zmiany, a w planowanych przepisach jest mowa o odszkodowaniu.

REKLAMA

Podwyżki dla tych pracowników z negatywną opinią. Czy i o ile od stycznia 2026 roku wzrosną wynagrodzenia?

Podwyżka płacy minimalnej zawsze pociąga za sobą konieczność wprowadzenia szeregu dalszych zmian. To jednak często nie jest wcale łatwe. Choć MPRiPS pracuje nad zmianami, to jednak przygotowane przez nie przepisy wzbudziły negatywne emocje.

Świadczenie wspierające. Wyższe dla 57-latka (2255 zł), niższe dla 67-latka (1504 zł). Obaj tak samo niepełnosprawni [stopień znaczny]

Czytelnicy Infor.pl przekazali nam dokument Wytycznych, które strona rządowa wysłała do WZON. Było to w grudniu 2024 r. Dokument potwierdza to, o czym wielokrotnie pisały do nas w listach osoby niepełnosprawne. Test niesamodzielności osób niepełnosprawnych pozwala na otrzymanie maksymalnie 100 punktów (tzw. poziom potrzeby wsparcia), co daje 4134 zł. W przypadku osób niepełnosprawnych w wieku 75 lat maksymalna wysokość 100 punktów jest według wytycznych obniżana nawet o 11,7 punktu. Dlatego, że Wytyczne przyjmują założenie, że osoba w wieku 75 jest niesamodzielna z dwóch przyczyn - 1) niepełnosprawność + 2) ograniczenia wynikające z wieku. Oba te czynniki nakładają się na siebie. Trzeba je oddzielić. Dlatego - co do zasady - osoba niepełnosprawna w wieku 75 lat (i więcej) musi mieć obniżoną punktację przyznającą świadczenie wspierające - o tą część niesamodzielności, która wynika z wieku. Argumentacja strony rządowej jest logiczna. Ma tylko jeden słaby punkt - nie przewidują możliwości jej zastosowania (poprzez Wytyczne) przepisy ustawowe.

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA