REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

REKLAMA

 

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Przepadek psa i zakaz posiadania zwierząt dla właścicieli, którzy nie dopilnują swoich zwierząt. Nad zmianami pracuje Sejm

Liczba zwierząt domowych w Polsce rośnie. W ostatnim czasie wzrosła też liczba niebezpiecznych zdarzeń z udziałem psów. Problem narasta, a Sejm pracuje nad projektem zmian, który ma szansę nieco poprawić sytuację.

Masz AI w telefonie? Możliwe, że służby czytają już twoje prompty. Pierwszy w historii nakaz sądowy dot. danych z ChatGPT

Czasopismo Forbes ujawniło przełomową sprawę z Maine, która zmienia sposób, w jaki myślimy o prywatności cyfrowej w erze sztucznej inteligencji. Po raz pierwszy w historii amerykańskie organy federalne uzyskały nakaz sądowy zmuszający OpenAI do wydania danych użytkownika na podstawie zapytań do ChatGPT – a szczegóły tej sprawy są absolutnie fascynujące. Co więcej, nowy raport wywiadowczy Anthropic z sierpnia 2025 roku ujawnia znacznie szerszy obraz wykorzystania systemów AI przez cyberprzestępców, tworząc niepokojący kontekst dla rosnącej roli sztucznej inteligencji zarówno w przestępczości, jak i w jej zwalczaniu.

Czy od 2026 r. trzeba będzie raportować do fiskusa transakcje firmowymi i prywatnymi kartami płatniczymi? Ministerstwo wyjaśnia

W sieci pojawiają się nieprawdziwe informacje, według których od 2026 r. urzędy skarbowe będą rzekomo otrzymywać od banków dane o płatnościach kartą przekraczających ustalony próg. Ministerstwo Finansów zdementowało te doniesienia. Wprowadzenie takich przepisów byłoby uzasadnione tylko w wybranych sytuacjach kryzysowych - powiedział PAP prof. Błażej Podgórski.

Wniosek o świadczenie pielęgnacyjne. Rodzice mają problem z niejasnym terminem

Jeżeli rodzic zawnioskuje o świadczenie w okresie trzech miesięcy, licząc od dnia wydania orzeczenia, to gmina przyzna wsparcie począwszy od miesiąca, w którym złożono wniosek o ustalenie niepełnosprawności lub stopnia niepełnosprawności. Jak liczyć ten termin, gdy orzeczenie o niepełnosprawności uzyskano w postępowaniu sądowym?

REKLAMA

Stawkę za grudzień trzeba zaktualizować. Nie każdy o tym pamięta. Pracownicy powinni sprawdzić, czy dostali należne pieniądze

Zmiany wprowadzane na gruncie prawa pracy i prawa podatkowego najczęściej wchodzą w życie na początku roku kalendarzowego. W szczególności dotyczy to przypadków, w których są one związane z obciążeniami finansowymi. Niestety nie jest to regułą, co oznacza, że zawsze trzeba zachować czujność.

ZUS najpierw przyznał matce 800 plus, a teraz każe oddać pieniądze. Jednocześnie jednak nadal je… wypłaca. Co się dzieje? [wyrok]

Świadczenie 800 plus ma poprawić sytuację dzieci. Trafia jednak do rąk rodziców. Takie rozwiązanie jest zrozumiałe i uzasadnione, ale okazuje się, że może również być źródłem wielu problemów. I nie chodzi o to, że rodzice się nie dogadują między sobą. Również ZUS czasami zmienia zdanie.

Seniorze nie daj się nabrać: uważny senior powinien zwracać na to uwagę, szczególnie w okresie przedświątecznym

Seniorze nie daj się nabrać. Uważny senior powinien zwracać na to uwagę, szczególnie w okresie przedświątecznym. Nieuczciwe praktyki sprzedażowe wobec osób starszych to problem, który od lat powraca w różnych formach: od agresywnej sprzedaży door-to-door po natarczywe telefony i pozornie bezpłatne pokazy. Zmienili się sprzedawcy, technologie i kanały kontaktu, ale mechanizm oszustwa pozostał ten sam: wywołać emocje, zaskoczyć, zmusić do szybkiej decyzji. Podpowiadamy jak reagować, co robić i co mówić.

USA mówią STOP prawom autorskim dla AI. Ten wyrok zmienia zasady gry

Amerykański sąd apelacyjny definitywnie odrzucił prawa autorskie dla obrazu stworzonego przez sztuczną inteligencję, podtrzymując zasadę, że autorem może być tylko człowiek. Ten głośny wyrok – już viralowy w branży technologicznej – otwiera nowy front w globalnej debacie o AI, własności intelektualnej i przyszłości kreatywności w erze generatywnych modeli.

REKLAMA

Czy ciężko jest wybrać dobrego prawnika?

Wszyscy wiemy, że prawnik może być niezbędny – przy zakładaniu firmy, sporach z kontrahentem czy problemach z pracownikami. Ale kiedy rzeczywiście sięgamy po telefon, żeby umówić konsultację, nagle ogarnia nas strach. Który wybrać? Jak poznać, że jest kompetentny? Czy nie przepłacę? A może w ogóle da się jakoś bez niego?

Dużo szybsze rozwody pod koniec 2025 r.? Prezydent podpisał ustawę

Rosnące braki kadrowe w sądach rodzinnych, przewlekłe postępowania i narastające napięcia wokół Krajowej Rady Sądownictwa skłoniły rząd i parlament do wprowadzenia zmian, które mają przywrócić sprawność wymiaru sprawiedliwości w najwrażliwszych sprawach. Podpisana przez prezydenta Karola Nawrockiego nowelizacja ustawy o ustroju sądów powszechnych otwiera asesorom drogę do orzekania w wydziałach rodzinnych, co – zdaniem zwolenników – ma odciążyć najbardziej przeciążone jednostki i poprawić ochronę dobra dziecka. Krytycy wskazują jednak na konstytucyjne i systemowe wątpliwości oraz brak spójności projektowanych rozwiązań.

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA