REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

REKLAMA

 

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Sejm online: M.in. Kodeks pracy i Kodeks cywilny [Transmisja online w dniach 3 i 4 grudnia 2025 r. nr posiedzenia 46.]

3 i 4 grudnia 2025 r. Sejm będzie procedował m.in. nowelizację przepisów Kodeksu pracy i Kodeksu cywilnego. Infor.pl zaprasza na transmisję online (od godz. 10.00).

Karpiowe 2025. Sprawdź, gdzie urzędnicy dostaną nawet 1450 zł!

Pracownicy samorządowi w Polsce mogą liczyć na bardzo zróżnicowane świadczenia świąteczne z Zakładowego Funduszu Świadczeń Socjalnych (ZFŚS). W 2025 roku kwoty „karpiowego” wahają się od zaledwie 90 zł do nawet 1450 zł. Najwyższe dopłaty wypłaci Poznań, ale w kilku dużych miastach – w tym w Krakowie i Lublinie – świątecznych dodatków dla urzędników nie będzie wcale.

Ustawa łańcuchowa zawetowana przez Prezydenta Nawrockiego. Dlaczego?

Ustawa łańcuchowa wprowadzająca zakaz trzymania psów na uwięzi została zawetowana przez Prezydenta Karola Nawrockiego. Dlaczego? Ma zaproponować własny projekt ustawy.

500 plus dla par z co najmniej 50-letnim stażem małżeńskim. Jest już wszystko jasne, Senacka Komisja Petycji pojęła decyzję

Czy małżeństwa z co najmniej 50-letnim stażem małżeńskim otrzymają jednorazowe wsparcie finansowe od państwa? Jest petycja dotycząca tzw. „500 plus dla małżeństw” – nowego świadczenia, które miałoby docenić trwałość długoletnich związków. Senacka Komisja Petycji analizuje i podejmuje decyzję.

REKLAMA

Zniżki dla seniorów. Jak można zaoszczędzić na świątecznych zakupach?

Czas przedświątecznych zakupów nie zawsze jest powodem do radości u wielu osób starszych. Gdzie szukać oszczędności? Czy Karta Dużej Rodziny przyda się seniorowi? O jakich jeszcze dokumentach warto pamiętać? Prezentujemy kilka przydatnych przykładów.

Osoba kierownicza, czy kierownix? Neutralność płciowa nazw stanowisk pracowniczych - nowy obowiązek pracodawców od 24 grudnia 2025 r.

W dniu 24 grudnia 2025 r. wchodzi w życie nowelizacja kodeksu pracy. Jedną z istotnych zmian jest nałożenie na pracodawców obowiązku, by ogłoszenia o naborze na stanowisko oraz nazwy stanowisk były neutralne pod względem płci, a proces rekrutacyjny przebiegał w sposób niedyskryminujący. Czy to oznacza, że także w codziennej działalności w zakładach pracy (poza procesem rekrutacji) nazwy stanowisk nie powinny wskazywać na konkretną płeć?

Ile razy pracownik musi zachorować, aby pracodawca mógł go zwolnić? Przepisy są jasne, ale nie każdy je rozumie

Sezon infekcyjny trwa. Pracownicy chorują, a świadomość po pandemii covid wzrosła i zdecydowaniem częściej niż przed laty decydują się na korzystanie ze zwolnień lekarskich. To bez wątpienia dezorganizuje pracę w wielu firmach i pojawia się pytanie, czy osobom, których częściej nie ma w pracy, niż są, można wypowiedzieć umowy?

Miliony Polaków inwestują w kryptowaluty. Właśnie zapadła decyzja, która zaczyna wszystko od nowa

W polskim świecie kryptowalut nastąpił zwrot, którego niewielu się spodziewało. Decyzja podjęta w Pałacu Prezydenckim wywołała falę komentarzy wśród inwestorów i przedsiębiorców działających w branży cyfrowych aktywów. Chodzi o przepisy, które miały wejść w życie już wkrótce i całkowicie przebudować krajobraz rynku krypto w Polsce. Co się stało i jakie będą tego konsekwencje?

REKLAMA

Złamana noga lub ręka na śliskim chodniku, uraz głowy od spadającego z dachu lodu - od kogo (i jak) można dostać odszkodowanie? Odpowiedzialność gminy, wspólnot, spółdzielni i właścicieli nieruchomości

Najważniejsze w takim przypadku jest ustalenie kto odpowiada za utrzymanie (w tym np. odśnieżanie) miejsca, gdzie doszło do nieszczęśliwego wypadku. Za stan chodnika lub drogi odpowiada podmiot ustawowo zobowiązany do ich utrzymania – najczęściej będzie to gmina, wspólnota mieszkaniowa, spółdzielnia lub właściciel przylegającej nieruchomości. Rzecznik Finansowy wyjaśnia, że nie każda szkoda powstała w wyniku poślizgu prowadzi do wypłaty odszkodowania – decydują konkretne okoliczności i wina odpowiedzialnego podmiotu.

Świadczenie wspierające 2026 - kwota. Wystarczy 70 punktów w decyzji WZON. Wniosek do ZUS można złożyć już w grudniu

Osoby, które w decyzji Wojewódzkiego Zespołu do Spraw Orzekania o Niepełnosprawności otrzymały co najmniej 70 punktów, mogą już składać wnioski o świadczenie wspierające. Jeśli zrobią to w grudniu lub styczniu, świadczenie będzie przysługiwać od stycznia 2026 r. Natomiast gdy wniosek zostanie złożony dopiero w lutym, wypłata rozpocznie się od lutego, a świadczenie za styczeń przepadnie - wyjaśnia Krystyna Michałek, regionalna rzeczniczka prasowa ZUS w województwie kujawsko-pomorskim.

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA