REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

REKLAMA

 

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Jakich zwierząt nie wolno hodować?

Coraz więcej osób interesuje się hodowlą zwierząt niebezpiecznych. Z pewnością sprzyja temu charakter obecnych czasów, kiedy to coraz trudniej jest komukolwiek czymś zaimponować z uwagi na wszechobecny dostęp do rozmaitych, luksusowych dóbr. Posiadanie więc małpy, niedźwiedzia, czy lwa, wydaje się dla wielu imponujące i przyciąga mnóstwo obserwatorów w social mediach. Warto wiedzieć, że droga do posiadania pewnych zwierząt nie jest łatwa, a czasem nawet niemożliwa.

Trzynastka dla nowej grupy pracowników. 1/12 wynagrodzenia rocznego. Projekt jest w Sejmie, a kiedy będą pieniądze?

Czy kolejna grupa pracowników dostanie trzynaste wynagrodzenie? Miałaby to być 1/12 wynagrodzenia rocznego. To nie jest pierwszy raz, gdy mówi się o konieczności wprowadzenia tych przepisów. Od kiedy można liczyć na pieniądze?

Od stycznia 2025 roku już 600 plus na dentystę. Dla każdego, kto opłaca składkę zdrowotną. Ale czy wiesz, jak skorzystać?

Od stycznia 2025 roku koszyk świadczeń stomatologicznych dostępnych w ramach NFZ uległ zmianie na lepsze. Od tego dnia każdy, kto opłaca składkę zdrowotną, może liczyć na 600 plus na dentystę. Czy to się zmieni w 2026 roku?

Czy można odmówić chrztu dziecku poczętemu dzięki in vitro?

Czy można odmówić chrztu dziecku poczętemu dzięki in vitro? Czy osoba w związku homoseksualnym może być chrzestnym? Czyw księdze chrztu mogą być wpisane dwie kobiety?

REKLAMA

Reforma orzecznictwa lekarskiego w ZUS. Nowe zasady kontroli zwolnień lekarskich

Sejm pracuje nad projektem nowelizacji ustawy dotyczącym reformy orzecznictwa lekarskiego w ZUS. Regulacja zakłada m.in. ujednolicenie zasad kontroli zwolnień lekarskich, podwyżki dla lekarzy orzeczników, doprecyzowuje także sytuacje, w których można stracić zasiłek chorobowy. Projekt został przygotowany przez Ministerstwo Rodziny, Pracy i Polityki Społeczne.

PILNE: od 19.11.2025 do 28.02.2026 r. całodobowe dyżury we wskazanych urzędach, a osoby wyznaczone do wykonywania zadań ochronny wyposażone w broń i amunicję. Weszło w życie zarządzenie premiera wprowadzające trzeci stopień alarmowy

Zarządzeniem wydanym w dniu 19 listopada 2025 r. premier Donald Tusk wprowadził trzeci stopień alarmowy CHARLIE. Obejmuje on obszary linii kolejowych zarządzanych przez PKP Polskie Linie Kolejowe S.A. oraz PKP Linia Hutnicza Szerokotorowa Sp. z o.o. i będzie obowiązywał w okresie od dnia 19 listopada 2025 r., od godz. 00.00, do dnia 28 lutego 2026 r., do godz. 23.59. Sprawdź, co poszczególne alarmy, oznaczają dla urzędów administracji publicznej i dla obywateli naszego kraju.

Przepadek psa i zakaz posiadania zwierząt. Trzeba będzie lepiej pilnować zwierząt. Sejm pracuje nad zmianami

Liczba zwierząt domowych w Polsce rośnie. W ostatnim czasie wzrosła też liczba niebezpiecznych zdarzeń z udziałem psów. Problem narasta, a Sejm pracuje nad projektem zmian, który ma szansę nieco poprawić sytuację. Co na to właściciele zwierząt?

Masz AI w telefonie? Możliwe, że służby czytają już twoje prompty. Pierwszy w historii nakaz sądowy dot. danych z ChatGPT

Czasopismo Forbes ujawniło przełomową sprawę z Maine, która zmienia sposób, w jaki myślimy o prywatności cyfrowej w erze sztucznej inteligencji. Po raz pierwszy w historii amerykańskie organy federalne uzyskały nakaz sądowy zmuszający OpenAI do wydania danych użytkownika na podstawie zapytań do ChatGPT – a szczegóły tej sprawy są absolutnie fascynujące. Co więcej, nowy raport wywiadowczy Anthropic z sierpnia 2025 roku ujawnia znacznie szerszy obraz wykorzystania systemów AI przez cyberprzestępców, tworząc niepokojący kontekst dla rosnącej roli sztucznej inteligencji zarówno w przestępczości, jak i w jej zwalczaniu.

REKLAMA

Niepełnosprawni alarmują: Obniżyli świadczenie wspierające. Jedną tabelą. Z 4134 zł do 1128 zł. Najczęściej do 0 zł

Takie sygnały (i dokumenty) przekazały do redakcji Infor.pl niewidome osoby niepełnosprawne (stopień znaczny). Prawie rok temu strona rządowa wysłała do WZON materiały w praktyce wykluczające ze świadczenia wspierającego osoby niewidome. Jak to zostało zrobione? Opracowano tabele ograniczające liczbę punktów jakie może otrzymać osoba niewidoma. W artykule przykład odgórnego narzucenia niesamodzielności osoby niewidomej do 76 punktów. Dokumenty przedstawione w artykule wykluczają, aby osoba niewidoma mogła otrzymać 4134 zł świadczenia wspierającego (jego maksymalna wartość). Najczęściej to będzie wartość minimalna 752 zł, niekiedy 1128 zł a najczęściej 0 zł (brak świadczenia wspierającego). Tabela, która dowodzi obniżenia wartości świadczenia wspierającego dla osób niewidomych trafiła do nas nie tylko w emailach osób niepełnosprawnych. Jej istnienie (jako materiał szkoleniowy) potwierdziło oficjalnie Ministerstwo Rodziny (także zamieszczamy dokument w artykule).

Czy od 2026 r. trzeba będzie raportować do fiskusa transakcje firmowymi i prywatnymi kartami płatniczymi? Ministerstwo wyjaśnia

W sieci pojawiają się nieprawdziwe informacje, według których od 2026 r. urzędy skarbowe będą rzekomo otrzymywać od banków dane o płatnościach kartą przekraczających ustalony próg. Ministerstwo Finansów zdementowało te doniesienia. Wprowadzenie takich przepisów byłoby uzasadnione tylko w wybranych sytuacjach kryzysowych - powiedział PAP prof. Błażej Podgórski.

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA