REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

REKLAMA

 

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
62 dni dodatkowego wolnego od pracy na zdrowe dziecko – bez utraty wynagrodzenia, którego udzielenia pracodawca nie może odmówić. Te przepisy już obowiązują i rodzice mogą z nich korzystać

Choć, być może, nie wszyscy mają tego świadomość – rodzice mają prawo do uzyskania zwolnienia od pracy z zachowaniem prawa do wynagrodzenia lub za czas którego przysługiwać im będzie prawo do zasiłku opiekuńczego, w celu sprawowania opieki nie tylko nad chorym, ale również nad zdrowym dzieckiem. I co więcej – pracodawca nie może im odmówić udzielenia tych dni wolnych od pracy. Ile dni zwolnienia od pracy, w jakich okolicznościach, w jaki sposób i na jakich warunkach, mogą uzyskać rodzice, w celu osobistego sprawowania opieki nad zdrowym dzieckiem?

Zysk z PPK: 138% do 198%% przez 6 lat w zależności od FZD. Jak sprawdzić stan rachunku? Wypłacić zawsze można ale przed 60 urodzinami są potrącenia

Zysk statystycznego uczestnika PPK przez 6 lat funkcjonowania tej formy dodatkowego oszczędzania na emeryturę (tj. od grudnia 2019 roku do końca listopada 2025 r.) wyniósł od 138% do 198% proc. kwot, które uczestnik sam wpłacił . Różnica w procencie zysku zależy od rodzaju Funduszu Zdefiniowanej Daty, który wybrał uczestnik. Taka informacja została podana w opublikowanym 16 grudnia 2025 r. nr 12 (50) biuletynu miesięcznego Pracowniczych Planów Kapitałowych.

PPK 2026: wyższy limit wynagrodzenia (5767,20 zł). Jak obniżyć wpłatę podstawową? Nie każdy dostanie dopłatę roczną

Jak informuje PFR Portal PPK (mojeppk.pl), od 2026 roku uczestnik PPK może korzystać z obniżenia swojej wpłaty podstawowej do PPK tylko wtedy, gdy jego miesięczne wynagrodzenie nie przekroczy 5767,20 zł. Jeżeli uczestnik PPK otrzymuje wynagrodzenia od różnych podmiotów, musi sam sprawdzić, czy nie przekracza tego limitu. Warto też wiedzieć, że dopłata roczna z Funduszu Pracy za 2026 rok (nadal 240 zł) będzie przysługiwać uczestnikom PPK, którzy w całym 2026 roku zgromadzą na swoim rachunku lub rachunkach PPK wpłaty w wysokości co najmniej 1009,26 zł. Jeżeli w 2026 roku uczestnik PPK skorzysta z obniżenia swojej wpłaty podstawowej, to do otrzymania dopłaty rocznej wystarczą wpłaty w wysokości co najmniej 252,32 zł.

Ponad 1000 zł miesięcznie do 25. roku życia dziecka - bez kryterium dochodowego

Zasiłek rodzinny na dziecko to niemiecki odpowiednik naszego 800 plus. Kindergeld to comiesięczne świadczenie przysługujące nie tylko Niemcom, ale również Polakom, którzy pracują lub mieszkają na terytorium Niemiec. Sprawdzamy, jaka jest wysokość tego świadczenia.

REKLAMA

Niższy wiek emerytalny dla kobiet i mężczyzn. Nie dla wszystkich grup zawodowych. Senat już przegłosował. Co dalej?

W 2025 r. powstał projekt przepisów, które miały obniżyć wie emerytalny dla kobiet i mężczyzn z określonej grupy zawodowej. Propozycja wywołała wiele emocji. Co stało się z tym pomysłem i jaki jest etap prac nad przepisami?

Kirgistan: zmiana zasad pobytu bezwizowego od stycznia 2026 r. także dla Polaków

Z początkiem stycznia 2026 r. zmieniły się zasady bezwizowego pobytu w Kirgistanie, także dla obywateli Polski. To coraz bardziej popularna destynacja wśród polskich turystów. Jakie są aktualne zasady?

Największa od lat rewolucja w L4 „przyklepana” przez Prezydenta: w czasie zwolnienia, pracownik (od czasu do czasu) będzie musiał odebrać telefon od szefa i odpisać na e-maila, ale będzie też mógł pobierać jednocześnie zasiłek chorobowy i 100 proc. wynagrodzenia

W dniu 7 stycznia 2026 r. Prezydent podpisał ustawę o zmianie ustawy o systemie ubezpieczeń społecznych oraz niektórych innych ustaw, która wprowadza istotne zmiany w zakresie tego co wolno, a czego nie wolno pracownikowi w czasie przebywania na zwolnieniu lekarskim (L4) – począwszy od podejmowania sporadycznych, incydentalnych czynności, będących przejawami aktywności zawodowej, a na wykonywaniu pracy u innego pracodawcy (tym samym – pobierając jednocześnie zasiłek chorobowy i 100 proc. wynagrodzenia) skończywszy.

Umiarkowany stopień niepełnosprawności 2026. Lista świadczeń, ulg i pieniędzy

Co w praktyce oznacza orzeczenie o niepełnosprawności w stopniu umiarkowanym? Kto w 2026 roku może korzystać z dostępnych ulg i przywilejów? Rozwiewamy wątpliwości i prezentujemy kilka przykładowych form wsparcia.

REKLAMA

Pracownicy są zdziwieni, że płacą za korzystanie ze zwolnienia z powodu siły wyższej. Tracą więcej niż połowa wynagrodzenia

Zwolnienie z powodu siły wyższej stało się zmorą pracodawców. Jednak nie tylko oni ponoszą konsekwencje korzystania z tego uprawnienia. I nie chodzi tu o obniżone wynagrodzenie za dzień, w którym pracownik był nieobecny w pracy. Niektóre skutki są odczuwalne dopiero po zakończeniu roku i zaskakują uprawnionych. Warto wiedzieć, czego można się spodziewać.

Koniec 800 plus i zasiłku chorobowego? Czy zastąpi je jedno nowe świadczenie

Koncepcja bezwarunkowego dochodu podstawowego jest coraz bardziej popularna, a w jednym ze stanów USA mieszkańcy już otrzymują świadczenie. Czy wprowadzenie w Polsce BDP spowoduje likwidację popularnych programów socjalnych takich jak 800 plus i 300 plus? Jaka powinna być wysokość bezwarunkowego dochodu podstawowego w naszym kraju?

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA