REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

Subskrybuj nas na Youtube
Dołącz do ekspertów Dołącz do grona ekspertów
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

REKLAMA

 

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
Oni nie muszą brać wolnego. I bez tego mają długi weekend. Sprawdź, czego nie uda ci się załatwić 10 listopada

Listopad rozpoczął się długim weekendem. Układ kalendarzowy roku sprawił, że wielu pracowników 10 listopada zostanie w domach i odda się relaksowi, zamiast pracy. Niektórzy wykorzystają w tym celu 1 dzień urlopu, inni nie będą musieli tego robić.

Najnowszy wyrok dot. WIBOR-u w umowie kredytu – dlaczego nie sposób zgodzić się z argumentacją Sądu Okręgowego w Suwałkach

Kilka dni temu opublikowano na portalu Infor.pl artykuł, w którym mec. Marta Kosowicz odniosła się do orzeczenia „wyborowego” Sądu Okręgowego w Suwałkach, ponieważ Sąd ten 23 października 2025 roku wydał wyrok „unieważniający” umowę kredytu złotowego z zastosowaniem oprocentowania zmiennego opartego o wskaźnik referencyjny WIBOR. Nieco dziwi mnie, że wspomniany artykuł powstał zanim Sąd Okręgowy w Suwałkach sporządził pisemne uzasadnienie orzeczenia, ale jak rozumiem, autorka publikacji opierała się na ustnych motywach wygłoszonych przez sędziego referenta, które w ocenie autorki artykułu stanowią wystarczająca podstawę do formułowania kompleksowej oceny zapadłego wyroku. Ja też nie znam pisemnego uzasadnienia (nie zostało sporządzone na dzień pisania nin. artykułu), ale odniosę się do niektórych tez wyrażonych przez mec. M. Kosowicz.

Przesunęliśmy wskazówki zegarów. Ktoś pospał dłużej, a ktoś inny zarobił więcej. Za nami zmiana z czasu letniego na zimowy. Takie były zasady w 2025 roku

W 2025 roku dwukrotnie przesunęliśmy już wskazówki zegarów. W związku ze zmianą czasu z letniego na zimowy jedni będą spali dłużej, a drudzy zarobili więcej. Jak należało rozliczyć czas pracy dla pracowników pracujących w nocy?

Blokada strony internetowej (nawet bez decyzji, wystarczy podejrzenie popełnienia przestępstwa) - nowa kompetencja KNF. Radca prawny: przepisy budzą poważne wątpliwości prawne

Uchwalona przez Sejm 26 września 2025 roku ustawa o rynku kryptoaktywów daje Komisji Nadzoru Finansowego prawo do natychmiastowego blokowania stron internetowych prowadzących nielegalną działalność kryptowalutową. To rewolucyjne narzędzie, które może skutecznie chronić polskich konsumentów przed oszustami z egzotycznych jurysdykcji. Problem w tym, że konstrukcja tego systemu budzi poważne wątpliwości prawne i może prowadzić do arbitralnych decyzji uderzających w legalnie działające podmioty.

REKLAMA

Ile naprawdę kosztuje pogrzeb w Polsce? Najnowszy raport WEI ujawnia koszty pożegnania bliskich

Śmierć to temat, którego większość z nas unika. Jednak kiedy przychodzi moment pożegnania, rodziny w Polsce zderzają się nie tylko z bólem straty, ale także z ogromnymi wydatkami i gąszczem formalności. Najnowszy raport Warsaw Enterprise Institute ujawnia brutalną prawdę o tym, jak wygląda proces pożegnania zmarłych w naszym kraju.

300 zł dla emerytów co miesiąc. Bez względu na dochody. Najbliżsi przejmą świadczenie po śmierci. Kiedy złożyć wniosek na 2026 rok?

Jak poprawić stan budżetu domowego seniora? Warto rozważyć to, o jakie dodatki do emerytury może się ubiegać. Choć przewidziane w obowiązujących przepisach świadczenia nie mają powszechnego charakteru, to zazwyczaj może ubiegać się o nie dość szerokie grono osób.

Na zasiłek pielęgnacyjny 500 zł miesięcznie trzeba będzie poczekać 10 lat. To za długo dla 1 mln Polaków

Nie było szans na podwyżkę zasiłku pielęgnacyjnego w 2025 r. Żadnej. Wciąż tylko 215,84 zł. I tak od 2019 r. W przyszłości nie będzie lepiej. Przedstawiciele rządu już oficjalnie potwierdzają, że najwcześniej zasiłek ten zostanie podniesiony dopiero od 1 stycznia 2029 r. To wyrok na realną wartość zasiłku pielęgnacyjnego porównując ze znacznymi podwyżkami tylko w 2025 r. dla świadczenia pielęgnacyjnego, dodatku dopełniającego i świadczenia wspierającego. Z zasiłku pielęgnacyjnego korzysta aż 1 mln osób (głównie osoby z umiarkowaną niepełnosprawnością). Nie ma kryterium dochodowego więc politycy nie mogą zamrozić  progów dochodów (tak zrobili przy zasiłkach rodzinnych).

Sprzątanie grobów po Wszystkich Świętych - nieprzestrzeganie nowych zasad może kosztować nawet 5000 zł! Uwaga na te pułapki na cmentarzach, łatwo się pomylić

Już po 1 listopada – Dniu Wszystkich Świętych oraz 2 listopada – zaduszkach. Jak co roku, był to czas pamięci o tych, którzy odeszli, szczególnie osobach bliskich. Za chwilę, korzystając z dobrej pogody oraz długiego weekendu listopadowego, zapewne ruszymy sprzątać groby po wypalonych zniczach i wkładach. Nocne przymrozki mogły też zaszkodzić żywym kwiatom, być może je też trzeba będzie wyrzucić. Jednak nawet podczas porządkowania grobów bliskich musimy pamiętać o przestrzeganiu przepisów. Także na cmentarzach obowiązują zasady segregacji, a w tym roku w niektórych miejscach czeka na nas nowość.

REKLAMA

Kolejny rok niesprawiedliwości. Dalej składki 250 000 zł są "zaparkowane" w ZUS. Bez w praktyce możliwości konsumpcji w postaci emerytury [Mundurowi sprzed 1999 r.]

Od kilku lat emeryci mundurowi z poprzedniego systemu walczą o możliwość zwiększenia emerytury mundurowej poprzez dołożenie do niej emerytury cywilnej. Chodzi o osoby, które były mundurowymi przed 1999 r. - nie mogą łączyć emerytury mundurowej i cywilnej. Od kilkunastu miesięcy osoby poszkodowane ślą petycje do rządu, Sejmu i Senatu. Bezskutecznie. Dalej składki odprowadzone przez nich do ZUS są w praktyce "zaparkowane" w ZUS bez możliwości konsumpcji w postaci emerytury.

Kawa z INFORLEX. Staż pracy 2026 – nowe wyzwania!

Kawa z INFORLEX. Staż pracy 2026 – nowe wyzwania! to bezpłatne wydarzenie online poświęcone kluczowym zmianom w przepisach, które już wkrótce wpłyną na sposób liczenia stażu pracy, uprawnień pracowniczych oraz planowania polityki kadrowej w firmach.

REKLAMA