REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

REKLAMA

 

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Niepełnosprawność 05-R w 2026 roku. Do czego uprawnia orzeczenie? [Przykłady]

Symbol przyczyny niepełnosprawności 05-R jest jednym z ważnych elementów orzeczenia. Co oznacza? Czy daje prawo do szczególnych ulg i świadczeń? Na jaką pomoc mogą w 2026 roku liczyć osoby z niepełnosprawnością ruchu? Odpowiadamy na ważne pytania.

NFZ jednak płaci więcej, niż zapowiadał, ale to nadal za mało. Którzy pacjenci odczują ograniczenia w dostępie do badań?

Zmiany w zakresie finansowania przez NFZ świadczeń realizowanych ponad limit kontraktu nie są tak drastyczne, jak pierwotnie zapowiadano. To jednak nie oznacza, że pacjenci ich nie odczują. Choć celem jest wyeliminowanie nieprawidłowości, to jednak jednocześnie pogarsza się dostęp pacjentów do badań diagnostycznych.

Rząd pracuje nad zmianami w MOPS. Możliwe (choć niepewne) nowości w zasiłkach rodzinnych i zasiłku celowym

Zmiany wynikają z projektu nowelizacji ustawy o pomocy społecznej. Pierwsze dwie nowości w przepisach dotyczą zasiłku celowego, a trzecia zasiłków rodzinnych. Nowelizacja przepisów o zasiłkach rodzinnych - jeżeli wejdzie w życie - jest ważniejsza, gdyż oznacza pośrednie podniesienie progów dochodowych. Dziś zasiłek rodzinny przysługuje, jeżeli przeciętny miesięczny dochód rodziny w przeliczeniu na osobę albo dochód osoby uczącej się nie przekracza kwoty 674 zł. W przypadku niepełnosprawności dziecka limit podniesiony jest do 764 zł. To kwoty w praktyce poniżej minimum socjalnego. Po nowelizacji zastosowanie miałyby limity z systemu pomocy społecznej: od 1 stycznia 2025 r. kwoty kryteriów dochodowych uprawniających do świadczeń z pomocy społecznej dla osoby samotnie gospodarującej wynoszą 1010 zł, a dla osoby w rodzinie – 823 zł.

Nabycie spadku - dwie możliwości dziedziczenia, dwa sposoby potwierdzenia praw

Śmierć bliskiej osoby powoduje potrzebę uporządkowania spraw związanych z jej odejściem. Dobrze jest zająć się tą kwestią w możliwie nieodległym terminie, w szczególności gdy zmarła osoba prowadziła jakąś działalność gospodarczą. Jakie są możliwości nabycia spadku i w jaki sposób dopełnić formalności?

REKLAMA

KE zaakceptowała polską umowę SAFE. Podpisanie umowy już w ten piątek

Komisja Europejska zaakceptowała polską umowę pożyczkową SAFE. To blisko 190 mld zł dla armii i przemysłu zbrojeniowego - poinformował we wtorek wieczorem na platformie X wicepremier, szef MON Władysław Kosiniak-Kamysz. Umowa ma być podpisana w najbliższy piątek.

Alimenty na dziecko w 2026 roku. Ile wynoszą? Kiedy rodzic nie musi płacić?

Wokół obowiązku alimentacyjnego rodziców względem dzieci narosło wiele mitów. Co wpływa na wysokość alimentów? Czy jest granica wieku, do której płaci się alimenty? Co w przypadku tzw. opieki naprzemiennej? Oto przydatny poradnik.

Od 8 lipca korzystając z usług przedsiębiorcy możemy stać się przymusowo jego pracodawcą. Dlaczego umowa o pracę jest najbardziej dyskryminowaną fiskalnie formą działalności?

Uchwalona (i podpisana) przez Prezydenta nowelizacja ustawy o PIP może od 8 lipca 2026 r. zdezorganizować i nawet częściowo zniszczyć nie tylko polski biznes, lecz również tysiące nieprowadzących działalności gospodarczej podmiotów korzystających z usług samozatrudnionych, przy okazji likwidując również ich firmy – pisze prof. dr hab. Witold Modzelewski. Tu wszyscy będą poszkodowani: zleceniodawcy, zleceniobiorcy, budżet państwa, samorząd terytorialny, ZUS, a nawet instytucje publiczne. Pomysł, aby urzędnik mógł arbitralnie narzucać stronom umowy dużo bardziej niekorzystną formę opodatkowania (i „oskładkowania), jest aktem wrogości wobec obywateli choć na usprawiedliwienie naszej klasy politycznej zasługuje tylko to, że jest to „unijny import regulacyjny”, czyli tak każe Bruksela.

4 tys. zł miesięcznie z ZUS świadczenia wspierającego dla niepełnosprawnych w 2026. Czy będą zmiany w 2027 r.

Od 1 stycznia 2026 roku grono uprawnionych do świadczenia wspierającego zostało rozszerzone po raz trzeci i ostatni. Do systemu weszły osoby z poziomem potrzeby wsparcia określonym na 70–77 punktów, co zamknęło trzyletni harmonogram wdrażania jednej z największych reform wsparcia dla osób z niepełnosprawnościami od lat.

REKLAMA

Udostępnienie danych z rejestrów mieszkańców oraz rejestru PESEL. Opłaty od 0,30 zł do 31 zł [Projekt rozporządzenia z 30 kwietnia 2026 r.]

W poniedziałek, 4 maja 2026 r. do uzgodnień międzyresortowych, konsultacji publicznych i do opiniowania trafił projekt rozporządzenia Rady Ministrów w sprawie opłat za udostępnianie danych z rejestrów mieszkańców oraz rejestru PESEL. Chodzi o wprowadzenie dla określonej grupy podmiotów możliwości pobrania za odpłatnością dodatkowych danych z rejestru PESEL.

Świadczenie wspierające. Jak długo się czeka w 2026 roku?

„Z informacji posiadanych przez Biuro Pełnomocnika Rządu do Spraw Osób Niepełnosprawnych wynika, że czas oczekiwania na wydanie decyzji jest zróżnicowany regionalnie (w zależności m.in. od liczby wniosków, które wpłynęły do danego WZON) i aktualnie wynosi od 3 do 10 miesięcy” – poinformowała pełnomocniczka rządu Maja Nowak.

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA