REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

REKLAMA

 

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Nie dla żołnierza pozwolenie na broń - tak orzeka Naczelny Sąd Administracyjny

Naczelny Sąd Administracyjny wydał przełomowy wyrok w sprawie pozwolenia na broń. Żołnierz zawodowy, mimo formalnego zatarcia skazania, nie otrzyma pozwolenia na broń do celów kolekcjonerskich. Sąd jednoznacznie orzekł, że przeszłość kryminalna wnioskodawcy może być brana pod uwagę przy ocenie wniosku, nawet gdy dana osoba oficjalnie uchodzi za niekaraną. Orzeczenie ma znaczenie dla wszystkich ubiegających się o pozwolenie.

Sąd Najwyższy w składzie połączonych Izb: Kontroli Nadzwyczajnej i Spraw Publicznych oraz Pracy i Ubezpieczeń Społecznych odstąpił od zasady prawnej sformułowanej w uchwale siedmiu sędziów Sądu Najwyższego z 24 września 2025 r., sygn. akt III PZP 1/25 - co to oznacza? Orzecznictwo TSUE do kosza?

Sąd Najwyższy w składzie połączonych Izb podjął przełomową uchwałę, która może zmienić bieg sporu o polski wymiar sprawiedliwości. Według najnowszego orzeczenia żaden sąd ani organ władzy publicznej nie może uznać wyroku Sądu Najwyższego za nieistniejący – nawet powołując się na prawo Unii Europejskiej. SN stwierdził jednocześnie, że Polska nie przekazała Brukseli kompetencji w zakresie organizacji sądownictwa.

Nawet 1646, 2469, 3292 czy 4115 zł dla rodziny. Komu MOPS wypłaca specjalny zasiłek?

W wyjątkowych sytuacjach ośrodki pomocy społecznej mogą wypłacić zasiłek nawet pomimo przekroczonego kryterium dochodowego. Wysokość takiego świadczenia zależy m.in. od wielkości rodziny. Co warto wiedzieć o specjalnym zasiłku celowym? Ile wynosi zasiłek w 2025 i 2026 r.? Co bierze pod uwagę MOPS?

Osoby niepełnosprawne symulują, że są bardziej niepełnosprawne niż są. Inaczej nie dostaną świadczeń

Np. niewidoma udaje przed komisją, że nie umie otworzyć drzwi. Do redakcji Infor.pl stale trafiają listy osób niepełnosprawnych podnoszących problem patologii związanych z coraz większym znaczeniem niesamodzielności w systemie pomocy dla nich. Powoduje to uznawanie za samodzielne (np. dlatego, że mają dwie sprawne ręce i mogą sobie zrobić herbatę) osób niepełnosprawnych ze stopniem znacznym. Samo orzeczenie o niepełnosprawności (w tym powołany stopień znaczny) nic nie znaczy (w praktyce) przy świadczeniu wspierającym czy dodatku dopełniającym (i przyszłym dodatku do renty z tytułu niezdolności do pracy, o ile politycy dotrzymają obietnic i go uchwalą). System wspierania niepełnosprawności przesunął się w kierunku testów samodzielności. W efekcie niewidoma, która otworzy samodzielnie drzwi w swoim mieszkaniu jest traktowana jako osoba niepełnosprawna z poważną dysfunkcją ciała (wzrok), ale całkiem samodzielnie sobie radząca w życiu. Na tyle samodzielnie, aby nie dostać 70 punktów dla świadczenia wspierającego albo dodatku dopełniającego. Osoby niepełnosprawne martwią się, że ich wsparciem będzie tylko renta, a ci bardziej pesymistyczni myślą "Jak poradzić sobie na zasiłku pielęgnacyjnym 215,84 zł i zasiłkach z MOPS".

REKLAMA

Wybierz na 2026 r. kwartalne rozliczenie VAT. Uchronisz się przed obowiązkiem prowadzenia ksiąg elektronicznie i wysyłką JPK

Obowiązek elektronicznego prowadzenia ksiąg to zmiana, która jest zapowiadana od 2021 roku, a termin jej wprowadzenia wciąż jest odraczany. I gdy wydawało się, że nic już nie uratuje podatników i od 1 stycznia 2026 r. zmiany staną się faktem, pojawił się temat kwartalnego rozliczania VAT. O co chodzi?

W PFRON punkty (1-10) a dopłaty do samochodów. W innych programach dla stopnia znacznego więcej (do 10 pkt). Mniej dla umiarkowanego (od 1 pkt w górę)

System punktów w PFRON zwiększa szanse na przyznanie świadczeń, które są najbardziej atrakcyjne. Przykładem są dopłaty do samochodów dla osób niepełnosprawnych w stopniu znacznym (często 100 000 zł do samochodu). Dzięki systemowi punktów można otrzymać dodatkowe punkty do wniosku o taką dopłatę. Maksymalna korzyść to 10 punktów.

Nie masz odpowiedniego dostępu do drogi publicznej? Możesz żądać od sąsiadów tzw. drogi koniecznej. Sąd Najwyższy wyjaśnił na czym polega ta służebność

Zgodnie z przepisem art. 145 § 1 Kodeksu cywilnego, jeżeli nieruchomość nie ma odpowiedniego dostępu do drogi publicznej lub do należących do tej nieruchomości budynków gospodarskich, właściciel może żądać od właścicieli gruntów sąsiednich ustanowienia za wynagrodzeniem potrzebnej służebności drogowej (droga konieczna). Ustawodawca nie zdefiniował jednakże pojęcia „odpowiedniego dostępu”, w związku z czym bywa to przedmiotem różnorakich interpretacji. Ostatnio tj. w dniu 25 listopada 2025 r. Sąd Najwyższy w postanowieniu wydanym w sprawie I CSK 1612/25 wskazał, że nieruchomość ma odpowiedni dostęp do drogi publicznej w rozumieniu art. 145 § 1 k.c., jeżeli z siecią dróg publicznych w rozumieniu ustawy o drogach publicznych łączy ją szlak drożny wydzielony geodezyjnie jako droga, która chociaż nie jest zaliczona do sieci dróg publicznych, to pozwala na powszechny i nieskrępowany dostęp do nieruchomości ogółowi osób.

Studnie bez pozwolenia – do kiedy można zgłosić? Nowe przepisy

Nielegalne studnie w Polsce. Rząd rozważa wprowadzenie czasowej abolicji, która pozwoli właścicielom niezgłoszonych ujęć wody uniknąć wysokich kar, o ile w odpowiednim terminie zgłoszą je do legalizacji. Po tym okresie sankcje mogą być surowe – nawet kilkadziesiąt tysięcy złotych. Czy rolnicy zdążą skorzystać z tej szansy?

REKLAMA

Abonament RTV: czy po 100 latach zostanie zlikwidowany?

Początki abonamentu RTV sięgają lat 20. dwudziestego wieku. Negatywnie odnosił się do niego m.in. premier Donald Tusk. Czy abonament RTV po 100 latach zostanie zlikwidowany?

Turnus rehabilitacyjny z dofinansowaniem PFRON. Jakie kryteria w 2026 r.?

Turnus rehabilitacyjny jest ważną formą wsparcia osób z niepełnosprawnościami. To nie tylko ćwiczenia, ale też wypoczynek i forma nabywania umiejętności społecznych. Przepisy przewidują możliwość dofinansowania takiego pobytu. Ile ono wynosi? Jakie kryteria będą obowiązywały na początku 2026 roku?

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA