REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

REKLAMA

 

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Dodatkowe 12 dni wolnych od pracy dla wszystkich z powodu bólu uniemożliwiającego pracę i bez L4 – zamiast urlopu menstruacyjnego dla kobiet, który już obowiązuje

W OHP (tj. Ochotniczych Hufcach Pracy), będących jednostkami budżetowymi, podlegającymi pod Ministerstwo Rodziny, Pracy i Polityki Społecznej – obowiązuje tzw. urlop menstruacyjny dla zatrudnionych tam kobiet, w wymiarze 1 pełnopłatnego dnia w miesiącu, co daje łącznie 12 dodatkowych dni wolnych od pracy w ciągu roku. W ostatnim czasie, jeden z posłów, wystąpił z postulatem zastąpienia ww. urlopu – urlopem zdrowotnym, przysługującym każdemu pracownikowi (bez podziału na płeć), który miałby stanowić pełnopłatny dzień wolny od pracy (w każdym miesiącu w ciągu roku), z powodu przewlekłego lub silnego bólu uniemożliwiającego pracę.

Sprzeczne przepisy o wyrównaniach w świadczeniu wspierającym. ZUS ma art. 5 jednej ustawy, a osoby niepełnosprawne art. 26 ust. 2 innej

Fora internetowe osób niepełnosprawnych zalane są informacjami o zaprzestaniu w 2026 r. (w porównaniu do lat poprzednich) przez ZUS wypłaty wyrównań w świadczeniu wspierającym. Większa część osób wiąże to z nowelizacją przepisów. Nie było takiej. ZUS powołuje się na art. 5 jednej ustawy. Można w drodze wykładni systemowej wyprowadzić z niego podstawę do blokady wyrównań przez ZUS. Ale jednocześnie ZUS nie stosuje art. 26 ust. 2 innej ustawy, który nakazuje wprost (bez wykładni systemowej) wypłatę wyrównań. Chodzi o poważne kwoty rzędu 4000 zł, 8000 zł, 12 000 zł, 30 000 zł, 50 000 zł .... Wysokość zależy od tego ile miesięcy upłynęło między datą złożenia wniosku (od tej daty liczy się wyrównanie) a datą przyznania punktów przez WZON (jest podana w decyzji WZON - przykład na skanie dokumentu poniżej).

Od 1,5 nawet do 22 tys. złotych na hektar. O takie wsparcie można wnioskować do końca lipca 2026 r.

Z początkiem czerwca wystartował nabór wniosków o wsparcie na inwestycje leśno-zadrzewieniowe. W zależności od rodzaju inwestycji można zyskać od 1,5 do 22 tysięcy złotych na hektar m.in. na zwiększenie bioróżnorodności lasów prywatnych i tworzenie zalesień śródpolnych.

Nieważność kredytu - od kiedy liczyć odsetki? TSUE: decyduje data wezwania do zapłaty konkretnej kwoty roszczenia

W dniu 11 czerwca 2026 Trybunał Sprawiedliwości Unii Europejskiej wydał wyrok w sprawie C-903/24 (Zmarka), istotny dla kredytobiorców frankowych. Tym razem przedmiotem rozstrzygnięcia nie była kwestia abuzywności klauzul przeliczeniowych ani nieważności umowy - te sprawy zostały rozstrzygnięte wcześniej i linia orzecznicza jest tu ugruntowana. TSUE wypowiedział się w kwestii, która w praktyce sądowej generuje liczne spory: od kiedy naliczać odsetki ustawowe za opóźnienie po stwierdzeniu nieważności umowy kredytu?

REKLAMA

Cena benzyny i oleju napędowego od 20 do 22 czerwca. Podajemy ceny paliw na weekend

Minister energii podjął decyzję w sprawie wysokości maksymalnych cen detalicznych benzyny 95, benzyny 98 i oleju napędowego w dniach od 20 do 22 czerwca. Ile kierowcy zapłacą za paliwo na stacjach benzynowych w weekend?

MOPS wygrywa w sądzie: Dochód 5700 zł nie przeskoczy limitu 3292 zł

MOPS wygrywa w sądzie sprawę o zasiłek: Dochód rodziny 5700 zł nie przeskoczy limitu dochodowego 3292 zł. Zasiłku nie będzie. łMOPS odmówił jego przyznania. Bo osoba niepełnosprawna ma dochód 1420 zł na osobę w rodzinie. Zasiłki są według kryterium dochodowego dla osób poniżej 823 zł. Przekroczenie kryterium dochodowego jeszcze lepiej pokazuje suma dochodów rodziny osoby niepełnosprawnej – w sprawie rozstrzygniętej przez sąd dochód rodziny to aż 5700 zł (wszystko z zasiłków). Limit z ustawy o pomocy społecznej wynosił dla rodziny 3292 zł.

Czy czas, w którym pracownik przygotowuje się do wykonywania pracy, zalicza się do jego czasu pracy? SN nie miał wątpliwości

Czy przebieranie się i kąpiel należy zaliczać do czasu pracy pracownika? To pytanie z perspektywy jednych pracowników (i pracodawców) może być uznane za sztuczne tworzenie problemów, a z perspektywy innych stanowić istotny problem we wzajemnych relacjach. Nawet sądy nie są zgodne udzielając na nie odpowiedzi.

Sądy źle stosowały przepisy o przepadku równowartości pojazdu - są pieniądze do odzyskania, a przykładem kasacja RPO z czerwca 2026

Jeśli dostałeś wyrok na przepadek równowartości pojazdu za prowadzenie po pijaku i wyrok II instancji był po 29 stycznia 2026 r., możesz go zaskarżyć. RPO złożył właśnie w takiej sprawie kasację do Sądu Najwyższego, która dotyczyła kobiety skazanej na przepadek 19,2 tys. zł. Od stycznia 2026 r. przepadku równowartości już się nie orzeka – zamiast tego jest nawiązka. Jak dokładnie to wygląda?

REKLAMA

Polacy nie ufają sztucznej inteligencji. Ponad 70 proc. obawia się o swoje dane

Ponad 70 proc. Polaków obawia się o prywatność swoich danych w związku z rozwojem sztucznej inteligencji - wynika z raportu firmy Future Mind. Wielu dostrzega też m.in. ryzyko dla demokracji związane z dezinformacją napędzaną przez AI oraz obawia się zastosowań wojskowych tej technologii.

PZON odbierają świadczenia niepełnosprawnym. Takie są przepisy. Komisje z restrykcyjną interpretacją

Stale widzę skargi rodziców, których dzieci straciły pkt 7 w PZON - oznacza to utratę cennego świadczenia pielęgnacyjnego. Rodzice są oburzeni procedurą stosowaną przez PZON wobec ich niepełnosprawnych dzieci. Niestety wynika to z przepisów (choć trzeba przyznać restrykcyjnie interpretowanych w PZON). Dla otrzymania świadczenia dziecko w relacji do otoczenia musi spełnić wymogi tej definicji: "Całkowita zależność osoby od otoczenia, polegająca na pielęgnacji w zakresie higieny osobistej i karmienia lub w wykonywaniu czynności samoobsługowych". Jeżeli dziecko wykonuje choć część tych czynności samodzielnie (np. myje sobie zęby, wiąże buty, ubiera się, utrzymuje kontakty z rówieśnikami), to PZON odbiera pkt 7 w orzeczeniu o niepełnosprawności. Orzeczenie potwierdza niepełnosprawność, ale nie wynika z niego niesamodzielność.

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA