REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

Subskrybuj nas na Youtube
Dołącz do ekspertów Dołącz do grona ekspertów
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

REKLAMA

 

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
Senat: Komornik łatwiej sprzeda Twoje mieszkanie. Jak nie dasz rady z kredytem

Zasadą staje się bowiem licytacja elektroniczna nieruchomości przez komornika. Ustawa nowelizująca odpowiednio kodeksu postępowania cywilnego jest w Senacie.

Kancelaria, która słucha i sprzedaje - jak budować nowoczesną markę w zgodzie z wartościami?

Marketing kancelarii to nie fast food. Budowanie marki kancelarii to proces na lata. Przemyślana i wdrażana na bieżąco strategia, długoterminowe i krótkoterminowe plany, odpowiednio dobrane narzędzia - brzmi jak wyzwanie. Czy to się opłaca?

Jest decyzja! 10 listopada dniem wolnym od pracy. Jednak nie dla wszystkich

Premier zdecydował, że 10 listopada 2025 roku będzie dniem wolnym od pracy dla urzędników państwowych. Dzięki tej decyzji pracownicy służby cywilnej będą mieli czterodniowy weekend, który potrwa od soboty 8 listopada do wtorku 11 listopada, czyli Narodowego Święta Niepodległości. Oto szczegóły.

Rzecznik Generalny TSUE przeciwny podważaniu metody wyznaczania WIBOR. Nie będzie masowego kwestionowania wszystkich umów z WIBOR-em

W większości sporów sądowych o WIBOR konsumenci zarzucają bankom, że nie wskazały w umowie metody ustalania WIBOR. Kategoryczna opinia Rzecznika Generalnego Trybunału Sprawiedliwości Unii Europejskiej, w tym zakresie znacząco zmniejsza szanse konsumentów na skuteczne podważenie WIBOR w swoich umowach kredytowych – piszą radca prawny Bartłomiej Rybicki oraz radca prawny Bartłomiej Ślażyński z Kancelarii Radców Prawnych Anety Ciechowicz-Jaworskiej i Bartłomieja Ślażyńskiego.

REKLAMA

Bon kaucyjny za zwrócone butelki i puszki? MKiŚ: to legalne ale tylko gdy bon da się wymienić na pieniądze przez co najmniej 1 miesiąc

Ministerstwo Klimatu i Środowiska w komunikacie z 16 września 2025 r. poinformowało, że Polskie przepisy o systemie kaucyjnym jednoznacznie wskazują, że przy zwrocie opakowania ze znakiem kaucji, osobie zwracającej butelkę lub puszkę należy się zwrot w formie pieniężnej (np. w gotówce albo na kartę). Dopuszczalne prawnie jest jednak wydanie (np. przez automat) bonu lub kuponu, z kwotą kaucji - o ile taki druk da się łatwo spieniężyć i będzie on ważny przynajmniej miesiąc.

Rewolucja w recyklingu: system kaucyjny wchodzi w życie! Jak wpłynie na Ciebie, środowisko i gospodarkę? [WYWIAD]

Polska rozpoczyna rewolucję w recyklingu! Od października wchodzi w życie system kaucyjny dla butelek i puszek, który ma zwiększyć poziom selektywnej zbiórki, poprawić jakość surowców i dostosować kraj do wymogów Unii Europejskiej. Joanna Leoniewska-Gogola, liderka zespołu circular economy w Deloitte, tłumaczy w wywiadzie dla Infor.pl, jakie zmiany czekają konsumentów, przedsiębiorców i gospodarkę odpadami.

Dla kogo certyfikaty cyberbezpieczeństwa? Czy są obowiązkowe? Ustawa o krajowym systemie certyfikacji cyberbezpieczeństwa już weszła w życie

Certyfikaty cyberbezpieczeństwa są przeznaczone dla profesjonalistów IT, w tym dla administratorów systemów i sieci, specjalistów od bezpieczeństwa, inżynierów oraz osób aspirujących do tych ról, aby potwierdzić ich wiedzę i umiejętności praktyczne w zakresie ochrony przed zagrożeniami cyfrowymi. Certyfikacja obejmuje także produkty, usługi i procesy ICT, a ich celem jest informowanie konsumentów o poziomie bezpieczeństwa cyfrowego oraz wspieranie polskich firm na rynkach europejskich. Czy i dla kogo uzyskanie certyfikatów cyberbezpieczeństwa jest obligatoryjne?

Będą kolejne ograniczenia dot. ogrzewania kominkami. Nowelizacja rozporządzenia ws. warunków technicznych budynków

Od początku 2025 roku Ministerstwo Rozwoju i Technologii, a po ostatniej rekonstrukcji rządu Ministerstwo Finansów i Gospodarki prowadzi prace nad zmianą rozporządzenia Ministra Infrastruktury z dnia 12 kwietnia 2002 r. w sprawie warunków technicznych, jakim powinny odpowiadać budynki i ich usytuowanie. Poprzednia poważniejsza nowelizacja tego rozporządzenia miała miejsce w roku 2021. Dotychczasowe zmiany tego rozporządzenia każdorazowo i stopniowo wprowadzały nowe ograniczenia dla instalacji kominków, pieców i trzonów kuchennych. W projekcie najnowszych zmian tendencja ta jest utrzymana. I niestety, tak jak przy poprzednich zmianach, wprowadzane ograniczenia nie mają żadnego uzasadnienia technicznego.

REKLAMA

[Stare i nowe świadczenie pielęgnacyjne 3386 zł] W 2026 r. osoby niepełnosprawne i opiekunowie z podwyżką 99 zł

Zasiłek pielęgnacyjny nie będzie miał podwyżki (aż do początku 2028 r.). Jak rząd tłumaczy, dlatego, że 1 mln osób z zasiłkiem pielęgnacyjnym (większa część ze stopniem umiarkowanym niepełnosprawności) może się starać o świadczenie wspierające, które otrzymywało na koniec marca 2025 r. około 120 000 osób niepełnosprawnych (większa część beneficjentów ma stopień znaczny niepełnosprawności). Zupełnie inna sytuacja w 2026 r. (i kolejnych latach jest w świadczeniu pielęgnacyjnym (zarówno "starym" jak i "nowym"). W 2026 r. świadczenie to będzie podwyższone o 99 zł. To 3% podwyżka na 2026 r. Nie tak duża jak w latach minionych, kiedy mieliśmy galopująca inflację. Ale porównując z 0% podwyżki dla zasiłku pielęgnacyjnego, nie wygląda to źle. Opiekunowie osób niepełnosprawnych otrzymają w 2026 r. 3386 zł.

WIBOR w umowach kredytu. Czy opinia Rzeczniczki Generalnej TSUE, to sukces konsumentów, czy banków?

W dniu 11 września 2025 r. Rzeczniczka Generalna Trybunału Sprawiedliwości Unii Europejskiej wydała opinię w sprawie C-471/24 z wniosku o wydanie orzeczenia w trybie prejudycjalnym złożonego przez Sąd Okręgowy w Częstochowie. Opinia ta jest całkowicie korzystna dla kredytobiorców i niekorzystna dla banków – twierdzi Radca Prawny Michał Kanabaja z Kancelarii Rachelski i Wspólnicy.

REKLAMA