REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

Subskrybuj nas na Youtube
Dołącz do ekspertów Dołącz do grona ekspertów
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

 

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
Groźna bakteria w lodach. Ministerstwo Zdrowia ostrzega

Nic tak nie psuje urlopu jak zatrucie pokarmowe. Wysokie temperatury, niewłaściwe warunki przechowywania żywności i spożywanie posiłków w przypadkowych miejscach sprzyjają rozwojowi niebezpiecznych bakterii, wirusów i pasożytów. Niektóre z nich mogą poważnie zagrażać zdrowiu, a nawet życiu. Szczególnie narażone są kobiety w ciąży i dzieci.

Ważny komunikat RCB w sprawie zagrożenia powodziowego w Polsce w dniach 7-13 lipca 2025 r. Czy grozi nam powtórka sytuacji z września 2024 r.?

W dniu 4 lipca 2025 r. Rządowe Centrum Bezpieczeństwa (RCB) wydało komunikat, w którym odnosi się do pojawiających się w przestrzeni publicznej doniesień o możliwych intensywnych opadach deszczu i ryzyku powodzi w Polsce w przyszłym tygodniu (tj. w dniach 7-13 lipca 2025 r.). Czy grozi nam wytworzenie się nad Polską „niżu genueńskiego” i powtórka sytuacji z września 2024 r.?

Sondaż partyjny: Prawo i Sprawiedliwość przejmie władzę po wyborach parlamentarnych w 2027 r.? Najbardziej wierzą w to młodzi

Ponad połowa młodych Polaków do 24. roku życia (52,7 proc.) uważa, że Prawo i Sprawiedliwość wróci do władzy po wyborach parlamentarnych w 2027 roku. Wśród wszystkich badanych przekonanie to podziela 49 proc. respondentów, przy czym mężczyźni wyrażają je częściej niż kobiety — wynika z sondażu SW Research dla Onetu.

Rząd naprawia emerytury czerwcowe! Koniec z niesprawiedliwością z lat 2009–2019 – znamy szczegóły projektu ustawy

Rząd szykuje rewolucję dla tysięcy emerytów i rencistów! Nowy projekt ustawy ma zlikwidować wieloletnią niesprawiedliwość wobec osób, którym przyznano emeryturę lub rentę rodzinną w czerwcu w latach 2009–2019. Zmiany mają wyrównać ich sytuację ze świadczeniobiorcami z późniejszych lat i położyć kres tzw. „sezonowości emerytalnej”. Decyzja już we wtorek.

REKLAMA

To może być pierwsza taka sytuacja w historii Polski: Prezes NBP Adam Glapiński już ostrzega!

Historyczny moment dla polskiej gospodarki? Prezes NBP Adam Glapiński ostrzega, że już w 2026 roku dług publiczny może po raz pierwszy przekroczyć unijny próg 60 proc. PKB. Choć inflacja zbliża się do celu NBP, to fiskalna polityka rządu – najluźniejsza w całej UE poza Rumunią – może zachwiać stabilnością makroekonomiczną kraju.

Aby mieć od stycznia więcej urlopu i wyższe wypłaty, już teraz zadbaj o dokumenty. Dotyczy wszystkich pracowników

Przed nami duża zmiana dla wszystkich pracowników. Będzie dotyczyła zarówno pracowników budżetówki, jak i sektora prywatnego. Chodzi o większe pieniądze i wyższy wymiar urlopu. Żeby skorzystać, trzeba będzie mieć dowody.

Za nowy trawnik z rolki zapłaci… dostawca prądu. Przełomowy wyrok NSA, na podstawie którego tysiące właścicieli nieruchomości będzie mogło bezkosztowo odtworzyć swoje ogrody

Niejeden właściciel nieruchomości zmagał się już na pewno z usuwaniem drzew (lub krzewów) z jego nieruchomości na wniosek właściciela urządzeń przesyłowych służących do doprowadzania energii elektrycznej, z tego względu, że drzewa te (lub krzewy) – z tymi urządzeniami kolidowały (a konkretniej – zagrażały funkcjonowaniu tych urządzeń). Okazuje się, że zgodnie z najnowszym wyrokiem NSA – w takim przypadku – odszkodowanie należne od przedsiębiorstwa energetycznego, obejmuje nie tylko wartość usuniętych drzew (lub krzewów), koszty ich wycinki, ponownego zalesienia i pielęgnacji, ale również koszty odtworzenia trawnika, który – na skutek powyższych działań – uległ zniszczeniu.

Kupując nieruchomość, wpadniesz w finansową pułapkę i poniesiesz dodatkowy koszt sięgający nawet 50 tys. zł. To skutek nowych wymogów Unii Europejskiej

Dla wielu z nas zakup nieruchomości to jedna z najważniejszych decyzji w życiu. W związku z nowymi klimatycznymi celami Unii Europejskiej, nieruchomości ogrzewane węglem lub gazem będą musiały przejść kosztowną modernizację. W przeciwnym razie ich utrzymanie stanie się bardzo drogie.

REKLAMA

Nowe uprawnienia PIP i wyższe kary dla firm od 2026 r. Czy dojdzie do masowej zamiany śmieciówek w umowy o pracę? Szef PIP: uszczęśliwianie etatami na siłę się nie sprawdza

Nie będziemy masowo zmieniać umów cywilnoprawnych na etaty, a jedynie działać w przypadkach niebudzących wątpliwości – powiedział PAP szef Państwowej Inspekcji Pracy, główny inspektor pracy Marcin Stanecki. Zaznaczył, że w planowanych zmianach nie chodzi o „uszczęśliwianie etatami na siłę”, tylko o reagowanie na skargi.

Zmiana cen gazu. Chodzi o kwoty od 1 tysiąca, nawet do kilkunastu tysięcy złotych. Kto odczuje nową taryfę?

Choć większość z nas od miesięcy żyje tematem cen energii, to dla wielu osób równie istotne są ceny gazu. A te właśnie się zmieniły. Różnica obejmie rocznie kwoty od tysiąca, nawet do kilkunastu tysięcy.

REKLAMA