Harvard Tıp Fakültesi ve Beth Israel Deaconess Tıp Merkezi araştırmacılarının yaptığı yeni çalışma, yapay zeka modellerinin acil servis vakalarında tanı koyma performansını mercek altına aldı. Araştırmada OpenAI’ın o1 modeli, bazı acil servis senaryolarında iki insan doktordan daha isabetli sonuçlar verdi. Ancak uzmanlar, bunun yapay zekanın tek başına hasta yönetmeye hazır olduğu anlamına gelmediği konusunda uyarıyor.
Bilim insanları, yapay zekanın tıpta ne kadar güvenilir olabileceğini anlamak için gerçek acil servis vakalarını inceledi. Çalışmada Beth Israel acil servisine başvuran 76 hastanın verileri kullanıldı.
Araştırmacılar, hastalara dair elektronik sağlık kayıtlarında o anda mevcut olan bilgileri hem doktorlara hem de yapay zeka modellerine sundu. Daha sonra iki iç hastalıkları uzmanının koyduğu tanılar, OpenAI’ın o1 ve 4o modellerinin verdiği tanılarla karşılaştırıldı.
Sonuçlara göre o1 modeli, özellikle hastayla ilgili bilginin en az olduğu ve hızlı karar verilmesi gereken ilk triyaj aşamasında dikkat çekici bir performans gösterdi. Model, vakaların yüzde 67’sinde kesin ya da çok yakın tanıya ulaşırken, doktorlardan biri yüzde 55, diğeri ise yüzde 50 oranında benzer başarı yakaladı.
Araştırmacılar, yapay zekaya önceden özel bir düzenleme yapılmadığını, sistemin doktorların o anda görebildiği aynı metin tabanlı hasta bilgileriyle çalıştığını belirtti. Bu da sonucun özellikle dikkat çekici bulunmasına yol açtı.
Çalışma, yapay zekanın doktorların yerine geçebileceğini söylemiyor. Araştırmacılar da bu noktada temkinli. Elde edilen bulguların, yapay zeka sistemlerinin gerçek hasta bakımında kontrollü ve ileri klinik çalışmalarla test edilmesi gerektiğini gösterdiği vurgulanıyor.