هڪ نئون مطالعو جانچي ٿو ته ڪئين وڏي ٻولي جا ماڊل مختلف طبي حوالن ۾ انجام ڏين ٿا ، بشمول حقيقي ايمرجنسي روم جا ڪيس - جتي گهٽ ۾ گهٽ هڪ ماڊل انساني ڊاڪٽرن کان وڌيڪ صحيح لڳي رهيو هو.

اهو مطالعو هن هفتي سائنس ۾ شايع ڪيو ويو ۽ هارورڊ ميڊيڪل اسڪول ۽ بيٿ اسرائيل ڊاڪونس ميڊيڪل سينٽر ۾ ڊاڪٽر ۽ ڪمپيوٽر سائنسدانن جي اڳواڻي ۾ هڪ تحقيقي ٽيم مان آيو. محققن جو چوڻ آهي ته انهن مختلف قسم جا تجربا ڪيا ته اندازو لڳايو ته OpenAI جا ماڊل انساني طبيبن جي مقابلي ۾ ڪيئن آهن.

هڪ تجربي ۾، محقق 76 مريضن تي ڌيان ڏنو جيڪي بيٿ اسرائيل جي ايمرجنسي روم ۾ آيا، ٻن حاضري ڪندڙ طبيب پاران پيش ڪيل تشخيص جو مقابلو ڪيو ويو جيڪي OpenAI جي o1 ۽ 4o ماڊلز پاران ٺاهيل آهن. انهن تشخيص جو جائزو ورتو ويو ٻن ٻين حاضري ڪندڙ طبيب، جن کي خبر نه هئي ته ڪهڙا انسانن مان آيا آهن ۽ جيڪي AI کان آيا آهن.

”هر تشخيصي ٽچ پوائنٽ تي، o1 يا ته ٻن حاضري ڪندڙ طبيب ۽ 4o جي مقابلي ۾ يا ان جي مقابلي ۾ بهتر نموني پرفارم ڪيو،“ مطالعي چيو، وڌيڪ چيو ته اختلاف ”خاص طور تي پهرين تشخيصي ٽچ پوائنٽ (ابتدائي ER ٽريج) تي واضح ڪيا ويا، جتي مريض بابت گهٽ ۾ گهٽ معلومات موجود آهي ۽ صحيح فيصلو ڪرڻ لاءِ سڀ کان وڌيڪ تڪڙي ضرورت آهي.

هارورڊ ميڊيڪل اسڪول جي مطالعي بابت پريس رليز ۾، محققن زور ڏنو ته انهن "ڊيٽا کي اڳ ۾ ئي پروسيس نه ڪيو" - اي آئي ماڊل ساڳئي معلومات سان پيش ڪيا ويا جيڪي هر تشخيص جي وقت تي اليڪٽرانڪ ميڊيڪل رڪارڊ ۾ موجود هئا.

انهي معلومات سان، o1 ماڊل 67 سيڪڙو ٽريج ڪيسن ۾ ”صحيح يا تمام ويجهي تشخيص“ پيش ڪرڻ ۾ ڪامياب ٿي ويو، ان جي مقابلي ۾ هڪ طبيب جنهن وٽ وقت جي 55 سيڪڙو صحيح يا ويجهي تشخيص هئي، ۽ ٻئي جي لاءِ جنهن وقت جو 50 سيڪڙو نشان لڳايو.

"اسان AI ماڊل کي عملي طور تي هر معيار جي خلاف آزمايو، ۽ اهو اڳئين ماڊل ۽ اسان جي طبيب جي بنيادي اصولن کي ختم ڪري ڇڏيو،" ارجن منرائي چيو، جيڪو هارورڊ ميڊيڪل اسڪول ۾ اي آءِ ليب جو سربراهه آهي ۽ مطالعي جي مکيه ليکڪن مان هڪ آهي، پريس رليز ۾.

واضح ٿيڻ لاءِ ، مطالعي جي دعويٰ نه ڪئي وئي ته AI ايمرجنسي روم ۾ حقيقي زندگي يا موت جا فيصلا ڪرڻ لاءِ تيار آهي. ان جي بدران، اهو چيو ته نتيجن کي ڏيکاري ٿو "ممڪن آزمائشي جي تڪڙي ضرورت آهي حقيقي دنيا جي مريضن جي سنڀال سيٽنگن ۾ انهن ٽيڪنالاجي جو جائزو وٺڻ لاء."

محققن اهو پڻ نوٽ ڪيو ته انهن صرف اهو مطالعو ڪيو ته ماڊل ڪيئن ڪارڪردگي ڏيکارين ٿا جڏهن ٽيڪسٽ تي ٻڌل معلومات مهيا ڪئي وئي آهي، ۽ اهو "موجوده اڀياس اهو ظاهر ڪن ٿا ته موجوده بنيادن جا ماڊل غير متن جي آڌار تي دليلن ۾ وڌيڪ محدود آهن."

ايڊم روڊمن، هڪ بيٿ اسرائيل جو ڊاڪٽر جيڪو پڻ مطالعي جي مکيه ليکڪن مان هڪ آهي، گارجين کي ٻڌايو ته AI تشخيص جي چوڌاري "حساب ڏيڻ لاء في الحال ڪوبه باضابطه فريم ورڪ" ناهي، ۽ مريض اڃا تائين "چاهن ٿا ته انسان انهن جي رهنمائي ڪن زندگي يا موت جي فيصلن ذريعي [۽] انهن جي رهنمائي ڪرڻ لاء مشڪل علاج جي فيصلن ذريعي".