الگوهای بزرگ تشخیصی
پیشبینی احتمال ابتلا به بیماری
بخش بزرگی از هنر پزشکی به این مربوط میشود که پزشک بتواند با کمک پرسشهای دقیق و معاینههای جسمی بفهمد بیمار موردنظر به چه مرضی مبتلا شده است. از آن دشوارتر آن است که پیشبینی کنیم فرد در آینده ممکن است به چه بیماری گرفتار شود. این همان کاری است که یک تیم فعال در حوزه هوش مصنوعی به آن میپردازد. جزئیات کارهای آنها در شماره 17 سپتامبر نشریه نیچر (Nature) به چاپ رسیده بود. این مدل که با نام دلفی
(Delphi-2M) شناخته میشود هنوز برای کاربرد در بیمارستانها آماده نیست، اما سازندگانش امیدوارند بتواند به پزشکان در پیشبینی هزار بیماری مختلف از جمله آلزایمر، سرطان و حملات قلبی کمک کند. این بیماریها هر سال میلیونها نفر را گرفتار میکنند. مدل موردنظر آنها علاوه بر کمک به بیماران در معرض خطر میتواند به مقامات دولتی در تخصیص بودجه به مناطقی که در آینده احتمالاً به منابع مالی بیشتر نیاز خواهند داشت یاری برساند.
این مدل را تیمهایی از آزمایشگاه زیستشناسی مولکولی اروپا (EM BL) در کمبریج و مرکز تحقیقات سرطان آلمان در هایدلبرگ ساختند. مدل از الگوهای زبانی بزرگی مانند GPT-5 الهام میگیرد. مدلهایی که میتوانند نثر روانی تولید کنند. الگوهای بزرگ زبانی میتوانند الگوها را در میان انبوهی از متون برگرفته از اینترنت شناسایی و کلمهای را انتخاب کنند که با بیشترین احتمال در جمله بعدی میآید. سازندگان دلفی میگویند اگر حجم زیادی از دادههای مربوط به سلامت انسان به یک مدل هوش مصنوعی تزریق شود آن مدل میتواند توانایی پیشبینی مشابهی پیدا کند.
طراحی الگوهای بزرگ زبانی جاافتاده از بسیاری جهات برای این منظور مناسب است. اما یکی از نیازهای اصلی آن است که به مدل آموزش دهیم زمان طیشده بین رویدادهای زندگی یک فرد را در نظر بگیرد. در متون نوشتاری، کلمات بلافاصله یکی پس از دیگری ظاهر میشوند، اما این امر در مورد تشخیصها در طول زندگی بیمار صادق نیست. برای مثال، تفسیر فشار خون بالا پس از تست مثبت بارداری به این بستگی دارد که فاصله این دو چند هفته باشد (که در این صورت بر بارداری تاثیر میگذارد) یا چند سال.
برای انجام چنین تعدیلاتی، بخشی از الگوی زبانی بزرگ جایگاه یک کلمه را برمبنای سن بیمار کدگذاری میکند. بااینحال، اشتباهها زیاد بود و نسخه اولیه مدل تشخیصهایی را پس از مرگ بیمار پیشبینی کرده بود. پس مدل دلفی را با دادههای 400 هزار نفر از بانک زیستی بریتانیا آموزش دادند. این پایگاه کاملترین مجموعه دادههای زیستشناسی انسانی را در جهان دارد. زمانبندی و توالی کدهای ICD-10 به مدل داده شد. این شکل اختصاری بینالمللی برای ثبت رسمی تشخیصهای پزشکان است و 1256 بیماری مختلف را نشان میدهد که در مجموعه دادههای بانک زیستی آمدهاند. بهدنبال آن، دادههای 100 هزار نفر دیگر قبل از آزمایش در سوابق درمانی دانمارکی به مدل افزوده شدند. در این مرحله تیم از دادههای 9 /1 میلیون دانمارکی از سال 1978 بهره برد تا نمونهای متنوعتر و معتبرتر نسبت به بانک زیستی بریتانیا به دست آورد.
پژوهشگران برای ارزیابی عملکرد مدل مساحت زیر منحنی (AUC) آن را اندازه گرفتند که به منطقهای در چارت احتمال اشاره میکند و در آن مقدار یک بهمعنای شرایط کامل و 5 /0 بهمعنای شرایط تصادفی است. این اندازه برای پیشبینیهایی با فاصله پنج سال از طریق دلفی از طریق دلفی به میزان 76 /5 در مورد دادههای بریتانیا و 67 /5 برای دادههای دانمارک بود. رویدادهایی که پس از یک رویداد خاص اتفاق میافتند اغلب بهدرستی پیشبینی میشدند، اما پیشبینی مواردی مانند ابتلا به ویروس که از طریق عوامل تصادفی خارجی اتفاق میافتند دشوارتر هستند. همچنین صحت مدل با مرور زمان اندکی کاهش یافت. نمره آن در پیشبینی رویدادهای 10 سال آینده بهطور میانگین 7 /0 بود.
درحالحاضر، کاربری مدل در جهان واقعی بعید بهنظر میرسد. دلفی ابتدا باید یک دوره سختگیرانه آزمایشی را بگذراند تا متخصصان بالینی این فرصت را پیدا کنند تا مطمئن شوند بیماران نتایج بهتری میگیرند. چنین فرآیندی چند سال طول میکشد. تیم دلفی برای بهروزرسانی مدل کار میکنند تا بتواند دادههای پیچیدهتری نسبت به فهرستهای زمانی تشخیصها را به کار برد. ازآنجاکه بانک زیستی بریتانیا تصاویر پزشکی و توالی ژنتیکی هم دارد افزودن این دادهها به مدل میتواند به بهبود دقت و صحت آن کمک کند.
دلفی بسیار جذاب بهنظر میرسد، اما فقط مدل پیشبینیکننده سلامت نیست. برای مثال، یک مدل هوش مصنوعی به نام فورسایت که در سال 2024 در کالج کینگز لندن ساخته شد نیز از سوابق بیماران برای پیشبینی رویدادهای آینده در حوزه سلامت استفاده میکند. نسخه بزرگتر این پروژه در ماه ژوئن متوقف شد، چرا که سازمان نظام درمان انگلستان هنگام اعطای دسترسی به دادهها به این مدل مجوزهای لازم را نگرفته بود. مدل اتوس را نیز دانشگاه هاروارد با اهداف مشابه توسعه داده است.
اگرچه بیماران باید برای دریافت منافع مستقیم دلفی مدتها انتظار بکشند، اما نسخه اولیه آن از هماکنون گنجینهای بالقوه برای زیستشناسان بهشمار میرود. سبک پیشبینی آن بیان میکند که کدام شرایط میتوانند با یکدیگر ترکیب و به این صورت ممکن است روابط کشفنشده و جدیدی بین بیماریها آشکار شوند. علاوه بر این، الگوهای دقیقتر هوش مصنوعی پیشرفتهای بزرگتری ایجاد خواهند کرد. ایوان برنی، متخصص ژنتیک میگوید: «احتمالات پیشرو هیجانآور هستند و من احساس کودکی را دارم که در مغازه آبنباتفروشی است.»