اولین قدم در انتخاب درمان مناسب برای یک بیمار سرطانی، شناسایی نوع خاص سرطان اوست، از جمله تعیین محل اولیه اندام یا بخشی از بدن که در آن سرطان شروع میشود.
در موارد نادر، حتی با انجام آزمایشات گسترده نمیتوان منشاء سرطان را تعیین کرد. اگرچه سرطانهای اولیه ناشناخته تهاجمی هستند، متخصصان سرطان باید آنها را با درمانهای غیر هدفمند درمان کنند که اغلب سمیتهای شدیدی داشته و منجر به نرخ پایین بقا میشوند.
یک رویکرد یادگیری عمیق جدید که توسط محققان موسسه کُخ برای تحقیقات سرطان یکپارچه در MIT و بیمارستان عمومی ماساچوست (MGH) ایجاد شده است، ممکن است با نگاهی دقیقتر به برنامههای بیان ژن مربوط به رشد و تمایز سلولی اولیه، به طبقهبندی سرطانهای اولیه ناشناخته کمک کند.
سالیل گارگ، محقق بالینی چارلز دبلیو (۱۹۵۵) و جنیفر سی جانسون، محقق بالینی در انستیتوی کخ و پاتولوژیست در موسسه کخ، میگوید: «گاهی اوقات میتوانید تمام ابزارهایی را که پاتولوژیستها ارائه میدهند، به کار ببرید و همچنان بدون پاسخ بمانید. ابزارهای یادگیری ماشینی مانند این میتوانند انکولوژیستها را برای انتخاب درمانهای موثرتر و راهنماییهای بیشتر به بیمارانشان توانمند کنند.»
گارگ نویسنده ارشد یک مطالعه جدید در این باره میگوید: ابزار هوش مصنوعی قادر است انواع سرطان را با حساسیت و دقت بالایی شناسایی کند.
یادگیری ماشین در توسعه
تجزیه تفاوت در بیان ژن در میان انواع مختلف تومورهای اولیه ناشناخته یک مشکل ایدهآل برای حل یادگیری ماشینی است. سلولهای سرطانی کاملا متفاوت از سلولهای طبیعی به نظر رسیده و رفتار میکنند که تا حدی به دلیل تغییرات گسترده در نحوه بیان ژنهایشان است. به لطف پیشرفتها در پروفایلسازی تک سلولی و تلاشها برای فهرستبندی الگوهای بیان سلولی مختلف در اطلسهای سلولی، دادههای فراوانی وجود دارد که حاوی سرنخهایی درباره منشاء سرطانهای مختلف است.
با این حال ساختن یک مدل یادگیری ماشینی که از تفاوتهای بین سلولهای سالم و طبیعی و در میان انواع مختلف سرطان، به عنوان ابزار تشخیصی استفاده میکند، یک اقدام متعادل کننده است. اگر یک مدل خیلی پیچیده باشد و ویژگیهای بیش از حد بیان ژن سرطان را به همراه داشته باشد، ممکن است به نظر برسد که مدل دادههای آموزشی را به خوبی یاد میگیرد، اما زمانی که با دادههای جدید مواجه میشود دچار تزلزل میشود. با این حال با سادهسازی مدل از طریق محدود کردن تعداد ویژگیها، مدل ممکن است انواع اطلاعاتی را که منجر به طبقهبندی دقیق سرطان مختلف میشود، از دست بدهد.
به منظور ایجاد تعادل بین کاهش تعداد ویژگیها و در عین حال استخراج مرتبطترین اطلاعات، تیم این مدل را بر روی علائم مسیرهای رشد تغییر یافته در سلولهای سرطانی متمرکز کرد. همانطور که یک جنین رشد میکند و سلولهای تمایز نیافته در اندامهای مختلف تخصص مییابند، مسیرهای زیادی نحوه تقسیم، رشد، تغییر شکل و مهاجرت سلولها را هدایت میکنند. با رشد تومور، سلولهای سرطانی بسیاری از ویژگیهای تخصصی یک سلول بالغ را از دست میدهند. در همان زمان، آنها شروع به شبیه شدن به سلولهای جنینی میکنند، زیرا توانایی تکثیر، تبدیل و متاستاز به بافتهای جدید را به دست میآورند. بسیاری از برنامههای بیان ژنی که جنینزایی را هدایت میکنند، شناخته شدهاند که در سلولهای سرطانی مجددا فعال شده یا تنظیم نمیشوند.
محققان دو اطلس سلولی بزرگ را با هم مقایسه کردند و ارتباط بین تومور و سلولهای جنینی را شناسایی کردند: اطلس ژنوم سرطان (TCGA) که حاوی دادههای بیان ژن برای ۳۳ نوع تومور است و اطلس سلولی ارگانوژنز موش (MOCA) که ۵۶ مسیر مجزا از تومور را نشان میدهد.
مویسو توضیح میدهد: ابزارهای تفکیک سلولی به طرز چشمگیری نحوه مطالعه ما در مورد بیولوژی سرطان را تغییر دادهاند، اما اینکه چگونه این انقلاب را برای بیماران تاثیرگذار کنیم سوال دیگری است. با ظهور اطلسهای سلولی تکاملی، به ویژه آنهایی که بر مراحل اولیه اندام زایی مانند MOCA تمرکز میکنند، میتوانیم ابزارهای خود را فراتر از اطلاعات بافت شناسی و ژنومی گسترش دهیم و درها را به روی روشهای جدید پروفایل و شناسایی تومورها و توسعه درمانهای جدید باز کنیم.
محققان بیان ژن نمونههای تومور از TCGA را به اجزای جداگانهای که مربوط به یک نقطه زمانی خاص در مسیر رشد است؛ آنها سپس یک مدل یادگیری ماشینی به نام پرسپترون چند لایه توسعهای (D-MLP) ساختند که یک تومور را برای اجزای رشدی آن نمره بندی کرده و سپس منشاء آن را پیش بینی میکند.