مدل جدید هوشمصنوعی گوگل دیپمایند میتواند دیانای را رمزگشایی و جهشهای ژنتیکی را پیشبینی کند و درهای تازهای به روی پژوهش بیماریها میگشاید.
دیانای ما از میلیونها ترکیب ژنومی تشکیل شده که بدن انسان را میسازد. حتی کوچکترین تغییر در این توالیها یا در شیوه عملکردشان میتواند کارکرد کل بدن را تغییر دهد و به بیماریهایی مثل سرطان منجر شود.
آلفاجنوم، ابزار تازه هوش مصنوعی گوگل، میتواند بخشهای بزرگی از دیانای را بخواند و پیشبینی کند بخشهای مختلف چگونه رفتار میکنند و تغییرات چگونه ممکن است به بیماری منجر شوند.
این ابزار با بهرهگیری از یادگیری عمیق و با الهام از نحوه پردازش اطلاعات در مغز طراحی شده تا به دانشمندان کمک کند سازوکار دیانای را بهتر بفهمند.
ابزار جدید گوگل با پیشبینی کارکرد بخشهای طولانی کد ژنتیکی، به رمزگشایی از اینکه دیانای چگونه ژنها را کنترل میکند کمک میکند.
گوگل دیپمایند گفت: «ما معتقدیم آلفاجنوم میتواند منبعی ارزشمند برای جامعه علمی باشد و به دانشمندان کمک کند کارکرد ژنوم و زیستشناسی بیماری را بهتر درک کنند و در نهایت محرک کشفیات تازه زیستی و توسعه درمانهای جدید شود.»
آلفاجنوم چگونه کار میکند؟
این مدل تا یک میلیون حرف دیانای را با دقت تکحرفی میخواند؛ کاری که با ابزارهای قبلی ممکن نبود.
دیانای از زنجیرههای بلندی تشکیل شده که از چهار واحد شیمیایی پایه به نام نوکلئوتید ساخته میشوند و هرکدام با یک حرف شناخته میشوند: A، C، G و T. این مولکول مانند دفترچه راهنما برای ساخت و کنترل هر سلول عمل میکند.
تنها حدود دو درصد از دیانای انسانی مستقیما برای پروتئینها کدگذاری میکند؛ بلوکهای سازندهای که بیشتر کارها را در سلولهای ما انجام میدهند.
۹۸ درصد باقیمانده مدتها «دیانای زائد» تلقی میشد؛ اما این توالیها بهجای بیمصرف بودن، مثل پنلهای کنترلی عمل میکنند و نحوه کار آن دو درصد را تنظیم میکنند.
این بخشها تعیین میکنند ژنها چه زمانی، کجا و با چه شدتی روشن یا خاموش شوند، به سیگنالهای محیطی پاسخ دهند و بر اسپلایسینگ آرانای اثر بگذارند؛ سامانهای که توالیهای حروف را بههم متصل میکند و به یک ژن واحد امکان میدهد خوانشهای متفاوتی تولید کند.
بسیاری از واریانتهای مرتبط با بیماری در همین بخشها پنهاناند و بدون دستزدن به پروتئینها فعالیت ژنها را تحتتاثیر قرار میدهند.
آلفاجنوم نخستین مدل یادگیری عمیق است که میتواند این بخشهای دیانای را هدف بگیرد و کارکردشان را پیشبینی کند.
این مدل میتواند برآورد کند تغییرات کوچک ژنتیکی که «واریانت» نام دارند چگونه ممکن است فعالیت ژنها را تحتتاثیر قرار دهند یا فرایندهای طبیعی مرتبط با بیماریهایی مانند سرطان را مختل کنند.
در عمل چگونه کار میکند؟
بهعنوان یک نمونه واقعی، پژوهشگران بر نوعی لوسمی حاد، سرطان گلبولهای سفید، تمرکز کردند؛ جایی که سلولهای تی نابالغ، سربازان سیستم ایمنی، بیرویه رشد میکنند.
برخی موارد لوسمی ناشی از تغییرات کوچک در دیانای هستند که خودِ پروتئین را عوض نمیکنند بلکه شدت یا زمان روشن شدن برخی ژنها را تغییر میدهند.
مدل آلفاجنوم توالی طبیعی دیانای را با نسخه جهشیافته مقایسه کرد و پیشبینی کرد این جهش تا چه حد ممکن است فعالیت ژنهای مجاور را افزایش دهد.
این مدل فعلا برای پژوهشهای غیرتجاری بهصورت رایگان در دسترس دانشمندان است؛ ابزاری پژوهشی است و برای استفاده بالینی طراحی نشده.
چه کمکی میکند؟
تیم پژوهشی برای این مدل جدید کاربردهای متعددی میبیند.
در زیستشناسی مولکولی میتواند مثل یک ابزار آزمایشگاهی مجازی عمل کند و به دانشمندان امکان دهد پیش از انجام آزمایشهای پرهزینه ایدهها را بهصورت شبیهسازی بیازمایند.
در زیستفناوری میتواند به طراحی درمانهای ژنتیکی یا بهینهسازی مولکولهایی که بافتهای مشخصی را هدف میگیرند کمک کند.
رابرت گلدستون، رئیس ژنومیکس در موسسه فرانسیس کریک، گفت: «آلفاجنوم دیپمایند یک نقطه عطف مهم در حوزه هوش مصنوعی ژنومی است.»
او افزود سطح تفکیکپذیری که این مدل جدید ممکن میکند جهشی است که فناوری را از علاقهای صرفا نظری به کاربری عملی منتقل میکند و به دانشمندان امکان میدهد ریشههای ژنتیکی بیماریهای پیچیده را بهصورت برنامهریزیشده مطالعه و شبیهسازی کنند.
گلدستون افزود: «آلفاجنوم راهحل معجزهآسا برای همه پرسشهای زیستی نیست اما ابزاری بنیادی و باکیفیت است که کد ایستای ژنوم را به زبانی قابل رمزگشایی برای کشف بدل میکند.»
با این حال دانشمندان هشدار میدهند آلفاجنوم هم مانند همه مدلهای هوش مصنوعی فقط به اندازه دادههایی که با آن آموزش دیده کارآمد است.
بن لهنر، رئیس ژنومیکس مولد و ترکیبی در موسسه ولکام سنگر در بریتانیا، گفت: «بیشتر دادههای موجود در زیستشناسی برای هوش مصنوعی چندان مناسب نیستند؛ مجموعهدادهها خیلی کوچکاند و بهخوبی استانداردسازی نشدهاند.»
به گفته او مهمترین چالش در حال حاضر این است که چگونه دادههای لازم برای آموزش نسل بعدی مدلهای هوش مصنوعی تولید شود.