Розшифровка всіх видів Землі – штучний інтелект робить неможливе реальним для порятунку життя

Розшифровка всіх видів Землі - штучний інтелект робить неможливе реальним для порятунку життя

На нашій планеті розгортається надзвичайно амбітний науковий проєкт – секвенування геномів для 1,85 мільйона еукаріотичних видів. Це колосальне завдання, що обіцяє кардинально поглибити наше розуміння біології, а також стане визначальним чинником у збереженні біорізноманіття та відновленні екосистем. У цьому грандіозному починанні штучний інтелект відіграє все більш вагому роль, допомагаючи не лише швидше збирати та каталогізувати дані ДНК, а й забезпечувати їхню точність, усуваючи помилки серед мільярдів і мільярдів генетичних будівельних блоків.

Мова йде про проєкт «Геном Землі» (Earth BioGenome Project – EBP), спільну міжнародну програму, яка ставить собі за мету протягом десятиліття створити каталог геномів усіх існуючих на Землі видів. Проєкт стартував 2018 року, і його загальна вартість оцінюється майже в 5 мільярдів доларів США. EBP об’єднує понад 60 глобальних афілійованих програм, спрямованих на запис і секвенування геномів. На сьогодні вже зібрано дані для 4386 видів, що охоплюють ссавців, рептилій, риб, птахів, комах, різноманітні рослини та багато інших форм життя. Термін “еукаріотичні види” стосується організмів, клітини яких містять ядро, оточене мембраною, а також інші мембранні органели – це тварини, рослини, гриби та більшість одноклітинних організмів.

Ця робота має особливе значення, оскільки щодня зникають десятки видів – і щойно вони зникнуть, ми втратимо можливість дізнатися, як вони жили або як еволюціонували. Геном – це повний набір генетичної інформації організму, що міститься в його ДНК. Секвенування геному – це процес визначення точної послідовності нуклеотидних основ, які складають ДНК організму.

Штучний інтелект у служінні біології

Варто зазначити, що EBP поки що зробив лише незначний поступ до своєї великої мети – секвенування 1,85 мільйона геномів. Однак, слід врахувати, що за останні роки технології штучного інтелекту (ШІ) та автоматизації стрімко розвинулися, і це може значно прискорити подальші зусилля. Компанія Google відіграє в цьому важливу роль: її дослідницький підрозділ розробив цілий ряд інструментів штучного інтелекту, щоб прискорити різні етапи процесу секвенування.

Один з таких інструментів – DeepVariant, випущений у 2018 році. Він точно реконструює повну послідовність геному індивіда, використовуючи дані, отримані від сучасних інструментів високопродуктивного секвенування (High-Throughput Sequencing – HTS). Машини HTS, що існують вже кілька десятиліть, мають певні недоліки: вони виробляють лише мільярди коротких сегментів ДНК, або “прочитань”, а не повний геном. Тому обробка цих прочитань у єдину, точну послідовність є значним викликом. DeepVariant перетворює це завдання на проблему класифікації зображень, дозволяючи навченій глибокій нейронній мережі аналізувати візуалізації вирівняних прочитань і визначати, чи є розбіжність справжнім генетичним варіантом, чи просто помилкою інструменту HTS. Цей метод досягає значно більшої точності, ніж попередні.

Цього року команда з геноміки в Google Research представила DeepPolisher, покликаний допомогти в збиранні геномів. Він, як стверджується, здатний зменшити помилки в процесі збирання на 50% та запобігти тому, щоб програми анотації – які аналізують необроблені дані та ідентифікують гени та їхні функції – пропускали варіанти генів, що спричиняють захворювання.

За допомогою таких інструментів Google Research заявляє, що може допомогти дослідникам зрозуміти, як запобігти деяким захворюванням у диких видів, і надати допомогу вимираючим видам уникнути зникнення завдяки чутливим втручанням.

Історія успіху Какапо

Один із захоплюючих прикладів цього, детально викладений у відео нижче, показує скрутне становище виду Какапо. Какапо – це нелітаючий папуга, що походить з Нової Зеландії. Він може виростати до найбільшої ваги серед усіх папуг на Землі та жити до 100 років. Нова Зеландія – острівна держава в південно-західній частині Тихого океану, відома своєю унікальною та ендемічною фауною, багато видів якої, як-от какапо, розвивалися за відсутності хижаків. На жаль, у 2015 році налічувалося лише 49 особин цього виду.

Маючи повні геномні дані кожного живого представника цього виду, природоохоронці змогли визначити, де найбільше генетичне різноманіття. Це надзвичайно важливо для уникнення проблем, що виникають внаслідок інбридингу, таких як низька фертильність та слабка імунна система. Потім цих птахів переселили по їхніх природних середовищах, щоб вони могли ефективно розмножуватися та розширювати свою популяцію до майже 200 особин протягом трьох поколінь. Зараз на островах Нової Зеландії їх налічується понад 250.

YouTube відео

Decoding Life on Earth | Google and the Earth Biogenome Project

Команди, залучені до EBP, мають багато роботи з каталогізації майже всіх видів, що залишилися, аби досягти своєї мети до 2028 року. Однак, з допомогою автоматизації та штучного інтелекту ця задача має стати простішою. Для порівняння, секвенування першого геному людини зайняло ціле десятиліття і коштувало 3 мільярди доларів до 2003 року. Сьогодні ж цю процедуру можна завершити за один день, витративши лише 1000 доларів.

Поширити в соцмережах