ПОСЛЕДНИЕ НОВОСТИ
Главная | ЗДОРОВЬЕ | Искусственный интеллект изучает, что означает быть живым

Искусственный интеллект изучает, что означает быть живым

С учетом обширного объема данных о генах и клетках, искусственные интеллектуальные модели сделали несколько поразительных открытий. Какие уроки они смогут дать нам в будущем?

***

В 1889 году французский врач Франсуа-Жильбер Вио провел уникальный эксперимент в Андах, извлекая кровь из своей руки и анализируя ее под микроскопом. Оказалось, что количество эритроцитов, переносящих кислород, увеличилось на 42%. Это открытие выявило удивительную способность человеческого тела: производство важных клеток при необходимости.

В начале 1900-х годов ученые предположили, что гормоном, ответственным за этот процесс, является эритропоэтин. Этот теоретический гормон, по-гречески означающий «красный создатель», был обнаружен спустя семь десятилетий после предположений, когда исследователи фильтровали 670 галлонов мочи.

Почти через 50 лет биологи в Израиле объявили о находке редкой почечной клетки, вырабатывающей гормон при низком уровне кислорода. Эта клетка получила название «ячейка Норн» в честь скандинавских божеств, связанных с управлением судьбой.

Открытие клеток Норн пришлось на лето прошлого года, когда исследователи из Стэнфорда запрограммировали компьютеры для самостоятельного изучения биологии. Используя искусственный интеллект, подобный ChatGPT, компьютеры обучались на необработанных данных о миллионах реальных клеток и их химическом и генетическом составе всего за шесть недель.

Исследователи не предоставили компьютерам интерпретацию этих измерений, не объяснили, что разные типы клеток обладают различными биохимическими профилями. Например, не было выделено, какие клетки ответственны за восприятие света в глазах или производство антител.

Компьютеры самостоятельно обработали данные, создавая модель всех клеток на основе их сходства в многомерном пространстве. По завершении обучения машины продемонстрировали удивительную способность: классификацию клетки, которую они никогда раньше не видели, определяя ее как одну из более чем 1000 различных типов, включая ячейку Норн.

«Это удивительно, поскольку модели никто не информировал о существовании клетки Норн в почке», – отметил Юре Лесковец, ученый-компьютерист из Стэнфорда, занимавшийся обучением компьютеров.

Это программное обеспечение представляет собой одну из нескольких новых базовых моделей на основе искусственного интеллекта, ориентированных на основы биологии. Эти модели не просто упорядочивают информацию, собранную биологами, но также делают открытия о функционировании генов и развитии клеток.

С увеличением масштабов моделей, объема лабораторных данных и вычислительной мощности ученые прогнозируют, что они смогут делать более глубокие открытия. Эти открытия могут раскрывать тайны рака и других заболеваний, а также находить пути превращения одного типа клеток в другой.

«В какой-то момент мы увидим важное открытие в биологии, которое не сделают биологи», – сказал доктор Эрик Тополь, директор Научно-исследовательского трансляционного института Скриппса.

Остается предметом дискуссий, насколько далеко продвинутся эти модели. В то время как некоторые сомневаются в их способности, оптимистичные ученые считают, что фундаментальные модели даже смогут ответить на самый глобальный биологический вопрос: что отличает живое от неживого?

Сердечные клетки и землекопы

Биологи долгое время стремились понять, как различные клетки нашего организма используют гены для выполнения жизненно важных функций. Примерно десять лет назад исследователи начали промышленные эксперименты по извлечению генетических фрагментов из отдельных клеток и созданию каталогов, так называемых «клеточных атласов», включающих миллиарды фрагментов данных.

Доктор Кристина Теодорис, ординатор Бостонской детской больницы, обратила внимание на новый тип модели искусственного интеллекта, разработанный инженерами Google в 2017 году для языковых переводов. Они предоставили модели миллионы предложений на английском языке и их переводы на немецкий и французский. Эта модель приобрела способность переводить предложения, которые она ранее не видела. Доктор Теодорис задала вопрос: сможет ли подобная модель научиться понимать данные клеточных атласов.

В 2021 году она с трудом нашла лабораторию, где ей разрешили попробовать построить подобную модель. «Было много скептицизма по поводу того, что этот подход вообще сработает», – отметила она.

Ширли Лю, специалист по вычислительной биологии из Института рака Дана-Фарбер в Бостоне, поддержала ее. Доктор Теодорис извлекла данные из 106 опубликованных исследований на людях, объединив их в программе под названием GeneFormer.

Модель получила глубокое понимание того, как гены ведут себя в различных клетках. Например, предсказано было, что отключение гена TEAD4 в определенных сердечных клетках приведет к серьезным нарушениям. Проверив это предсказание на реальных клетках, называемых кардиомиоцитами, команда обнаружила ослабление их сокращений.

В другом тесте доктор Теодорис и ее коллеги показали клеткам GeneFormer сердца людей с нарушениями ритма и здоровых людей. “Тогда мы сказали: расскажите нам, какие изменения нужно внести в нездоровые клетки, чтобы сделать их здоровыми”, – сообщила доктор Теодорис, которая в настоящее время работает в Калифорнийском университете в Сан-Франциско.

GeneFormer предложил снизить активность четырех генов, ранее не связанных с болезнями сердца. Следуя советам модели, команда нейтрализовала каждый из этих генов. В двух из четырех случаев лечение улучшило сокращение клеток.

Команда Стэнфорда переключилась на создание модельного бизнеса после своего участия в формировании одной из крупнейших мировых баз данных клеток, известной как CellXGene. С начала августа исследователи обучали свои компьютеры на 33 миллионах клеток из этой базы данных, уделяя особое внимание информационной РНК – типу генетической информации. Кроме того, они обогатили модель трехмерными структурами белков, которые представляют собой продукты генов.

Компьютеры научились классифицировать более тыс. типов клеток на основе того, как их гены включаются и выключаются. На этой карте показано, как они организовали 36 миллионов ячеек в кластеры.

На основе предоставленных данных модель, известная как Universal Cell Embedding (UCE) вычислила сходство между клетками, группируя их в более чем 1000 кластеров в зависимости от их генетической активности. Кластеры соответствовали различным типам клеток, выявленным биологами в течение многих поколений.

UCE также приобрела важные знания о развитии клеток из одной оплодотворенной яйцеклетки. Например, модель выявила, что все клетки организма можно классифицировать в зависимости от слоя, из которого они произошли в раннем эмбрионе.

«Фактически, это переосмыслило биологию развития», – отметил Стивен Квейк, биофизик из Стэнфорда, участвовавший в создании UCE.

Модель также успешно передала свои знания о новых видах. Обладая генетическим профилем клеток животного, которое ранее не встречалось (например, голый землекоп), UCE смогла идентифицировать различные типы клеток.

«Вы можете взять абсолютно новый организм – курицу, лягушку, рыбу, что угодно, – поместить его, и получить что-то полезное», – отметил доктор Лесковец.

После обнаружения UCE клеток Норн, исследователи, включая доктора Лесковеца, обратились к базе данных CellXGene, чтобы выяснить их происхождение. Несмотря на то, что многие клетки были извлечены из почек, некоторые происходили из легких и других органов. Исследователи предположили, что ранее неизвестные клетки Норн могли быть распределены по всему телу.

Доктор Каталин Суштак, врач-ученый из Пенсильванского университета, занимающийся исследованием клеток Норн, выразила свой интерес по поводу этого открытия. «Я хочу изучить эти клетки», – сказала она.

Она высказала некоторые сомнения относительно того, что модель обнаружила настоящие клетки Норн вне почек, поскольку гормон эритропоэтин не был обнаружен в других частях тела. Однако новые клетки могут реагировать на уровень кислорода так же, как и клетки Норн.

Другими словами, UCE возможно открыла новый тип клеток даже до биологов.

«Интернет клеток»

Как и в случае с ChatGPT, биологические модели иногда допускают ошибки. Касия Кедзерска, компьютерный биолог из Оксфордского университета, вместе с коллегами провела недавние тесты на GeneFormer и другой базовой модели, scGPT. Они предоставили моделям атласы клеток, которые ранее не видели, и поставили перед ними задачи, такие как классификация клеток по типам. В некоторых случаях модели справились хорошо, но в других проявились хуже по сравнению с более простыми компьютерными программами.

Доктор Кедзерска выразила большие надежды на эти модели, но подчеркнула, что на данный момент «их не следует использовать “из коробки” без полного понимания их ограничений».

Доктор Лесковец отметил, что модели совершенствуются по мере обучения на большем объеме данных. Однако по сравнению с ChatGPT, обученным на данных из всего Интернета, последние атласы клеток предоставляют ограниченное количество информации. «Мне нужен весь Интернет о клетках», – добавил он.

С появлением более крупных клеточных атласов и сбором данных из каждой ячейки этих атласов ученые надеются расширить свой объем информации. Некоторые из них анализируют молекулы, привязанные к генам, или фотографируют клетки для определения точного расположения их белков. Вся эта информация должна помочь базовым моделям извлекать уроки о функционировании клеток.

Ученые также работают над инструментами, позволяющими базовым моделям сочетать свои автономные исследования с уже имеющимися знаниями биологов. Идея состоит в том, чтобы объединить результаты тысяч научных исследований с базами данных клеточных измерений.

По словам ученых, что с достаточным объемом данных и вычислительной мощностью возможно создание полного математического представления клетки. “Это станет крупной революцией в биологии”, заявил Бо Ванг, компьютерный биолог из Университета Торонто и создатель scGPT. Он предвидит, что виртуальная ячейка позволит предсказывать поведение реальной клетки в различных сценариях, открывая возможность проводить эксперименты на компьютерах, избегая использования чашек Петри.

Доктор Квейк выражает предположение, что фундаментальные модели могут раскрывать не только существующие типы клеток, но и те, которые могли бы существовать. Он утверждает, что определенные комбинации биохимических процессов существенны для поддержания жизни клетки. Мечта доктора Квейка — создать карту, иллюстрирующую царство возможного, где жизнь может процветать.

«Я уверен, что эти модели помогут нам глубже понять природу клетки, открывая настоящее представление о жизни», — говорит доктор Квейк.

Наличие карты возможного и невозможного для жизни также открывает перспективу создания новых клеток, не существующих в природе. Фундаментальная модель может генерировать химические рецепты, превращая обычные клетки в уникальные. Эти новые клетки могут, например, устранять бляшки в кровеносных сосудах или исследовать состояние больного органа.

«Это похоже на «Фантастическое путешествие», но кто знает, что нас ждет в будущем?» — признается доктор Квейк.

Новые риски

Если фундаментальные модели подтвердят мечты доктора Квейка, они также привнесут ряд новых рисков. В пятницу более 80 биологов и экспертов по искусственному интеллекту подписали призыв о регулировании данной технологии, чтобы предотвратить ее использование в создании нового биологического оружия. Аналогичная озабоченность может быть обоснована и в отношении новых типов клеток, которые порождают эти модели.

Нарушения конфиденциальности могут произойти даже раньше. Исследователи стремятся программировать персонализированные базовые модели, учитывающие уникальный геном человека и особенности его клеточной активности. Это новое измерение знаний может раскрывать влияние различных версий генов на функционирование клеток. Тем не менее, это также может предоставить владельцам фундаментальных моделей некоторые из самых глубоких знаний о людях, которые предоставили свою ДНК и клетки для научных исследований.

Тем не менее, некоторые ученые выражают сомнения относительно того, насколько далеко могут продвинуться фундаментальные модели в своем «Фантастическом путешествии». Оценка эффективности этих моделей зависит от качества данных, которые им подают. Возможность сделать значимое новое открытие о природе жизни может зависеть от наличия данных, создание которых мы еще не предполагаем.

«Они могут внести некоторые интересные новшества», — отмечает Сара Уокер, физик из Университета штата Аризона, исследующая физические основы жизни. «Но, в конечном итоге, они ограничены в смысле достижения новых фундаментальных открытий».

Тем не менее, эффективность фундаментальных моделей уже заставила их создателей задуматься о роли человеческих биологов в мире, где компьютеры автономно делают важные открытия. Традиционно ученые-биологи получали признание за творческие и трудоемкие эксперименты, раскрывающие механизмы жизни. Однако компьютеры способны проанализировать эту работу за несколько недель, дней или даже часов, сканируя миллиарды клеток в поисках закономерностей, которые мы не видим.

«Это вызовет полное переосмысление того, что мы считаем творчеством», — отмечает доктор Квейк. «Профессорам предстоит переживать нервные моменты».

Источник