и тебя отсеквенируем
34 subscribers
80 photos
3 videos
14 files
237 links
Журнальный клуб по современной биологии.

https://xn--r1a.website/compbio?boost

Про single cell, геномику, биоинформатику и не только.
Download Telegram
и тебя отсеквенируем
Смотрите, что теперь есть: https://www.alphafold.ebi.ac.uk/. 365 тысяч структур на старте и планы достичь 135 миллионов. Подробный пресс-релиз тоже имеется.
Год спустя DeepMind выполнила и перевыполнила планы: от миллиона структур в июле 2021 до 200 миллионов структур. То есть почти у каждого белка в UniProt теперь есть предсказанная и доступная структура.

Вместе с продолжением работы на AlphaFold’ом в DeepMind также преуспели в основании Isomorphic Labs и сотрудничестве с Francis Crick Institute.
(А вообще это реклама виски из девяностых.)
С Новым годом!

Давайте под хруст прошлогодних салатиков вспомним, чего интересного происходило в области в 2022 году.

Роль полярной звезды продолжает играть AlphaFold (даже если открыть Nature’s biggest news stories of 2022). В соревнованиях вроде CASP 15 (если нужна была причина съездить в Анталию в декабре) без AF2 в топовых решениях теперь не обходится. Например, в CASP 15 улучшить результат модели AlphaFold2-Multimer получилось агрессивным семплингом, генерируя тысячи моделей (с разными параметрами) на каждый таргет. Получается на три порядка дольше, но это ничего, к следующему CASP’у придумают что-нибудь ещё. А DeepMind даже код не забросили.

🧑‍🔬 Зоопарк секвенирования нуклеиновых кислот продолжает радовать своим разнообразием. Тут и развитие Strand-seq — теперь можно измерять не только структурные варианты, но и доступность хроматина (nucleosome occupancy). И VASA-seq — протокол scRNA-seq со своими преимуществами и гибкостью модификации (VASA-drop и VASA-plate). И новые оптимизации Smart-seq3 (хотя кажется, что все до сих пор упорно продолжают пользоваться Smart-seq2).

Nanopore продолжает развивать свои продукты, PacBio анонсировала платформу для коротких ридов Onso и платформу для длинных ридов Revio. Ultima Genomics выпустила первые результаты работы над новой платформой для секвенирования. Mostly natural sequencing-by-synthesis означает, что используется смесь флуоресцентно-меченных (<20%) и обычных нуклеотидов. Что планируется делать с качеством секвенирования гомополимеров при таком подходе, однако, не очень понятно.

🦠 В scRNA-seq Ultima Genomics тоже уже попробовали, а основной объём данных scRNA-seq приходится, конечно, на 10x Genomics. Датасеты продолжают расти в размерах, и становится возможным собирать большие коллекции данных, во многом благодаря данным из Human Cell Atlas. Были опубликованы и атлас иммунной системы в разных органах, и атлас из полумиллиона клеток из разных тканей и органов (и не один), и атлас лёгких (тоже не один)… Полезную перспективу на молекулярные процессы пытаются получить в проектах с межвидовыми сравнениями (e.g. сперматогенез в 11 видах) и изучением процессов в их временном развитии (e.g. развитие гонад). Дальше будeт Human Developmental Cell Atlas, Human Organoid Cell Atlas (HCA|Organoid) и многое другое. И пока мы подбираемся к коллекции данных со ста миллионами клеток, стоит задумываться о том, как извлекать из такого массива данных новую и/или полезную информацию.

Методов горизонтальной интеграции область породила уже немало, и как раз подоспел их бенчмарк, однако кажется, что новые подходы к решению этой проблемы явно не помешают. Особенно это актуально в свете бурного развития single-cell multi-omics и spatial omics.

🧪 Появляется всё больше новых протоколов для измерения всё большего числа модальностей в одиночных клетках. Например NEAT-seq, чтобы измерять экспрессию генов и доступность хроматина вместе с количеством внутриядерных белков, что в первую очередь актуально для транскрипционных факторов. Или nano-CUT&Tag, MulTI-Tag и scNTT-seq, позволяющие измерять сразу несколько (максимум три, видимо) модификаций гистонов, — идея совместить Tn5-tagmentation и антитела действительно словно витала в воздухе.

🔬 Visium HD мы так и не увидели, а в это время на рынке небывалое разнообразие технологий, в т.ч. Nanostring, MERFISH, Stereo-seq, EEL FISH. Появляются большие и красивые датасеты. Отдельные белки измеряют с помощью IMC или вместе с РНК. (А вот как померить все белки в одиночных клетках, до сих пор не очень понятно.) В итоге имеем много технологий, задач и идей, в т.ч. на тему того, как обрабатывать и интегрировать такие данные.
🧑‍💻 Будь то multi-omics или spatial transcriptomics, многие вопросы интеграции для новых типов данных решаются часто в рамках одного или нескольких датасетов, с которыми работают авторы, с помощью заточенных под определённый тип данных методов. Наверняка в ближайшие годы стоит ожидать дальнейшего прогресса в поисках успешного применения deep learning, тем более что глубокие сети оказываются эффективными для анализа данных scATAC-seq и эпигенетических данных вообще, на которые обращают всё более пристальное внимание. Практическая сторона вопроса тем временем не стоит на месте: развиваются пакеты для работы с моделями на основе variational autoencoders, с данными multi-omics и spatial transcriptomics. Совершенствуются и модели для поиска ответов на важные вопросы, вроде cell fate mapping, intercellular communication или differential abundance testing. А вот за заголовок RNA velocity fully solved из 2020 года так и не извинились, хотя нерешённых вопросов ещё много.

🧬 Немало вопросов и к самой генетике человека, и здесь мы продолжаем пожинать плоды развития коллекций данных, таких как UK Biobank. Например, для роста человека получилось собрать 12 тысяч SNPs, объясняющих 40% дисперсии признака в европейских популяциях (и почти всю SNP-based heritability). А ещё в 2022 году опубликовали статьи по новой сборке генома человека (T2T-CHM13).

🐽 И пока одни старались улучшить сборку хотя бы одного генома человека, другие пытались его модифицировать. Технологии на основе CRISPR адаптировали и для вставки больших фрагментов ДНК, и для тестирования вариантов в популяции клеток, но не менее важным является развитие технологий модификации ДНК до достижения их клинического применения. Благодаря многолетней работе над применением CRISPR (2015, 2016, 2017, 2020, 2021) в 2023 наконец могут увидеть свет терапии на основе CRISPR для β-талассемии и серповидно-клеточной анемии (немного истории про стартапы, работающие в этом направлении, тут). Возможно, следуя успехам 2022, прогресс в трансплантации свиных органов тоже порадует нас — идеальное дополнение для набирающего обороты киберпанка.

🎄🌲🎄

Бонус: топ-3 обсуждений от Lior Pachter из 2022: (1) про сложный постер, (2) про чужой юзерпик, (3) про новую технологию секвенирования. До шедевров из 2021, кажется, далеко: треду про RNA velocity не удалось задеть за живое.
Новости регенеративной медицины - уже учатся выращивать новые наборы зубов при помощи манипуляций с генами (пока что не у людей):
https://mainichi.jp/english/articles/20230609/p2a/00m/0sc/026000c
Заметка в Wired про стартап LabGenius, в котором пытаются эффективно разрабатывать антитела. На самом деле лондонской компании уже больше 10 лет, и фокус на машинном обучении для дизайна антител и на автоматизации процесса их производства выглядит осмысленным и современным. С другой стороны, не похоже, чтобы их относительно небольшая команда разрабатывала state-of-the-art методы для белковой инженерии.