Перейти к основному содержимому

Групповой анализ

Групповой анализ - объединение герминальных вариантов (SNVs/Indels), выявленных в выбранных для анализа образцах. Он включает комбинирование, фильтрацию и аннотацию герминальных вариантов образцов. Доступные типы группового анализа:

  • Анализ герминальной когорты используется для объединения и сравнения образцов, схожих по какому-либо признаку (например, по типу патологии или источнику данных), или образцов больших семей, в которых секвенированы сиблинги. В анализ можно включить максимально 25 образцов. Результаты анализа представлены в SNV Viewer со всеми вариантами, выявленными в образцах, включенных в анализ.
  • Семейный анализ подходит для объединения и сравнения образцов одной семьи (пробанд + один или два родителя или два родителя без пробанда). Может включать 2 или 3 образца. Результаты анализа представлены в SNV Viewer со всеми вариантами, выявленными в образцах, включенных в анализ. В SNV Viewer есть специализированные фильтры, основанные на генотипах членов семьи.
  • Популяционный анализ направлен на изучение распределения частот аллелей в некоторой популяции. Он может включать неограниченное количество образцов. Результаты анализа представлены в виде файла VCF с частотами аллелей вариантов, выявленных в образцах, включенных в анализ.

Чтобы открыть страницу с групповыми анализами, перейдите на страницу "Все анализы" из блока страниц "Групповой анализ" через панель навигации слева:

Создание группового анализа#

Для перехода к форме создания группового анализа нажмите на . Другим путем создания группового анализа является объединение когорты.

В открывшейся форме введите название группового анализа в поле Имя. Здесь же вы также можете добавить описание анализа.

Настройки анализа#

Если вы хотите использовать вашу предустановку настроек параметров фильтрации герминальных SNVs/Indels, выберите её в выпадающем списке "Предварительной установки настроек". Обратите внимание, что на ход группового анализа может повлиять только такая предустановка, которая настраивает параметры фильтрации герминальных SNVs/Indels. Если выбранные по умолчанию параметры фильтрации вас устраивают, оставьте для анализа предустановку, выбранную по дефолту.

Тип анализа#

Доступные типы группового анализа описаны выше. Это может быть анализ герминальной когорты, семейный анализ или популяционный анализ. Выберите нужный тип анализа, нажав на соответствующий контейнер, а затем
нажмите , чтобы перейти к выбору образцов для анализа.

Образцы для анализа#

Таблица с образцами, доступными для анализа, включает название образца и код пациента или название запуска, к которому он относится. Образец неопухолевой ткани обозначен как , образец опухолевой ткани - . Для группового анализа доступны только образцы, загруженные в формате FASTQ или BAM, для которых были успешно завершены стадии выявления и аннотации герминальных SNVs/Indels и которые принадлежат пациенту или запуску, не находящемуся в "Архиве".

Отметьте галочками те образцы (минимум два), для которых вы хотите провести анализ. В анализ герминальной когорты можно включить максимум 25 образцов, в семейный анализ - 3, в популяционный - неограниченное количество. Имена образцов, добавляемых в анализ, должны быть уникальными. Если вы хотите добавить в анализ одинаковые образцы, переименуйте один из них (это можно сделать на странице образца), чтобы имена не повторялись.

Настройки семейного анализа#

Если вы выбрали семейный тип группового анализа, нажмите на после выбора образцов для анализа. Вы перейдете на страницу настроек семейного анализа:

Определите для каждого образца "семейную роль" пациента, у которого он был взят: Пробанд (ребёнок), Отец или Мать:

Запуск анализа#

Для запуска анализа нажмите .

Страница группового анализа#

После старта анализа вы попадете на его страницу (вкладка "Главное"):

На странице отображена информация о процессе анализа и об анализе. Когда анализ будет успешно завершен, здесь появятся основные результаты.

Информация о групповом анализе#

Справа на странице отображена основная информация об анализе:

  • ИМЯ - название группового анализа. Можно поменять, нажав на поле значения.
  • СОЗДАН - дата создания группового анализа в формате м/д/гггг.
  • ТИП АНАЛИЗА - Герминальная когорта, Семейный или Популяционный. Типы "Семейный" и "Герминальная когорта" можно сменять между собой, нажав на поле значение и выбрав другой тип анализа (если образцы, используемые для анализа, не были удалены).
  • ОБРАЗЦЫ - список образцов, для которых проводился анализ. Нажав на название образца, можно открыть его страницу. Если проводился семейный анализ, для каждого образца будет также указана выбранная "семейная роль" пациента, у которого он был взят:

  • КОММЕНТАРИИ - можно указать, нажав на поле значения.

Процесс анализа#

На вкладке "Главное" страницы группового анализа представлен раздел с информацией о процессе анализа. Раздел представляет собой таблицу со стадиями анализа и их статусами:

  • Если стадия находится в процессе выполнения, то в её статусе есть значок и процентое значение прогресса её выполнения.
  • Если стадия завершена успешно, то она имеет статус .
  • Если стадия завершена с ошибкой, то в её статусе есть значок и указана конкретная задача, на которой анализ прекратился. В таком случае можно сообщить о возникшей проблеме администратору, нажав на , или попробовать повторить выполнение задачи, нажав на .
  • Если ещё не выполнены предыдующие шаги анализа, то стадия находится в статусе "Не начато".

Для каждой стадии можно посмотреть её детали, нажав на . Тогда вы перейдете в раздел этой стадии на вкладке "Детали процесса анализа". На этой вкладке для каждой стадии можно скачать файлы с результатами и посмотреть технические детали, такие как вывод консоли и сообщение об ошибке при обработке, если такая возникла.

Если вы хотите получать оповещения о завершении обработки группового анализа, включите соответствующую опцию в настройках аккаунта.

Стадии группового анализа:#

  1. Комбинирование герминальных SNVs/Indels: слияние файлов gVCF, полученных в результате выявления герминальных SNVs/Indels в образцах, с помощью инструмента GATK GenomicsDBImport и совместное генотипирование образцов анализа с помощью GATK GenotypeGVCFs;
  2. Фильтрация герминальных SNVs/Indels: фильтрация вариантов с помощью инструмента GATK VariantFiltration на основе определенных критериев фильтрации, которые вы можете найти и поменять на вкладке "Параметры" на странице группового анализа;
  3. Аннотация герминальных SNVs/Indels: определение влияния вариантов на различные участки ДНК с помощью инструмента VEP и набора инструментов, разработанного командой Genomenal;
  4. Сохранение проаннотированных вариантов для SNV Viewer: стадии нет для популяционного анализа.

Перезапуск анализа#

Если вы хотите перезапустить выполнение одной из завершенных стадий, наведите курсор мыши на строку стадии и нажмите на появившийся элемент .

Если вы хотите перезапустить анализ с самого начала (со стадии "Комбинирование герминальных SNVs/Indels"), нажмите на кнопку . Обратите внимание, что такая кнопка есть только у анализа, все стадии которого завершились успешно.

Результаты анализа#

После успешного завершения всех стадий анализа результаты появятся на странице группового анализа:

  1. Секция "Герминальные SNVs/Indels" на вкладке "Главное" включает все основные результаты группового анализа. Для анализа герминальной когорты и семейного анализа результаты выглядят так (включают SNV Viewer):

А для популяционного анализа результаты выглядят следующим образом (нет SNV Viewer):

  • SNV Viewer - встроенный модуль для просмотра и анализа вариантов. Подробно описан ниже. SNV Viewer не представлен для популяционного анализа. Нажмите на кнопку , чтобы воспользоваться модулем.
  • Текстовый файл в формате CSV (Comma-Separated Values) с проаннотированными вариантами. Чтобы скачать файл, нажмите на .
  • Файл в формате VCF 4.2 (Variant Call Format) с проаннотированными вариантами. Для анализа герминальной когорты и для семейного анализа нажмите на , чтобы скачать файл. Для популяционного анализа нажмите на , чтобы открыть список с результатами:

  1. Частоты - файл в формате VCF с частотами аллелей вариантов, выявленных в образцах, включенных в анализ.
  2. Аннотированный - файл в формате VCF с проаннотированными вариантами.
  • Проаннотированные варианты в таблицах Google (может быть показана только часть вариантов). Чтобы открыть таблицу, нажмите на .
  • Integrative Genomics Viewer (IGV) - встроенный модуль визуализации вариаций на геноме. Чтобы открыть модуль, нажмите на .
  1. Отчёт по герминальным SNVs/Indels группы образцов на вкладке "Биоинформатический отчёт". Отчёт включает информацию о количестве, позиции в геноме и представленности в базах данных герминальных вариантов, оставшихся в результате анализа. Подробное описание отчёта можно посмотреть здесь. Чтобы экспортировать отчёт в формате PDF, нажмите на кнопку .

  2. Результирующие файлы для каждой стадии анализа на вкладке "Детали процесса анализа".

SNV Viewer группового анализа#

SNV Viewer представлен только для анализа герминальной когорты и семейного анализа. Он подробно описан в соответствующем разделе о SNV Viewer образца, однако SNV Viewer группового анализа имеет ряд особенностей:

  1. Колонки "Глубина (Альт/Реф)" и "GT" содержат данные всех образцов анализа. Для анализа герминальной когорты для каждой колонки приведено название образца, в котором вариант имеет соответствующие глубину секвенирования и генотип (при наведении курсора на название колонки можно увидеть полное название образца):

Для семейного анализа образцы, в которых вариант имеет соответствующие глублину секвенирования и генотип, обозначены "семейными ролями" пациентов, определенными пользователем (при наведении курсора на название колонки можно увидеть название образца):

  1. Базовый параметр фильтрации "Трио GT" - фильтр вариантов по наследованию: De novo варианты, Новые гомозиготы (гомозиготы по локусам у пробанда, которые гетерозиготны у родителей) или Наследованные от одного родителя. Доступен по умолчанию только в семейном групповом анализе в случае Трио (Пробанд, Отец и Мать). Чтобы отфильтровать варианты по наследованию, нажмите на окно фильтрации и в появившемся списке отметьте галочками нужные значения:

Для сброса фильтра по наследованию нажмите на окно фильтрации, а затем на .

Фильтровать по наследованию вариантов можно и в режиме расширенного поиска вариантов, воспользовавшись фильтром "Trio GT (Genotype)".

  1. Отстутствуют колонка "Тип мутации", базовый фильтр "Тип мутации" и соответствующая им колонка фильтрации в режиме расширенного поиска вариантов "Origin", так как все варианты в SNV Viewer группового анализа являются герминальными.
  2. Нет кнопки включения вариантов в отчёт, поскольку для группового анализа отчёты не строятся.
  3. Для вариантов можно определить патогенность только самостоятельно или по базе патогенности.
  4. На странице детальной информации о варианте есть только вкладки "Аннотация" и "Встречаемость".

Архивация, восстановление и удаление группового анализа#

Для архивации группового анализа наведите курсор на строку анализа на странице "Все анализы" и нажмите на появившийся активный элемент . Анализ будет перемещен на страницу "Архив" из блока страниц "Групповой анализ". Перейдя на эту страницу, вы можете:

  1. Восстановить групповой анализ, наведя курсор на строку анализа и нажав на появившийся активный элемент . Тогда анализ будет перемещен обратно на страницу "Все анализы".

  2. Удалить групповой анализ, наведя курсор на строку анализа и нажав на появившийся активный элемент . Вы увидите окно подтверждения удаления анализа:

Для подтверждения удаления анализа нажмите .
Для отмены удаления анализа нажмите или вне окна подтверждения.

Кроме того, вы можете удалить все архивированные групповые анализы, нажав на .