Групповой анализ
Групповой анализ - объединение герминальных вариантов (SNVs/Indels), выявленных в выбранных для анализа образцах. Он включает комбинирование, фильтрацию и аннотацию герминальных вариантов образцов. Доступные типы группового анализа:
- Анализ герминальной когорты используется для объединения и сравнения образцов, схожих по какому-либо признаку (например, по типу патологии или источнику данных), или образцов больших семей, в которых секвенированы сиблинги. В анализ можно включить максимально 25 образцов. Результаты анализа представлены в SNV Viewer со всеми вариантами, выявленными в образцах, включенных в анализ.
- Семейный анализ подходит для объединения и сравнения образцов одной семьи (пробанд + один или два родителя или два родителя без пробанда). Может включать 2 или 3 образца. Результаты анализа представлены в SNV Viewer со всеми вариантами, выявленными в образцах, включенных в анализ. В SNV Viewer есть специализированные фильтры, основанные на генотипах членов семьи.
- Популяционный анализ направлен на изучение распределения частот аллелей в некоторой популяции. Он может включать неограниченное количество образцов. Результаты анализа представлены в виде файла VCF с частотами аллелей вариантов, выявленных в образцах, включенных в анализ.
Чтобы открыть страницу с групповыми анализами, перейдите на страницу "Все анализы" из блока страниц "Групповой анализ" через панель навигации слева:
#
Создание группового анализаДля перехода к форме создания группового анализа нажмите на . Другим путем создания группового анализа является объединение когорты.
В открывшейся форме введите название группового анализа в поле Имя. Здесь же вы также можете добавить описание анализа.
#
Настройки анализаЕсли вы хотите использовать вашу предустановку настроек параметров фильтрации герминальных SNVs/Indels, выберите её в выпадающем списке "Предварительной установки настроек". Обратите внимание, что на ход группового анализа может повлиять только такая предустановка, которая настраивает параметры фильтрации герминальных SNVs/Indels. Если выбранные по умолчанию параметры фильтрации вас устраивают, оставьте для анализа предустановку, выбранную по дефолту.
#
Тип анализаДоступные типы группового анализа описаны выше. Это может быть анализ герминальной когорты, семейный анализ
или популяционный анализ. Выберите нужный тип анализа, нажав на соответствующий контейнер,
а затем
нажмите ,
чтобы перейти к выбору образцов для анализа.
#
Образцы для анализаТаблица с образцами, доступными для анализа, включает название образца и код пациента или название запуска, к которому он относится. Образец неопухолевой ткани обозначен как , образец опухолевой ткани - . Для группового анализа доступны только образцы, загруженные в формате FASTQ или BAM, для которых были успешно завершены стадии выявления и аннотации герминальных SNVs/Indels и которые принадлежат пациенту или запуску, не находящемуся в "Архиве".
Отметьте галочками те образцы (минимум два), для которых вы хотите провести анализ. В анализ герминальной когорты можно включить максимум 25 образцов, в семейный анализ - 3, в популяционный - неограниченное количество. Имена образцов, добавляемых в анализ, должны быть уникальными. Если вы хотите добавить в анализ одинаковые образцы, переименуйте один из них (это можно сделать на странице образца), чтобы имена не повторялись.
#
Настройки семейного анализаЕсли вы выбрали семейный тип группового анализа, нажмите на после выбора образцов для анализа. Вы перейдете на страницу настроек семейного анализа:
Определите для каждого образца "семейную роль" пациента, у которого он был взят: Пробанд (ребёнок), Отец или Мать:
#
Запуск анализаДля запуска анализа нажмите .
#
Страница группового анализаПосле старта анализа вы попадете на его страницу (вкладка "Главное"):
На странице отображена информация о процессе анализа и об анализе. Когда анализ будет успешно завершен, здесь появятся основные результаты.
#
Информация о групповом анализеСправа на странице отображена основная информация об анализе:
- ИМЯ - название группового анализа. Можно поменять, нажав на поле значения.
- СОЗДАН - дата создания группового анализа в формате м/д/гггг.
- ТИП АНАЛИЗА - Герминальная когорта, Семейный или Популяционный. Типы "Семейный" и "Герминальная когорта" можно сменять между собой, нажав на поле значение и выбрав другой тип анализа (если образцы, используемые для анализа, не были удалены).
- ОБРАЗЦЫ - список образцов, для которых проводился анализ. Нажав на название образца, можно открыть его страницу. Если проводился семейный анализ, для каждого образца будет также указана выбранная "семейная роль" пациента, у которого он был взят:
- КОММЕНТАРИИ - можно указать, нажав на поле значения.
#
Процесс анализаНа вкладке "Главное" страницы группового анализа представлен раздел с информацией о процессе анализа. Раздел представляет собой таблицу со стадиями анализа и их статусами:
- Если стадия находится в процессе выполнения, то в её статусе есть значок и процентое значение прогресса её выполнения.
- Если стадия завершена успешно, то она имеет статус .
- Если стадия завершена с ошибкой, то в её статусе есть значок и указана конкретная задача, на которой анализ прекратился. В таком случае можно сообщить о возникшей проблеме администратору, нажав на , или попробовать повторить выполнение задачи, нажав на .
- Если ещё не выполнены предыдующие шаги анализа, то стадия находится в статусе "Не начато".
Для каждой стадии можно посмотреть её детали, нажав на . Тогда вы перейдете в раздел этой стадии на вкладке "Детали процесса анализа". На этой вкладке для каждой стадии можно скачать файлы с результатами и посмотреть технические детали, такие как вывод консоли и сообщение об ошибке при обработке, если такая возникла.
Если вы хотите получать оповещения о завершении обработки группового анализа, включите соответствующую опцию в настройках аккаунта.
#
Стадии группового анализа:- Комбинирование герминальных SNVs/Indels: слияние файлов gVCF, полученных в результате выявления герминальных SNVs/Indels в образцах, с помощью инструмента GATK GenomicsDBImport и совместное генотипирование образцов анализа с помощью GATK GenotypeGVCFs;
- Фильтрация герминальных SNVs/Indels: фильтрация вариантов с помощью инструмента GATK VariantFiltration на основе определенных критериев фильтрации, которые вы можете найти и поменять на вкладке "Параметры" на странице группового анализа;
- Аннотация герминальных SNVs/Indels: определение влияния вариантов на различные участки ДНК с помощью инструмента VEP и набора инструментов, разработанного командой Genomenal;
- Сохранение проаннотированных вариантов для SNV Viewer: стадии нет для популяционного анализа.
#
Перезапуск анализаЕсли вы хотите перезапустить выполнение одной из завершенных стадий, наведите курсор мыши на строку стадии и нажмите на появившийся элемент .
Если вы хотите перезапустить анализ с самого начала (со стадии "Комбинирование герминальных SNVs/Indels"), нажмите на кнопку . Обратите внимание, что такая кнопка есть только у анализа, все стадии которого завершились успешно.
#
Результаты анализаПосле успешного завершения всех стадий анализа результаты появятся на странице группового анализа:
- Секция "Герминальные SNVs/Indels" на вкладке "Главное" включает все основные результаты группового анализа. Для анализа герминальной когорты и семейного анализа результаты выглядят так (включают SNV Viewer):
А для популяционного анализа результаты выглядят следующим образом (нет SNV Viewer):
- SNV Viewer - встроенный модуль для просмотра и анализа вариантов. Подробно описан ниже. SNV Viewer не представлен для популяционного анализа. Нажмите на кнопку , чтобы воспользоваться модулем.
- Текстовый файл в формате CSV (Comma-Separated Values) с проаннотированными вариантами. Чтобы скачать файл, нажмите на .
- Файл в формате VCF 4.2 (Variant Call Format) с проаннотированными вариантами. Для анализа герминальной когорты и для семейного анализа нажмите на , чтобы скачать файл. Для популяционного анализа нажмите на , чтобы открыть список с результатами:
- Частоты - файл в формате VCF с частотами аллелей вариантов, выявленных в образцах, включенных в анализ.
- Аннотированный - файл в формате VCF с проаннотированными вариантами.
- Проаннотированные варианты в таблицах Google (может быть показана только часть вариантов). Чтобы открыть таблицу, нажмите на .
- Integrative Genomics Viewer (IGV) - встроенный модуль визуализации вариаций на геноме. Чтобы открыть модуль, нажмите на .
Отчёт по герминальным SNVs/Indels группы образцов на вкладке "Биоинформатический отчёт". Отчёт включает информацию о количестве, позиции в геноме и представленности в базах данных герминальных вариантов, оставшихся в результате анализа. Подробное описание отчёта можно посмотреть здесь. Чтобы экспортировать отчёт в формате PDF, нажмите на кнопку .
Результирующие файлы для каждой стадии анализа на вкладке "Детали процесса анализа".
#
SNV Viewer группового анализаSNV Viewer представлен только для анализа герминальной когорты и семейного анализа. Он подробно описан в соответствующем разделе о SNV Viewer образца, однако SNV Viewer группового анализа имеет ряд особенностей:
- Колонки "Глубина (Альт/Реф)" и "GT" содержат данные всех образцов анализа. Для анализа герминальной когорты для каждой колонки приведено название образца, в котором вариант имеет соответствующие глубину секвенирования и генотип (при наведении курсора на название колонки можно увидеть полное название образца):
Для семейного анализа образцы, в которых вариант имеет соответствующие глублину секвенирования и генотип, обозначены "семейными ролями" пациентов, определенными пользователем (при наведении курсора на название колонки можно увидеть название образца):
- Базовый параметр фильтрации "Трио GT" - фильтр вариантов по наследованию: De novo варианты, Новые гомозиготы (гомозиготы по локусам у пробанда, которые гетерозиготны у родителей) или Наследованные от одного родителя. Доступен по умолчанию только в семейном групповом анализе в случае Трио (Пробанд, Отец и Мать). Чтобы отфильтровать варианты по наследованию, нажмите на окно фильтрации и в появившемся списке отметьте галочками нужные значения:
Для сброса фильтра по наследованию нажмите на окно фильтрации, а затем на .
Фильтровать по наследованию вариантов можно и в режиме расширенного поиска вариантов, воспользовавшись фильтром "Trio GT (Genotype)".
- Отстутствуют колонка "Тип мутации", базовый фильтр "Тип мутации" и соответствующая им колонка фильтрации в режиме расширенного поиска вариантов "Origin", так как все варианты в SNV Viewer группового анализа являются герминальными.
- Нет кнопки включения вариантов в отчёт, поскольку для группового анализа отчёты не строятся.
- Для вариантов можно определить патогенность только самостоятельно или по базе патогенности.
- На странице детальной информации о варианте есть только вкладки "Аннотация" и "Встречаемость".
#
Архивация, восстановление и удаление группового анализаДля архивации группового анализа наведите курсор на строку анализа на странице "Все анализы" и нажмите на появившийся активный элемент . Анализ будет перемещен на страницу "Архив" из блока страниц "Групповой анализ". Перейдя на эту страницу, вы можете:
Восстановить групповой анализ, наведя курсор на строку анализа и нажав на появившийся активный элемент . Тогда анализ будет перемещен обратно на страницу "Все анализы".
Удалить групповой анализ, наведя курсор на строку анализа и нажав на появившийся активный элемент . Вы увидите окно подтверждения удаления анализа:
Для подтверждения удаления анализа
нажмите .
Для отмены удаления анализа нажмите
или вне окна подтверждения.
Кроме того, вы можете удалить все архивированные групповые анализы, нажав на .