Вычисление покрытия
На данном этапе рассчитывается покрытие генов и целевых участков (интервалов набора capture kit) выравниваниями прочтений образца. Эти показатели важны для оценки качества картирования в целом и на интересующих вас областях (генах, транскриптах). Результаты вычисления покрытия будут расположены на вкладке "Анализ покрытия” на странице образца. Вычисление покрытия запускается после успешного выполнения стадии "Предварительная обработка для выявления вариантов".
Стадия анализа образца "Вычисление покрытия" включает следующие задачи:
Вычисление покрытия. Ход выполнения задачи зависит от типа секвенирования образца:
1.1. Если тип секвенирования определен как Направленный отбор и для образца определен набор capture kit, то задача включает следующие этапы:
- bedtools coverage вычисляет глубину и широту покрытия выравниваний прочтений образца интервалами набора capture kit и строит гистограмму покрытия для каждого интервала набора capture kit и сводную гистограмму для всех интервалов.
- bedtools intersect выявляет области, пересекающиеся между экзонами из Ensembl и интервалами набора capture kit.
- bedtools coverage вычисляет глубину и широту покрытия выравниваний прочтений образца экзонами из Ensembl и строит гистограмму покрытия для каждого экзона и сводную гистограмму для всех экзонов.
Файл с покрытием генов выровненными прочтениями можно скачать в разделе "Файлы с результатами" в деталях задачи "Вычисление покрытия" ("Скачать Gene coverage TSV"). Его также можно открыть в таблицах Google.
GATK CollectHsMetrics собирает метрики направленного отбора (hybrid-selection; HS) в файле выравнивания образца в пределах интервалов набора capture kit.
Файл с вычисленными метриками можно скачать в разделе "Файлы с результатами" в деталях задачи "Вычисление покрытия" ("Скачать HS Metrics TSV"). Его также можно открыть в таблицах Google.
Файл с информацией о покрытии целевых участков (интервалов набора capture kit) можно скачать в том же разделе ("Скачать Per target coverage TSV"). Его также можно открыть в таблицах Google.1.2. Если тип секвенирования определен как Направленный отбор, но для образца не определен набор capture kit, то задача включает следующий этап:
bedtools coverage вычисляет глубину и широту покрытия выравниваний прочтений образца экзонами из Ensembl и строит гистограмму покрытия для каждого экзона и сводную гистограмму для всех экзонов. Файл с покрытием генов выровненными прочтениями можно скачать в разделе "Файлы с результатами" в деталях задачи "Вычисление покрытия" ("Скачать Gene coverage TSV"). Его также можно открыть в таблицах Google.
1.3. Если тип секвенирования образца определен как WGS (whole-genome sequencing; полногеномное секвенирование), то задача включает следующие этапы:
bedtools coverage вычисляет глубину и широту покрытия выравниваний прочтений образца экзонами из Ensembl и строит гистограмму покрытия для каждого экзона и сводную гистограмму для всех экзонов.
bedtools genomecov вычисляет гистограммы покрытия выровненных последовательностей образца на референсный геном.
Файл с покрытием генов выровненными прочтениями можно скачать в разделе "Файлы с результатами" в деталях задачи "Вычисление покрытия" ("Скачать Gene coverage TSV"). Его также можно открыть в таблицах Google.
- Сохранение покрытия - сохранение покрытия генов и транскриптов.