Загрузка, идентификация и проверка
После старта анализа образец в формате VCF или GT загружается, определяется его формат и проводится его проверка. При ошибке выполнения любой из перечисленных ниже задач анализ образца останавливается.
Стадия анализа образца "Загрузка, идентификация и проверка" может включать следующие задачи:
- Загрузка. Если вы загружаете файл образца с компьютера, а не по ссылке, то загрузка может прерваться. Чтобы её восстановить, воспользуйтесь формой возобновления загрузки.
- Распаковка с помощью 7-Zip, если образец загружен в виде архива (GZIP, ZIP, BZIP2, 7-ZIP, XZ, WIM, RAR).
- Идентификация: определение формата данных.
- Перевод в VCF, если образец был загружен в формате GT (TSV, TXT). Оригинальный файл в формате GT можно скачать в разделе "Файлы с результатами" в деталях задачи "Перевести в VCF" ("Скачать Original GT_FORMAT").
- Проверка файла VCF.
- Конвертация названий хромосом, если файл VCF содержит хромосомы, названные не по конвенции UCSC, по которой к названиям хромосом добавляется префикс "chr" (например, chr1, chrX). После конвертации снова производится проверка файла VCF.
- Перевод hg19 в hg38, если версия референсного генома загруженной аннотации не hg38, а hg19. Получившийся файл можно скачать в разделе "Файлы с результатами" в деталях задачи "Перевод hg19 в hg38" ("Скачать HG38 VCF"). Там же можно скачать файл с вариантами, которые не удалось перевести в hg38, ("Скачать LIFT_OVER_FAILED TSV") - такие варианты в дальнейший анализ не идут. Этот файл также можно открыть в таблицах Google. После перевода в hg38 производится проверка файла VCF.
Загруженный распакованный файл образца в формате VCF с оригинальными названиями хромосом и версией референсного генома аннотации можно скачать наверху вкладки "Детали процесса анализа".
После успешного выполнения стадии "Загрузка, идентификация и проверка" анализ продолжается аннотацией.