Перейти к основному содержимому

Загрузка, идентификация и проверка

После старта анализа образец в формате VCF или GT загружается, определяется его формат и проводится его проверка. При ошибке выполнения любой из перечисленных ниже задач анализ образца останавливается.

Стадия анализа образца "Загрузка, идентификация и проверка" может включать следующие задачи:

  1. Загрузка. Если вы загружаете файл образца с компьютера, а не по ссылке, то загрузка может прерваться. Чтобы её восстановить, воспользуйтесь формой возобновления загрузки.
  2. Распаковка с помощью 7-Zip, если образец загружен в виде архива (GZIP, ZIP, BZIP2, 7-ZIP, XZ, WIM, RAR).
  3. Идентификация: определение формата данных.
  4. Перевод в VCF, если образец был загружен в формате GT (TSV, TXT). Оригинальный файл в формате GT можно скачать в разделе "Файлы с результатами" в деталях задачи "Перевести в VCF" ("Скачать Original GT_FORMAT").
  5. Проверка файла VCF.
  6. Конвертация названий хромосом, если файл VCF содержит хромосомы, названные не по конвенции UCSC, по которой к названиям хромосом добавляется префикс "chr" (например, chr1, chrX). После конвертации снова производится проверка файла VCF.
  7. Перевод hg19 в hg38, если версия референсного генома загруженной аннотации не hg38, а hg19. Получившийся файл можно скачать в разделе "Файлы с результатами" в деталях задачи "Перевод hg19 в hg38" ("Скачать HG38 VCF"). Там же можно скачать файл с вариантами, которые не удалось перевести в hg38, ("Скачать LIFT_OVER_FAILED TSV") - такие варианты в дальнейший анализ не идут. Этот файл также можно открыть в таблицах Google. После перевода в hg38 производится проверка файла VCF.

Загруженный распакованный файл образца в формате VCF с оригинальными названиями хромосом и версией референсного генома аннотации можно скачать наверху вкладки "Детали процесса анализа".

После успешного выполнения стадии "Загрузка, идентификация и проверка" анализ продолжается аннотацией.