Перейти к основному содержимому

Отчёт по происхождению

Отчёт содержит результаты генетического анализа происхождения. Анализ происхождения проводится с использованием референтной генетической панели проекта Human Genome Diversity Project, сформированной на основе сборки генома человека GRCh38 и включающей данные 929 индивидов из 54 популяций. Оценка происхождения выполняется с помощью программы ADMIXTURE - инструмента для оценки индивидуального происхождения методом максимального правдоподобия на основе статистической модели, использующей многолокусные наборы данных SNP-генотипирования. Модель предполагает, что индивиды в референтной панели не состоят в близком родстве.

В ходе анализа ADMIXTURE выполняет статистическое разложение референтной панели на K теоретических предковых компонент и оценивает для каждой из них частоты аллелей. Затем генотип исследуемого образца сопоставляется с этой моделью, в результате чего рассчитываются пропорции вклада каждой предковой компоненты в геном образца. Эти пропорции и представлены в отчёте как оценка генетического происхождения.

Количество используемых предковых компонент (K) настраивается в параметрах анализа. Каждая предковая компонента представляет собой условную генетическую группу, характеризуемую специфическими частотами аллелей и отражающую структуру вариабельности в референтных популяционных данных. Важно учитывать, что предковые компоненты не являются прямым эквивалентом современных этнических групп или национальностей. Они отражают статистические закономерности в генетических данных и зависят от состава референтной панели и выбранного значения K.

ВНИМАНИЕ!

Анализ происхождения представляет собой автоматический статистический вывод и предназначен исключительно для информационных целей. Он не является юридическим, медицинским или каким-либо иным экспертным заключением о происхождении.

Построение отчёта#

Отчёт строится на основе блока шаблона отчёта "Происхождение", который может быть применён только к неопухолевым образцам.

Отчёт по происхождению строится для образца, если выполняются следующие условия:

  1. Образец загружен как образец неопухолевой ткани (образец, имеющий тип "NORMAL").
  2. Анализ образца успешно завершился (то есть все стадии, включённые в анализ, имеют статус "Завершено").
  3. Для образца успешно завершилась задача "Анализ происхождения" стадии анализа "Геномные предсказания". По умолчанию задача не включена в анализ, поэтому её необходимо включить в параметрах, активировав опцию "Run ancestry analysis". Обратите внимание, что для включения анализа происхождения для образца, загруженного в формате VCF или GT, необходимо на этапе составления набора образцов выбрать соответствующую настройку анализа, в которую включён параметр "Run ancestry analysis".
  4. Шаблон отчёта, включающий блок "Происхождение", активен (регулируется на странице "Шаблоны отчётов").
  5. Шаблон отчёта был добавлен в систему до того, как был обработан образец.

Результаты#

В отчёте указывается количество генетических маркеров, представленных в образце, которые были сопоставлены с маркерами референтной панели. Дополнительно приводится число маркеров, фактически использованных в анализе после этапа фильтрации, включающего удаление избыточно скоррелированных маркеров. Такая фильтрация позволяет снизить влияние коррелированных вариантов и обеспечить корректную работу модели при оценке пропорций предковых компонент.

В результате анализа происхождения указывается популяция, с которой исследуемый образец демонстрирует наибольшее сходство по профилю распределения предковых компонент, а также приводится таблица всех популяций, для которых выявлено генетическое сходство с образцом. В таблице отображаются только популяции, вероятность принадлежности которых превышает заданный порог, определяемый настройками шаблона отчёта.

Колонки таблицы с результатами анализа происхождения:

  • Популяция - референтная популяция из используемой генетической панели, с которой сопоставляется генотип исследуемого образца. Названия популяций соответствуют референтным выборкам и не предполагают исключительности или идентичности.
  • Суперпопуляция/Континентальная группа - укрупнённая группа популяций, отражающая их географическое и генетическое родство: Африка, Америка, Центральная/Южная Азия, Восточная Азия, Европа, Ближний Восток, Океания.
  • Вероятность принадлежности - оценочная доля (в процентах), отражающая степень генетического сходства образца с данной референтной популяцией на основе распределения предковых компонент, рассчитанная моделью ADMIXTURE. Представленные значения являются модельными оценками и отражают генетическое сходство с референтными группами; они не являются прямыми оценками долей генеалогического или этнического происхождения.
    Низкие значения пропорций предковых компонент на уровне нескольких процентов могут отражать как общее древнее происхождение, так и статистический шум модели; их следует трактовать с осторожностью, особенно при сравнении близкородственных популяций.

Популяция с наибольшей оценочной вероятностью принадлежности выделена в таблице жирным шрифтом.