Перейти к основному содержимому

Отчёт по полигенным признакам

Полигенные признаки — это характеристики, такие как рост или вес, которые являются результатом действия большого количества разных генов, каждый из которых вносит небольшой вклад в суммарный показатель. Поскольку задействовано несколько генов, полигенные признаки не следуют образцам менделеевского наследования. Помимо генетики на полигенные признаки влияют многие другие факторы, такие как окружающая среда, социально-экономические факторы, образ жизни. Генетическая составляющая полигенных признаков определяется с помощью оценки полигенного риска (polygenic risk score, PRS). PRS объединяет эффекты многих генетических вариантов в одно число, которое предсказывает генетическую предрасположенность к признаку. Каждое значение PRS может быть отражено на графике частоты распределения PRS (кривая колоколообразной формы, представляет собой нормальное стандартное распределение). Для большинства людей их значения PRS будут располагаться в средней области, но для некоторых эти значения могут отклониться влево или вправо от среднего, что будет указывать на наличие более низкого или высокого значения полигенного признака.

Для расчёта полигенных признаков используются предсказательные модели (модель логистической регрессии и модель регрессии Кокса), которые учитывают значения PRS, а также такие параметры, как пол и возраст (допустимый диапазон: от 18 до 80 лет). Модели полигенных рисков представляют собой вектор оценок эффекта вариантов, определённых для признака на основе результатов полногеномного поиска ассоциаций и с учетом структуры неравновесия по сцеплению. Модели ограничены списком распространённых генетических вариантов, представленных в списке вариантов из третьего выпуска проекта HapMap. Модель логистической регрессии позволяет определить взаимосвязь между наличием или отсутствием заболевания и переменными-предикторами. Модель регрессии Кокса учитывает возраст, в котором появились симптомы заболевания, и, соответственно, позволяет увидеть динамику риска развития заболевания с возрастом. Подробнее о сравнении данных моделей: Ingram DD, Kleinman JC. Empirical comparisons of proportional hazards and logistic regression models. Stat Med. 1989 May;8(5):525-38. Итоговое предсказание моделей не является абсолютно точным, так как список генетических вариантов, влияющих на полигенные признаки, постоянно дополняется научным сообществом. Насколько хорошо статистическая модель предсказывает наличие или отсутствие заболевания у человека, определяет показатель AUC (Area Under the Receiver Operating Characteristic Curve). Значение AUC находится в диапазоне от 50 до 100%, где более высокие значения показывают, что модель обладает большей прогностической силой.

Построение отчёта#

Отчёт строится на основе блока шаблона отчёта "Полигенные признаки", который может быть применён только к неопухолевым образцам. В блоке регулируется, результаты вычисления каких полигенных рисков будут включены в отчёт.

Отчёт по полигенным признакам строится для образца, если выполняются следующие условия:

  1. Образец загружен как образец неопухолевой ткани (образец, имеющий тип "NORMAL").
  2. Анализ образца успешно завершился (то есть все стадии, включённые в анализ, имеют статус "Завершено").
  3. Для образца успешно завершилась задача "Вычисление полигенных рисков" стадии анализа "Предсказание фенотипов". По умолчанию задача не включена в анализ, поэтому её необходимо включить в параметрах, активировав опцию "Run polygenic risk scores calculation". Обратите внимание, что для включения вычисления полигенных рисков в анализ образца, загруженного в формате VCF или GT, необходимо на этапе составления набора образцов выбрать соответствующую настройку анализа, в которую включён параметр "Run polygenic risk scores calculation".
  4. Шаблон отчёта, включающий блок "Полигенные признаки", активен (регулируется на странице "Шаблоны отчётов").
  5. Шаблон отчёта был добавлен в систему до того, как был обработан образец.

После успешной генерации отчёта по полигенным признакам откройте вкладку с отчётом со страницы образца. Для формирования отчёта необходимо указать возраст (дату рождения) и пол пациента, которые учитываются при построении предсказательной модели для расчёта полигенных рисков. Это можно сделать на странице пациента или на странице самого отчёта. Если возраст пациента менее 18 лет, то для расчётов в качестве значения возраста будет использована крайняя граница 18 лет, поскольку в предсказательной модели используется диапазон от 18 до 80 лет. Если возраст пациента более 80 лет, то для расчётов в качестве значения возраста будет использована крайняя граница 80 лет, поскольку в предсказательной модели используется диапазон от 18 до 80 лет. Если указанное вами значение пола не совпадает со значением, определённым по генетическим данным, то для построения отчёта будет учитываться последнее значение. После указания возраста и пола пациента необходимо немного подождать, пока вычисляются показатели, необходимые для построения отчёта.

Результаты#

То, какие полигенные признаки будут включены в отчёт, определяется в блоке шаблона отчёта. К выбору доступны количественные и бинарные полигенные признаки.

Результаты предсказания по количественным полигенным признакам#

Количественные признаки - это характеристики, отдельные варианты проявления которых имеют числовое выражение. Для таких признаков производится оценка абсолютного предсказанного значения из предсказательной модели, в которую подставляются значение PRS, значения пола и значение возраста пациента. Данное значение имеет размерность исследуемого признака, поэтому его можно легко проинтерпретировать. Поскольку предсказательная модель определяет значение признака с определённой ошибкой, для каждого признака приводится доверительный интервал, предоставляющий информацию о диапазоне возможных значений. Доверительный интервал рассчитывается из параметров предсказательной модели.

Вычисляемые количественные полигенные риски:

  • Рост
  • Масса тела
  • Индекс массы тела (ИМТ)

В качестве результатов предсказания по количественным полигенным признакам предоставляется следующая информация:

  • Предсказанное значение признака - абсолютное значение признака, определяемое с помощью модели логистической регрессии, которая учитывает генетические данные пациента и данные о поле и возрасте. На диаграмме, приведённой ниже, предсказанное значение признака - это генетический рост пациента (162 см).
  • Диапазон возможных значений признака - 95% доверительный интервал, который с высокой степенью достоверности включает абсолютное значение признака (для расчёта используется модель логистической регрессии). На диаграмме, приведённой ниже, диапазон возможных значений - это рост от 153 см до 172 см.
  • Сравнение предсказанного значения со средним значением признака. Результатом сравнения является вывод о том, на сколько предсказанное значение определённого признака у пациента меньше или больше среднего значения признака, определяемого с учётом этнической принадлежности пациента, а также его пола и возраста. На диаграмме, приведённой ниже, среднее значение признака - это средний генетический рост (166 см).

  • Отображение значения оценки полигенного риска (PRS) пациента на графике частоты распределения PRS. Область значений PRS пациента отмечена зелёным (если значения попадают в область низких или средних значений PRS) или оранжевым (если значения попадают в область высоких значений PRS) цветом, а оставшаяся область - синим цветом. На графике, приведённом ниже, значения PRS отклоняются влево от среднего, что указывает на более низкие значения полигенного признака:

Также определяется, насколько абсолютное значение признака пациента отличается от среднего значения признака у людей из группы близкого этнического происхождения. В результате сравнения приводится число людей в процентном эквиваленте, которые имеют генетический прогноз признака больше или ниже, чем пациент.

Результаты предсказания по бинарным полигенным признакам#

Бинарные признаки - это характеристики с двумя возможными исходами: наличие или отсутствие (например, восприимчивость или устойчивость к определённой инфекции).

Вычисляемые бинарные полигенные риски:

  • Предрасположенность к избыточному весу
  • Предрасположенность к раку предстательной железы (если пол пациента указан как мужской)
  • Предрасположенность к раку молочной железы (если пол пациента указан как женский)
  • Предрасположенность к ишемической болезни сердца
  • Предрасположенность к воспалительному заболеванию кишечника
  • Предрасположенность к сахарному диабету 2-го типа
  • Предрасположенность к колоректальному раку

В качестве результатов предсказания по бинарным полигенным признакам предоставляется следующая информация:

  • Предсказанное значение риска возникновения заболевания для пациента, определяемое с помощью модели логистической регрессии, которая учитывает генетические данные пользователя и данные о поле и возрасте. Представлено на диаграмме в виде блока "Риск пациента". Блок раскрашен зелёным цветом, если риск пациента меньше среднего риска, или оранжевым цветом, если риск пациента больше среднего риска. На диаграмме, приведённой ниже, предсказанное значение признака - 21% риска возникновения заболевания.
  • Сравнение предсказанного значения со средним значением риска. Сравнение представлено в виде диаграммы. Среднее значение риска возникновения заболевания определяется с учётом этнической принадлежности пациента, а также его пола и возраста, и представлено на диаграмме в блоке "Средний риск", раскрашенном синим цветом. На диаграмме, приведённой ниже, среднее значение признака - 12% риска возникновения заболевания. В результате предоставляется информация о том, во сколько раз увеличен или уменьшен генетический риск пациента по сравнению со средним риском в группе с близким этническим составом.

  • Качество предсказания модели (в процентном эквиваленте), определяемое с помощью параметра AUC (Area Under the Receiver Operating Characteristic Curve, значение площади под кривой ошибок), для расчёта генетической предрасположенности к определенному заболеванию. На представленной ниже диаграмме качество предсказания модели равно 75% для исследуемого признака и этнической группы пациента.

  • Отображение значения оценки полигенного риска (PRS) пациента на графике частоты распределения PRS. Область значений PRS пациента отмечена зелёным (если значения попадают в область низких или средних значений PRS) или оранжевым (если значения попадают в область высоких значений PRS) цветом, а оставшаяся область - синим цветом. На графике, приведённом ниже, значения PRS отклоняются вправо от среднего, что указывает на более высокие значения полигенного риска:

Также определяется, насколько значение полигенного риска, полученного для пациента, отличается от распределения значений полигенных рисков для того же признака в группе с близким этническим составом. В результате сравнения приводится число людей в процентном эквиваленте, которые имеют генетический прогноз риска больше или ниже, чем пациент.

  • Оценка риска возникновения заболевания в зависимости от возраста с учётом генетической предрасположенности пациента и сравнение этого значения риска со средними результатами людей близкого этнического происхождения. Зависимость вероятности заболевания к определённому возрасту представляется в виде графика. Кривая риска возникновения заболевания пациента обозначена зелёным (если риск возникновения заболевания пациента ниже среднего) или оранжевым (если риск возникновения заболевания пациента выше среднего) цветом, кривая среднего риска возникновения заболевания обозначена синим цветом.

Пример графика, на котором риск возникновения заболевания у пациента в зависимости от возраста ниже среднего:

Пример графика, на котором риск возникновения заболевания у пациента в зависимости от возраста выше среднего: