Для начала необходимо выбрать что будем тестировать. Есть большой список болезней и признаков за которые отвечают генетика. Например, предрасположенность к курению, рост, вес, рак, заболевания сердца, желудка, крови, иммунной системы, печени, мозга и тд. Болезни и все, что связано с медициной лучше избегать а выбрать что-то связанное с красотой, молодостью, питанием, спортом, мотивацией и тд. После этого, идем в Гугл и ищем информацию про найденные ассоциированные с нашим признаком мутации. Есть большая база данных почти всех публикаций PubMed. Можно и там искать, но я предпочитаю Гугл. Находим все публикации и составляем список мутаций. Для каждой мутации нужно выписать номер хромосомы, позицию в геноме, эффект мутации и генотип. Можно найти аспиранта из НИИ, который быстро проведет литературный обзор и составит вам список. Либо сделать еще проще: зайти на сайт PGS Catalog, выбрать там что-нибудь по душе и скачать готовый файл с мутациями. Осторожно, там могут быть ошибки.
Далее, надо выбрать метод генотипирования ваших мутаций. У вас три варианта. Первый вариант — использовать метод из 70х под названием ПЦР. Стоит дешево, много лабораторий, подойдет для десятка-двух мутаций. Там нужно подобрать и нагенерить праймеры для ПЦР. ПЦРщики из НИИ или коммерческой лаборатории расскажут вам все. Второй вариант — таргетное секвенирование. Применяется в случае сотен мутаций. Там есть два подхода: "amplicon enrichment-based” и "hybrid capture-based”. Третий — использовать СНИП чипы (SNP array) от компаний Affymetrix и Illumina. Чипы стоят недорого, делались для научных исследований, но могут пригодиться и для нашего сервиса. Есть большой выбор чипов для людей и животных. В итоге необходимо выбрать метод генотипирования и компанию, в которой это будем делать.
Следующим этапом находим хорошего аспиранта, который сделает всю биоинформатику. Дайте ему файл со списком мутаций, научные статьи, где эти мутации описаны, несколько тестовых файлов с реальными генетическим данными. Файлы вы получите от компаний про которые мы говорили выше. Попросите аспиранта написать скрипт на Питоне, который проглатывает ДНК данные, рассчитывает предрасположенности к заболеваниям или признакам и генерирует pdf документ с описанием. Позже вы будете отсылать этот документ клиенту по емайлу.
Далее, нужно сделать набор для сбора образцов ДНК. Вы будете посылать этот набор клиенту, который закажет у вас сервис. Закажите услугу генетического тестирования у любой компании, которая уже заниматься этим. Вам пришлют набор: коробочка, пробирка и инструкция. Найдите фабрику в России или Китае, и закажите тысячу таких же коробочек (только поменяйте дизайн).
Вот таким образом работают почти все подобные компании на рынке. Большинство из них тестируют на огромное количество различных признаков. Это происходит из-за того, что им плохо (по крайней мере на начальном этапе) понятна их целевая аудитория. Самый лучший подход — найти узкую нишу в один-два признака и полность сфокусирваться на ней. Сформировать ценность продукта не в генетическом тесте самом по себе а в чем-то более востребованном и понятном. Например, известно, что по капле крови, волосу, кусочку кожи, слюне можно с точностью 99% определить цвет глаз, волос, кожи и национальность человека. Чисто в порядке бреда можно это завернуть это в обертку идентификации того, кто регулярно выкидывает мусор у вас под окнами. Также по ДНК можно определить породу собаки или кошки и идентифицировать животное, которое регулярно гадит у вас в подъезде. Можно нафантазировать много потенциальных продуктов, которые идентифицируют, например, 1) сорт яблок, которые вам продали на рынке, 2) курицу, снесшую яйцо, которое в вас кинули с балкона, 3) того кто плюнул вам в тарелку, 4) пасеку с которой прилетел укусившая вас пчела, 5) ферму, которая сливает фекалии (вместе с ДНК животных) в речку, 6) лес, где незаконно срубили деревья и тд.
Приходите на канал обсуждать идеи https://t.me/computebio.