Яков Сироткин — о геномном ассемблере.

Было очень интересно послушать по поводу того, как расшифровывается геном человека. Для тех кому лень, или нет времени – суть вот в чем: 1. Геном (или ДНК) невозможно просто взять и прочитать. 2. Для построения полной цепочки ДНК используются тысячи небольших отрезков по 100 – 200 символов, называемые ридами. 3. Риды взаимно перекрываются, и нет информации о том, из какой части ДНК данный конкретный рид. 4. Риды могут содержать ошибки, например при эксперименте в образц может примешаться ДНК человека, или какой-нить кишечной палочки (руки мыть надо). 5. ДНК человека (готовая цепочка) в состоящая из символов A,G,T,C, занимает больше 3 гигабайт. 6. Исходные данные (набор ридов), для построения цепочки, в сотни раз больше, чем результирующая цепочка. Вот и представьте, что, как и на каком железе нужно делать, что б получить ДНК человека….