Способ определения последовательности нуклеиновой кислоты (варианты) и набор для использования при определении последовательности нуклеиновой кислоты
В изобретении изложены способы и набор для быстрого и высокоэффективного создания последовательности нуклеиновой кислоты на основе гибридизации двумя наборами небольших проб олигонуклеотидов с известными последовательностями. Чрезвычайно большие молекулы нуклеиновых кислот, включая хромосомы и нерастворенные РНК, можно организовать в последовательности без предварительного клонирования и субклонирования. Способы согласно этому изобретению могут также позволить решить различные существующие проблемы, связанные с технологией создания последовательностей, такие, как, например, низкое значение отношения сигнал-шум и трудность избирательности, прикрепления многих фрагментов нуклеиновой кислоты к поверхности, приготовления многих более длинных или более сложных проб и нанесения меток на большее число веществ. 3 с. и 38 з.п.ф-лы, 10 ил.
Настоящая заявка является частичным продолжением одновременно рассматриваемой заявки на патент США 08/303.058, поданной 8 сентября 1994 г., которая является частичным продолжением заявки на патент США 08/127.420, поданной 27 сентября 1993 г.: весь текст и чертежи их специально включены сюда как ссылка без дискламации. Правительство США имеет право на настоящее изобретение согласно гранту Министерства энергетики LDRD 03235 и договору номер W-31-109-ENG-38 между Министерством энергетики США и Чикагским университетом, представляющим Национальную лабораторию Аргонн.
Настоящее изобретение в общем относится к области молекулярной биологии. В частности, изобретение предусматривает создание новых способов и соединений, позволяющих в высшей степени эффективное образование последовательностей молекул нуклеиновой кислоты. Способы согласно этому изобретению пригодны для организации последовательности длинных молекул нуклеиновых кислот, включая хромосомы и РНК, с процессами клонирования и субклонирования. В настоящее время образование последовательности нуклеиновых кислот составляет неотъемлемую часть научного прогресса. Определение последовательности, т.е. первичной структуры, молекул и сегментов нуклеиновых кислот важно в отношении отдельных проектов, исследующих целый диапазон конкретных прикладных областей. Информация об организации последовательности влияет на науку, медицину, сельское хозяйство и на все области биотехнологии. Создание последовательности нуклеиновых кислот, конечно, жизненно важно для исследований по геному человека и для других крупномасштабных начинаний, цель которых - продвинуть наше понимание эволюции и функции организмов и помочь в понимании причин различных заболеваний. Полезность организации последовательности нуклеиновых кислот очевидна. Например, Проект генома человека (ПГЧ), многонациональное начинание, посвященное созданию последовательности всего генома человека, осуществляется в различных центрах. Однако прогресс в этой области в основном и медленен и дорогостоящ. Организация последовательности нуклеиновых кислот обычно определяется на гелях полиакриламида, которые разделяют фрагменты ДНК в диапазоне 1 - 500 базовых пар с различием по длине на один нуклеотид. Реальное определение последовательности, т.е. порядок отдельных нуклеотидов A, G, C и T, можно достигнуть двумя способами. Во-первых, используя метод Максама и Гилберта химического расщепления фрагмента ДНК у конкретных нуклеотидов (Максам и Гилберт, 1977), или, во-вторых, используя метод создания последовательности окончанием цепочки дидеокси, описанный Сангером и коллегами (Сангер и др., 1977). Оба метода трудоемки и занимают много времени. Недавно были предложены другие способы создания последовательности нуклеиновых кислот, в которых не используется этап электрофореза, и эти способы можно в общем назвать Создание последовательности гибридизацией или СПГ (Дрманач и др., 1991; Кантор и др., 1992; Дрманач и Черквеняков, патент США 5.202.231). Развитие некоторых из этих методов вызвало появление новых инструментов создания последовательности типа твердой основы, известных как чипы создания последовательности. О полезности СПГ в основном свидетельствует тот факт, что по этой технологии были выданы патенты США. Однако, хотя СПГ потенциально может повысить скорость, с которой можно образовывать последовательности нуклеиновых кислот, все существующие методы СПГ имеют несколько недостатков. СПГ можно проводить двумя основными способами, которые часто называют "формат 1" и "формат 2" (Кантор и др., 1992). В формате 1 олигонуклеотиды неизвестной последовательности, обычно около 100 - 1000 нуклеотидов в длину, выстраиваются на твердой основе или фильтре, так что сами неизвестные образцы связываются (нейтрализуются) (Стрезоска и др., 1991; Дрманач и Черквеняков, патент США 5.202.231). Реплики ряда затем "опрашиваются" гибридизацией наборами меченных проб длиной приблизительно 6-8 радикалов. В формате 2 чип образования последовательности образуется из набора олигонуклеотидов с известными последовательностями с длиной приблизительно 6-8 радикалов (Сазерн, WO 89/10977; Храпко и др., 1991; Сазерн и др., 1992). Нуклеиновые кислоты неизвестной последовательности затем мечутся и им позволяют гибридизироваться к связанным олиго. К сожалению, оба эти формата СПГ имеют несколько ограничений, в частности, требование предшествующих этапов клонирования ДНК. В формате 1 к числу других значительных проблем относится прикрепление разных частей нуклеиновой кислоты, которую нужно организовать в последовательность, к твердой поверхности опоры или приготовление большого набора более длинных проб. В формате 2 к числу основных проблем относятся метки нуклеиновых кислот неизвестной последовательности, обычно высокое получающееся отношение сигнал-шум и то, что можно определить только короткие последовательности. Еще одна проблема в формате 2 - это образование вторичной структуры, которая предотвращает доступ к некоторым целям, и разные условия, необходимые для проб с различным содержанием GC. Поэтому эта технология очевидным образом выиграет от создания новой процедуры для организации последовательности нуклеиновых кислот и, в частности, такой процедуры, которая позволяет избегать утомительные процессы клонирования или/и субклонирования. Настоящее изобретение создано для преодоления этих и других недостатков, присущих предыдущим разработкам, путем создания новых способов и соединений для образования последовательности нуклеиновых кислот. Новейшие методы, описанные здесь, обычно назывались изобретателями "форматом 3" и они представляют собой заметное улучшение по сравнению с существующими методами СПГ формат 1 и формат 2. В формате 3 образования последовательности, обеспечиваемые этим изобретением, последовательности нуклеиновых кислот определяются посредством гибридизации с двумя наборами небольших проб олигонуклеотидов с известными последовательностями. Способ согласно изобретению позволяет получать высоко избирательную последовательность чрезвычайно больших молекул нуклеиновой кислоты, включая хромосомный материал или РНК, без предварительного клонирования, субклонирования или усиления. Кроме того, настоящие способы не требуют наличия большого количества проб, комплексного синтеза более длинных проб или мечения сложной смеси сегментов нуклеиновой кислоты. Для того чтобы определить последовательность нуклеиновой кислоты согласно способам этого изобретения, в основном находятся последовательности от нуклеиновой кислоты путем гибридизации с дополняющими последовательностями от двух наборов небольших проб олигонуклеотидов (олиго) с определенной длиной и известной последовательностью, которые включают в себя большинство комбинаций последовательностей для этой длины пробы. Затем анализируются найденные последовательности для определения перекрывающихся протяженностей найденных последовательностей и реконструируется или собирается полная последовательность нуклеиновой кислоты из таких перекрывающихся последовательностей. Способы образования последовательности можно выполнять с использованием последовательной гибридизации с дополнительными последовательностями из двух наборов небольших олиго. В качестве альтернативы можно применять способ, описываемый как "проведение цикла (чередование)", когда два набора небольших олиго гибридизируются одновременно с неизвестными последовательностями. Термин "проведение цикла" употребляется, поскольку избирательная часть метода возникает из последующего повышения температуры для "расплавления" тех гибридов, которые некомплементарны. Такие методы проведения цикла обычно применяются в других областях молекулярной биологии, таких, как PCR, и их легко поймут специалисты при чтении этого описания. Это изобретение применимо для образования последовательности молекул нуклеиновой кислоты очень большой длины. На практике молекула нуклеиновой кислоты, последовательность которой нужно образовать, в основном разделяется на фрагменты для получения фрагментов нуклеиновой кислоты малой или промежуточной длины, которыми легко манипулировать. Понятие фрагмент нуклеиновой кислоты, как он здесь используется, обычнее всего означает молекулу нуклеиновой кислоты длиной приблизительно от 10 базовых пар (бп) до 100 бп. Считается, что самые предпочтительные способы это те, в которых молекула нуклеиновой кислоты, последовательность которой нужно организовать, обрабатывается для получения фрагментов нуклеиновой кислоты промежуточной длины, т.е. приблизительно от 10 бп до 40 бп. Однако следует подчеркнуть, что настоящее изобретение это не способ полного образования последовательности небольших фрагментов нуклеиновой кислоты, скорее это способ образования последовательности молекул нуклеиновой кислоты как таковой, что предполагает определение частей последовательности изнутри молекулы - будь то осуществление с использованием целой молекулы или, для простоты, достигается начальным фрагментированием молекулы на участки меньшего размера приблизительно от 4 до 1000 баз. Последовательности из молекул нуклеиновой кислоты определяются путем гибридизации к небольшим пробам олигонуклеотидов с известной последовательностью. Когда говорят о "небольших пробах олигонуклеотидов", термин "небольшие" означает пробы с длиной менее 10 бп и предпочтительно пробы длиной около 4 бп и около 9 бп. В одном примере образования последовательности особенно пригодными считаются пробы длиной около 6 бп. Для наборов олиго, включающих в себя все комбинации последовательностей для выбранной длины пробы, их число будет представлено как 4F, где F это длина пробы. Например, для 4-мера набор будет содержать 256 проб; для 5-мера набор будет содержать 1024 проб; для 6-мера - 4096 проб; для 7-мера - 16384 проб и т.д. Синтез олиго такой длины является вполне рутинным в технике и его можно осуществлять автоматизированным синтезом. В способах согласно этому изобретению один набор небольших проб олигонуклеотидов с известной последовательностью, который можно назвать первым набором, будет прикрепляться к твердой основе, т.е. связываться (нейтрализоваться) на этой основе таким образом, что он может участвовать в реакциях гибридизации. Другой набор небольших проб олигонуклеотидов с известной последовательностью, который можно назвать вторым набором, это пробы, находящиеся в растворе и меченные обнаруживаемой меткой. Наборы олиго могут содержать пробы одинаковой длины или разных длин. Процесс последовательной гибридизации означает, что молекулы нуклеиновой кислоты или фрагменты с неизвестной последовательностью можно гибридизировать к определенным наборам проб олигонуклеотидов с известными последовательностями в отдельные периоды времени (фиг. 1). Молекулы или фрагменты нуклеиновой кислоты в основном будут денатурированы, позволяя гибридизацию, и будут добавляться к первому, связанному набору проб при условиях избирательной гибридизации с обеспечением того, что гибридизируются только фрагменты с дополняющими последовательностями. Фрагменты с некомплементарными последовательностями удаляются и затем проводится следующий цикл избирательной гибридизации путем добавления второго, меченного, набора проб в раствор к уже образованной комбинации фрагментов и проб. Меченные пробы, которые гибридизируются рядом с фиксированной пробой, останутся прикрепленными к основе и могут быть обнаружены, чего не происходит, когда имеется промежуток между фиксированными и меченными пробами (фиг. 1). Процесс одновременной гибридизации означает, что молекулы нуклеиновой кислоты неизвестной последовательности могут контактировать с определенными наборами проб олигонуклеотидов с известными последовательностями одновременно. Гибридизация происходит при условиях избирательной гибридизации. Затем фрагменты с некомплементарными (не дополняющими) последовательностями "расплавляются", т. е. удаляются при повышении температуры, и затем проводится следующий этап избирательной гибридизации, позволяющий гибридизироваться любым вторым дополнительным пробам. Затем меченые пробы, которые гибридизировались рядом с фиксированной пробой, обнаруживаются таким же образом. Последовательности нуклеиновой кислоты, являющиеся "дополняющими (комплементарными)", это те, которые способны к спариванию баз согласно стандартным правилам комплементарности Уотсона-Крика и вариантам этих правил, насколько они применимы к модифицированным базам. Это значит, что большие пурины или модифицированные пурины всегда будут спариваться по базе с меньшими пиримидинами с образованием только известных комбинаций. К ним относятся стандартный парис гуанина, спаренный с цитозином (G:C), и аденин, спаренный либо с тимином (A:T), в случае ДНК, либо с урацилом (A:U), в случае РНК. Также рассматривается использование модифицированных баз или так называемой "универсальной базы (основы)" (М. Николс и др., 1994). Используемый здесь термин "дополняющие (комплементарные)" последовательности означает последовательности нуклеиновой кислоты, которые в принципе являются дополняющими по всей своей длине и имеют очень мало несовпадений баз. Например, последовательности нуклеиновой кислоты с 6-ю базами по длине можно назвать дополняющими, если они гибридизируются в пяти из шести положений только с одним несовпадением. Естественно, последовательности нуклеиновой кислоты, которые являются "полностью дополняющими", это те последовательности нуклеиновой кислоты, которые являются полностью дополняющими по всей своей длине и не имеют несовпадений баз. После идентификации путем гибридизации к олиго с известными последовательностями разных отдельных последовательностей, составляющих часть фрагментов нуклеиновой кислоты, затем эти отдельные последовательности анализируются для нахождения перекрывающихся протяженностей последовательностей. Например, участки последовательностей, в которых конец 5' тот же самый, что и конец 3' другой последовательности или наоборот, идентифицируются. Полная последовательность молекулы или фрагмента нуклеиновой кислоты затем может оконтуриваться, т.е. она может реконструироваться из определенных таким образом перекрывающихся последовательностей. Процессы нахождения перекрывающихся последовательностей и реконструирования полной последовательности обычно определяются вычислительным анализом. Например, если меченая проба 5'-TTTTTT-3' гибридизируется к месту, содержащему фиксированную пробу 5'-AAAAAA-3', определяется 12-мерная последовательность изнутри молекулы нуклеиновой кислоты, а именно, 5'-AAAAAATTTTTT-3' (посл. ид. N. 1), т.е. последовательность двух гибридизированных проб комбинируется, чтобы обнаружить ранее неизвестную последовательность. Следующий вопрос, на который нужно ответить, это какой нуклеотид идет следующим после только что определенной последовательности 5'-AAAAAATTTTTT-3' (посл. ид. N. 1). Имеются четыре возможности, представленные фиксированной пробой 5'-AAAAAT-3' и мечеными пробами 5'-TTTTTA-3' для A; 5'-TTTTTT-3' для T; 5'-TTTTTC-3' для C; и 5'-TTTTTG-3' для G. Если, например, проба 5'-TTTTTC-3' положительна, а другие три отрицательны, то собранная последовательность расширяется до 5'-AAAAAATTTTTTC-3' (посл. ид. N.2). На следующем этапе алгоритм определяет, какие из меченых проб TTTTCA, TTTTCT, TTTTCC или TTTTCG положительны в месте, содержащем фиксированную пробу AAAATT. Этот процесс повторяется пока все положительные (F+P) последовательности олигонуклеотидов не используются или не будут определены как ложно положительные. Таким образом, это изобретение создает очень эффективный способ организовывать последовательность фрагментов и молекул нуклеиновой кислоты большой длины. Как здесь определено, большие молекулы нуклеиновой кислоты - это такие молекулы, которые нужно разделять на фрагменты до создания последовательности. Их длина обычно составляет, как минимум, приблизительно 45 или 50 базовых пар (БП), а чаще всего и больше. Фактически способы согласно изобретению можно использовать, чтобы организовывать последовательность молекул нуклеиновой кислоты практически без верхнего предела длины, так что можно образовывать последовательности около 100 бп, 1 килобазы (кб), 100 кб, 1 Мегабазы (Мб) и 50 Мб и более, до полных хромосом, включительно, таких, как хромосомы человека, имеющие в длину около 100 Мб. Такое большое количество вполне находится в рамках настоящего изобретения, и образование последовательности такого количества баз потребует 2 набора 8-меров или 9-меров (так что F+P приблизительно равно 16-18). Подлежащие образованию последовательности нуклеиновые кислоты могут быть ДНК, например, сДНК, геномная ДНК, микрорасчлененные хромосомные полосы, космидные ДНК или вставки YAC, или могут быть РНК, включая mРНК, rРНК, tРНК или snРНК. Процесс определения последовательности длинной молекулы нуклеиновой кислоты предполагает просто нахождение последовательностей с длиной F+P из молекулы и комбинирование последовательностей с использованием подходящего алгоритма. На практике сначала скорее всего разделяют на фрагменты молекулу нуклеиновой кислоты, последовательность которой нужно сформировать, для получения меньших фрагментов, таких, как фрагменты нуклеиновой кислоты с промежуточной длиной. Затем находятся последовательности с длиной F+P гибридизацией, например, последовательной гибридизацией фрагментов к дополняющим последовательностям из 2-х наборов небольших проб олигонуклеотидов с известной последовательностью, как описано выше. Таким образом, можно реконструировать полную последовательность нуклеиновой кислоты чрезвычайно больших молекул из перекрывающихся последовательностей с длиной F+P. Независимо от того, является ли нуклеиновая кислота, последовательность которой нужно организовать, сама фрагментом с промежуточной длиной или ее вначале обработали, чтобы получить фрагменты с такой длиной, процесс нахождения последовательностей из таких фрагментов нуклеиновых кислот путем гибридизации двух наборов небольших проб олигонуклеотидов с известной последовательностью является основным для описываемых здесь методов образования последовательности. Этот процесс обычно включает в себя следующие этапы: а) приведение набора или ряда прикрепленных или связанных (нейтрализованных) проб олигонуклеотидов в контакт с фрагментами нуклеиновой кислоты в условиях гибридизации, эффективных для того, чтобы позволить фрагментам с дополняющей последовательностью достаточно гибридизироваться к пробе, что образует первичные комплексы, где фрагмент имеет как гибридизированные, так и негибридизированные, или "свободные", последовательности; б) приведение первичных комплексов в контакт с набором меченых проб олигонуклеотидов в растворе в условиях гибридизации, эффективных для того, чтобы позволить пробам с дополняющими последовательностями гибридизироваться к негибридизированной или свободной последовательности фрагмента, что образует вторичные комплексы, где фрагмент гибридизирован, и к прикрепленной (связанной) пробе и к меченой пробе; в) удаление из вторичных комплексов любых меченых проб, которые не были гибридизированы рядом с прикрепленной пробе, что оставляет только соседние вторичные комплексы; г) обнаружение соседних вторичных комплексов путем обнаружения наличия метки в меченой пробе; и д) нахождение последовательностей олигонуклеотидов из фрагментов нуклеиновой кислоты в соседних вторичных комплексах путем комбинирования или соединения известных последовательностей гибридизированных и меченых проб. Гибридизация или "условия промывки", выбранные для проведения одного или двух этапов гибридизации, может осуществляться согласно конкретно выбранному примеру образования последовательности. Например, оба условия гибридизации могут быть организованы так, чтобы позволить пробам олигонуклеотида гибридизироваться к данному фрагменту нуклеиновой кислоты, когда они содержат дополняющие последовательности, например, в принципе совпадающие последовательности, например, такие последовательности, которые гибридизируются у 5-ти из 6-ти положений. Предпочтительно этапы гибридизации проводят, используя простое робототехническое устройство, которое обычно применяется в существующих процедурах образования последовательностей. В качестве альтернативы условия гибридизации могут быть организованы так, чтобы позволить гибридизацию только тем пробам и фрагментам олигонуклеотидов, которые имеют полностью дополняющие последовательности. Эти более избирательные или "строгие" условия можно использовать для обоих отдельных этапов процесса последовательной гибридизации или только для каждого одного этапа. В таких случаях пробы олигонуклеотидов, будь то связанные или меченые пробы, смогут гибридизировать только к данному фрагменту нуклеиновой кислоты, если они имеют общие полностью дополняющие последовательности с фрагментом. Выбранные условия гибридизации в основном диктуют степень сложности, требуемую для анализа полученных данных. В равной степени компьютерные программы, имеющиеся для анализа любых сформированных данных, могут диктовать условия гибридизации, которые нужно применять в данной лаборатории. Например, в самом избирательном процессе оба этапа гибридизации будут проводиться в условиях, позволяющих гибридизировать только олиго и фрагменты с полностью дополняющими последовательностями. Поскольку несовпадающих баз не будет, этот способ подразумевает наименее сложный вычислительный анализ и по этой причине это в настоящее время предпочтительный способ применения изобретения на практике. Однако применение менее избирательных условий для одного или обоих этапов гибридизации также входит в рамки этого изобретения. Подходящие условия гибридизации для применения на одном из этапов или на обоих могут обычно определяться процедурами оптимизации или первыми из серии исследований. Разные виды первых исследований обычно проводятся специалистами по организации последовательностей нуклеиновых кислот при установлении рабочих процедур и адаптации процедуры для данной лаборатории. Например, такие условия, как температура; концентрация каждого из компонентов; продолжительность времени этапов; применяемые буферы и их pH и прочность на ионы могут меняться и тем самым оптимизироваться. В предпочтительных примерах осуществления способ образования последовательности нуклеиновой кислоты согласно этому изобретению включает в себя выборочный этап для отбора вторичных комплексов гибридизации, которые содержат непосредственно соседствующие связанные и меченые пробы, в отличие от тех, которые не являются непосредственно соседними и разделены одной, двумя или несколькими базами. Имеется много разных процессов для удаления меченых проб, которые не гибридизировались непосредственно рядом с прикрепленной пробой, т.е. не гибридизировались задними сторонами, каждый из которых оставляет только непосредственно соседние вторичные комплексы. Такие избирательные процессы могут основываться исключительно на этапах промывки с контролируемой строгостью, где применяемые условия гибридизации организованы так, что непосредственно соседние пробы остаются гибридизированными благодаря повышенной стабильности, создаваемой взаимодействиями между наборами соседних нуклеотидов. Опять же такие условия промывки, как температура, концентрация, время, буферы, pH прочность на ионы и т.п. можно менять, чтобы оптимизировать удаление меченых проб, которые не являются непосредственно соседними. В предпочтительных примерах осуществления изобретения непосредственно соседние связанные и меченые пробы будут связаны, т.е. объединены ковалентной связью до выполнения этапов промывки для удаления любых не образовавших связи проб. Образование связей может достигаться путем обработки раствором, содержащим химическое связующее вещество, например, растворимый в воде карбодиимид или цианоген бромид. Предпочтительно можно использовать фермент лигазы, такой, как лигаза T4 ДНК из бактериофага T4, который промышленно поставляется многими фирмами (например, Biolabs). В любом случае затем можно будет удалить не непосредственно соседние меченые пробы посредством более строгих условий промывки, которые не могут воздействовать на ковалентно соединенные меченые и фиксированные пробы. Остающиеся соседние вторичные комплексы будут обнаруживаться наблюдением за нахождением метки из меченых проб, присутствующих внутри комплексов. Пробы олигонуклеотидов могут метиться химически обнаруживаемой меткой, такой как флюоресцентными красителями, или адекватно модифицированными для их обнаружения процедурами хемилюминесцентного проявления, или радиоактивными метками, такими, как 35S, 3H, 32P или 33P, хотя сейчас предпочтителен 33P. Пробы могут также метиться нерадиоактивными изотопами и обнаруживаться масс-спектрометрией. В настоящее время наиболее предпочтительный рассматриваемый способ осуществления на практике этого изобретения предполагает осуществление этапов гибридизации в условиях, предназначенных для того, чтобы позволить гибридизировать только тем пробам и фрагментам олигонуклетидов, которые имеют полностью дополняющие последовательности, и позволить оставаться гибридизированными только непосредственно соседним пробам. Этот способ вследствие этого требует наименее сложного вычислительного анализа. Если молекула нуклеиновой кислоты с неизвестной последовательностью длинее чем около 45 или 50 бп, один эффективный способ определения ее последовательности обычно предполагает обработку молекулы для формирования фрагментов нуклеиновой кислоты промежуточной длины и определение последовательностей из фрагментов. Молекула нуклеиновой кислоты, буть то ДНК или РНК, может быть разделена на фрагменты любым из многочисленных способов, включая, например, разрезанием ограничительным ферментным вывариванием, сдвигом (скалыванием) физическими средствами, такими, как сверхзвуковая обработка, обработкой NaOH или сдвигом при низком давлении. В некоторых примерах осуществления изобретения, например, при наличии небольших проб олигонуклеотидов длиной приблизительно от 4 бп до 9 бп можно иметь целью получить фрагменты нуклеиновой кислоты длиной приблизительно от 10 бп до 40 бп. Естественно, более длинные пробы в основном будут использоваться в сочетании с образованием последовательности более длинных фрагментов нуклеиновой кислоты и наоборот. В некоторых предпочтительных примерах осуществления используемые небольшие пробы олигонуклеотидов будут иметь длину около 6 бп, а фрагменты нуклеиновой кислоты, последовательность которых нужно организовать, будут иметь длину в основном около 20 бп. При желании фрагменты можно разделять по размерам, чтобы получить фрагменты соответствующей длины, например, фрагменты могут обрабатываться на геле, таком, как гель агарозы, и фрагменты приблизительно желаемой длины могут отрезаться. Способ определения последовательности молекулы нуклеиновой кислоты можно также пояснить на примере, используя следующие условия. Вначале произвольно фрагментируется некоторое количество нуклеиновой кислоты, последовательность которой нужно образовать для получения смеси фрагментов нуклеиновой кислоты длиной T. Приготовляется ряд связанных проб олигонуклеотидов с известными последовательностями и длиной F и набор меченых проб олигонуклеотидов в растворе с известными последовательностями и длиной P, где F + P = T, предпочтительно когда T приблизительно равно 3F. Затем ряд связанных проб олигонуклеотидов приводится в контакт со смесью фрагментов нуклеиновой кислоты в условиях гибридизации, эффективных для того, чтобы позволить формирование первичных комплексов с гибридизированными, дополняющими последовательностями длиной F и негибридизированными последовательностями фрагментов длиной T-F. Предпочтительно гидридизированные последовательности длиной F будут содержать только полностью дополняющие последовательности. Затем первичные комплексы приводятся в контакт с набором меченых проб олигонуклеотидов в условиях гибридизации, эффективных для того, чтобы позволить образование вторичных комплексов с гибридизированными, дополняющими последовательностями длиной F и соседними гибридизированными, дополняющими последовательностями длиной P. В предпочтительных примерах осуществления изобретения только меченым пробам с полностью дополняющими последовательностями будет позволено гибридизировать, и только тем пробам, которые гибридизируют непосредственно рядом со связанной пробой, будет позволено оставаться гибридизированными. В самых предпочтительных примерах на этом этапе соседние связанные и меченые пробы олигонуклеотидов будут также образовывать связи. Затем обнаруживаются вторичные комплексы путем обнаружения наличия метки и идентифицируются последовательности длиной F+P из фрагментов нуклеиновой кислоты во вторичных комплексах путем комбинирования известных последовательностей гибридизированных связанных и меченых проб. Затем перекрывающиеся протяженности последовательностей длины F+P будут идентифицироваться, что позволяет реконструировать или собирать полную последовательность нуклеиновой кислоты из определенных перекрывающихся последовательностей. В способах согласно этому изобретению олигонуклеотиды первого набора могут прикрепляться к твердой основе, т.е. связываться (нейтрализовываться) любым из методов, известных специалистам. Например, прикрепление может производиться посредством адресуемой приводимой в действие лазером фотодепротекции (Фодор и др., 1991; Пиз и др., 1994). Один в общем случае предпочтительный способ - это прикрепление олиго через фосфатную группу с использованием таких реагентов, как нуклеозид фосфорамидит или нуклеозид водород фосфорат, как описано Сазерном и Маскосом (заявки PCT WO 90/03382) с использованием основ из стекла, нейлона или тефлона. Другой предпочтительный способ - это метод генерированного светом синтеза, описанный Пизом и др. (1994). Можно также купить связанные с основой ряды олигонуклеотидов, например, такие, которые продаются фирмами Affymetrix и Beckman. Связанные олигонуклеотиды могут образовываться в ряд, содержащий все пробы или подмножества проб с данной длиной (предпочтительно приблизительно 4 - 10 баз), и более предпочтительно во множество рядов связанных олигонуклеотидов, расположенных с образованием так называемого "чипа создания последовательности". Один пример чипа - это когда гидрофобные сегменты используются для создания отдельных пространственных участков. Чипы создания последовательности можно сконструировать для разных областей применения, таких, как планирование, частичное создание последовательности, создание последовательности намеченных участков для целей диагностики, создание последовательности mPHK и создание широкомасштабной последовательности генома. Для каждой области применения можно сконструировать конкретный чип с пробами разных размеров или с неполным набором проб. В одном примере осуществления изобретения обоими наборами проб олигонуклеотидов будут пробы длиной в 6 баз, т.е. 6-меры. В этом случае каждый набор олиго содержит 4096 отдельных проб. Пробы первого набора предпочтительно фиксированы в ряду на микрочипе, наиболее удобно при размещении в 64 ряда и 64 столбца. Второй набор из 4096 олиго будет метиться обнаруживаемой меткой и распределяться на набор отдельных трубочек. В этом примере 4096 чипов будут комбинироваться в большой ряд или в несколько рядов. После гибридизации фрагментов нуклеиновой кислоты небольшое количество меченых олигонуклеотидов будет добавляться к каждому микрочипу для второго этапа гибридизации и только один из каждых 4096 нуклеотидов будет добавляться к каждому микрочипу. К числу других объектов этого изобретения относятся наборы материалов для создания последовательностей нуклеотидных кислот. В основном такие наборы включают в себя твердую основу, к которой прикреплен ряд проб олигонуклеотидов с известными последовательностями, как показано на фиг. 2A, фиг. 2B и фиг. 2C, где олигонуклеотиды способны участвовать в реакциях гибридизации, и набор емкостей, содержащих растворы меченых проб олигонуклеотидов с известными последовательностями. Рассматриваются также такие схемы, как те, которые представлены на фиг. 4. Она описывает использование "универсальной базы" либо как способа прикрепления или у конечного положения, чтобы придать новое измерение гибридизации фрагментов. В этих наборах материалов прикрепленные пробы олигонуклеотидов и пробы в растворе могут иметь длину приблизительно 4-9 бп, причем предпочтительны пробы длиной около 6 бп. Олиго могут быть мечены химически обнаруживаемыми или радиоактивными метками, причем в общем случае предпочтительны пробы, меченые 32P, и еще более предпочтительны пробы, меченые 33P. Наборы материалов могут также включать в себя химическое или другое связующее вещество, такое, как фермент лигазы ДНК. В состав наборов материалов могут включаться разные другие соединения и материалы, такие, как устройства с 96 кончиками или 96 штырьками, буферы, реагенты для разрезания длинных молекул нуклеиновой кислоты и инструменты для выбора размеров фрагментов ДНК. Наборы материалов могут также включать меченые приборы РНК, так что пробы можно удалять обработкой РНКазы и повторно используемыми чипами создания последовательности. На чертежах проиллюстрировано настоящее изобретение. На фиг. 1 показаны основные этапы процесса гибридизации. Этап 1: Немеченная целевая ДНК, последовательность которой нужно образовать (Т), гибридизируется в избирательных условиях к ряду прикрепленных проб олигонуклеотидов. Описаны места с пробой Fx и Fy. Дополняющие последовательности для Fx и Fy находятся на разных положениях Т. Этап 2: Меченые пробы Pi (одна проба на чип) гибридизируются к ряду. Описана проба, имеющая дополняющую цель на Т, которая соседствует с Fx, но не с Fy. Этап 3: Путем применения избирательных условий или реагентов селективно расплавляются комплексы без соседних проб. Конкретный пример - это образование связи меченой пробы с фиксированной пробой, когда меченая проба гибридизирует "задней стороной к задней стороне" с прикрепленной пробой. Положительные сигналы обнаруживаются только в случае соседних проб, таких, как Fx и Pi, и в конкретном примере только в случае образовавших связи проб. На фиг. 2A, фиг. 2B и фиг. 2C представлены компоненты примерного набора материалов для образования последовательностей. Фиг. 2A. Чипы создания последовательности, представляющие собой ряд 4P тождественных секций, каждая из которых содержит тождественные (или разные) ряды олигонуклеотидов. Секции могут разделяться физическими барьерами или гидрофобными полосками. Считается, что в ряду имеется 4000-16000 олигочипов. Фиг. 2B - это вид в увеличении секции чипа, содержащей 4F участков, каждый с конкретной пробой олигонуклеотида (4000-16000), синтезированной или установленной в этом месте. Участки могут быть размером всего в несколько микрон, а размер секции приблизительно 1 - 10 мм. Фиг. 2C представляет набор трубочек или одну или несколько пластин с множеством карманов с соответствующим числом карманов (в этом случае 4P карманов). Каждый карман содержит некоторое количество конкретно меченого олигонуклеотида. Дополнительное количество проб можно хранить немеченными, если мечение не производится во время синтеза; в этом случае набор материалов для создания последовательности будет содержать необходимые компоненты для мечения проб. Линии, соединяющие трубочки/карманы с секциями чипа, описывают этап в процедуре организации последовательности, когда некоторое количество меченой пробы переносится в секцию чипа. Перенос может осуществляться пипеткой (простой или многоканальной) или рядом штырьков (шпилек), переносящих жидкость посредством поверхностного натяжения. Инструменты для переноса также могут включаться в набор материалов. Фиг. 3A, фиг. 3B и фиг. 3C. Гибридизация фрагментов ДНК, полученных произвольным разрезанием некоторого количества молекулы ДНК. На фиг. 3A фрагмент T1 ДНК такой, что содержит полные цели для фиксированных и нефиксированных меченых проб. Фиг. 3B представляет случай, когда фрагмент Т ДНК неправильно разрезан. На фиг. 3C имеется достаточно места для гибридизации пробы P, но соседняя последовательность не комплементарна ей. И в случае B, и в случае C сигнал будет уменьшен из-за насыщения молекул прикрепленной пробы F. Одновременная гибридизация фрагментами ДНК и мечеными пробами и циклическое проведение процесса гибридизации - это некоторые возможные способы увеличения выхода правильных соседних гибридизаций. Фиг. 4. Использование "универсальной базы" как средства связи или в конечном положении для гибридизации. Универсальные базы (М-база, Николс и др. , 1994) или все 4 базы можно добавлять в синтезе пробы. Это один из способов увеличения длины проб и, таким образом, стабильности дуплексов без увеличения количества проб. Кроме того, использование универсальных баз на свободном конце проб создает прокладку, которая позволяет прочитывать последовательность в другом кадре (фрейме). Определение последовательностей молекул нуклеиновых кислот находит важное использование во всех областях фундаментальных и прикладных биологических исследований (Дрманач и Черквеняков, 1990). Настоящее изобретение создает новые и эффективные способы для создания последовательностей и анализа нуклеиновой кислоты. Одно из намечаемых использований этой методологии в сочетании с другими способами образования последовательностей - это использование в работе над Проектом генома человека (ПГЧ). В настоящее время известны два метода создания последовательности гибридизации (СПГ). В первом, формат 1, неизвестные геномные ДНК или олигонуклеотиды длиной до 100-200 выстраиваются на твердой подложке. Затем эти ДНК "опрашиваются" гибридизацией набором меченых проб, которые обычно 6-8-меры. В обратном методе, формат 2, олигомеры в 6-8 нуклеотидов связываются (нейтрализуются) на твердой основе, и им позволяют отжигаться до частей клонированной и меченой ДНК. В любом из двух видов анализа СПГ нужно включать много этапов, чтобы прийти к определенной последовательности. Конкретные проблемы, связанные с существующими методами СПГ, это те, которые ассоциируются с синтезом большого числа проб и с трудностями эффективной избирательной гибридизации. Полное распознавание совпадения-несовпадения затруднено по двум основным причинам. Во-первых, конечное несовпадение проб длиннее, чем 10 баз очень неизбирательно, и, во-вторых, сложная смесь меченных сегментов ДНК, которая получается при анализе длинных фрагментов ДНК, генерирует высокий фон. Настоящее изобретение обеспечивает эффективную избирательную гибридизацию без большого числа проб или проб с увеличенной длиной и также исключает многие из этапов нанесения меток и клонирования, которые являются конкретными недостатками каждого из известных методов СПГ. Описываемые в высшей степени эффективные способы создания последовательности нуклеиновой кислоты, называемые созданием последовательности в формате 3, основаны на гибридизации с двумя наборами небольших проб олигонуклеотидов с известными последовательностями, и таким образом можно определять, как минимум, в два раза большую длину последовательности. Эти способы позволяют организовывать последовательность чрезвычайно больших молекул нуклеиновой кислоты, включая хромосомы, и решать разные другие проблемы СПГ, такие, как, например, прикрепление или мечение многих фрагментов нуклеиновой кислоты. Изобретение имеет чрезвычайно большую потенцию, т.к. его можно также использовать для создания последовательности РНК и даже неувеличенных образцов РНК. После настоящего изобретения, как описано в заявке США 08/127.402 и у Дрманача (1994), был представлен другой вариант СПГ, названный позиционным СПГ (ПСПГ) (Бруд и др., 1994). ПСПГ по сути является вариантом СПГ формата 2 (в котором олигонуклеотиды известных последовательностей связываются (нейтрализуются) и используются для гибридизации к нуклеиновым кислотам неизвестной последовательности, которые предварительно метились). В ПСПГ связанные пробы, не будучи простыми, односкрученными пробами, это дуплексы, содержащие односкрученные 3' свесы. Биотинилированные дуплексные пробы связываются на покрытых стрептавидином магнитных шариках с образованием некоторого вида связанной пробы и затем перемешиваются с 32P-мечеными целевыми нуклеиновыми кислотами, последовательность которых нужно создать. Затем добавляется лигаза Т; ДНК для связывания любой гибридизированной целевой ДНК к более короткому концу дуплексной пробы. Однако, хотя это представляет собой интересный подход, ПСПГ (как оно излагается Брудом и др., 1994) не отражает значительного улучшения по сравнению с существующей технологией СПГ. Например, в отличие от методологии формата 3 этого изобретения, ПСПГ не удлиняет длины последовательности, которую можно определить за один цикл способа. В ПСПГ также поддерживается обременительное требование нанесения меток на неизвестную целевую ДНК, чего не требуется в формате 3. В общем ПСПГ предлагается для использования в сравнительных исследованиях или в планировании, а не в новом создании последовательности генома. Таким образом, это значительно отличается от формата 3, который, хотя и широкого применим во всех областях создания последовательностей, является очень мощным инструментом для образования последовательностей даже самых крупных геномов. Нуклеиновые кислоты, последовательность которых нужно организовать, можно сначала разделить на фрагменты. Этого можно достигнуть любыми способами, включая, например, разрезание ограничительным ферментным вывариванием, особенно с Cvi JI, как описано Фицджералдом и др. (1992); сдвигом физическими средствами, такими, как ультразвуковая обработка; обработкой NaOH и т.п. При желании фрагменты соответствующей длины, например, приблизительно 10 - 40 бп, могут вырезаться из геля. Полная последовательность нуклеиновой кислоты первоначальной молекулы, такой, как хромосома человека, будет определяться путем определения последовательностей F+P, присутствующих в начальной молекуле, и сборки частей перекрывающихся последовательностей F+P. Поэтому это не требует промежуточного этапа определения последовательностей фрагмента, скорее последовательность всей молекулы сконструируется из оконтуренных последовательностей F+P. Для цели следующего обсуждения в общем случае будет приниматься, что 4 базы составляют последовательности нуклеиновых кислот, которые нужно организовать. Это A, G, C и T для ДНК и A, G, C и U для РНК. Однако может быть полезным в некоторых примерах осуществления использовать модифицированные базы в небольших пробах олигонуклеотидов. Чтобы выполнить это изобретение, сначала обычно готовится ряд небольших проб олигонуклеотидов определенной длины, который включает в себя все комбинации последовательностей для этой длины пробы. Это число представляет 4N (4 в степени N), где длина пробы обозначена N. Например, имеются 4096 возможных последовательностей для 6-мерной пробы (46 = 4096). Один набор таких проб длиной F (4F) будет фиксироваться в квадратном расположении на микрочипе, который может быть в диапазоне от 1 мм2 до 1 см2. В настоящем примере они будут расположены в 64 ряда и 64 столбца. Естественно, обеспечивается, чтобы пробы олиго были прикреплены или иначе связаны с поверхностью микрочипа так, чтобы могли участвовать в реакциях гибридизации. Другой набор олиго с длиной P, числом 4P, будет тоже синтезирован. Олиго в этом наборе "P" будут метиться обнаруживаемой меткой и будут распределяться по набору трубочек (фиг. 2A, фиг. 2B и фиг. 2C). 4P из чипов будут комбинироваться в большой ряд (или несколько рядов приблизительно 10 - 100 см2 для удобных размеров), где P соответствует длине олигонуклеотидов во втором наборе олигомера (фиг. 2B и фиг. 2C). Снова, в качестве удобного примера, P выбирается как 6 (P = 6). Нуклеиновые кислоты, последовательности которых нужно организовать, будут разделяться на фрагменты с получением меньших фрагментов нуклеиновых кислот с неизвестной последовательностью. Средняя длина этих фрагментов, называемая Т, обычно должна быть больше, чем объединенная длина F и P^ и может быть приблизительно в три раза больше длины F (т.е. F+P

Модифицированные олигонуклеотиды могут использоваться во всех процедурах этого изобретения для повышения специфичности или эффективности гибридизации. Способ достижения этого - замена природных нуклеотидов модификацией базы. Например, можно использовать пиримидины с галогеном у положения C5. Считается, что это улучшает стабильность дуплекса путем влияния на установку базы слоями. Можно также применять 2,6-диаминопурин для придания 3-й связи галогена в его базовом спаривании с тимином, что термически стабилизирует ДНК-дуплексы. Сообщалось, что использование 2,6-диаминопурина приводит к значительному улучшению стабильности дуплекса коротких олигомеров. Его включение, как предлагается, предоставляет более строгие условия отжига инициирующего вещества, тем самым улучшая специфичность образования дуплекса и подавляя фоновые проблемы или исключая использование более коротких олигомеров. Синтез вариантов трифосфата этих модифицированных нуклеотидов описан Хохайзелем и Лерахом (1990). 5-хлоро-2'-деоксиуридин и 2,6-диаминопурин 2'-деоксинуклеозид приобретаются, например, в фирме Sigma. Фосфорилирование выполняется следующим образом: 50 мг сухого 2-NH2-dAdo принимается в 500 мкл сухого триэтил фосфата при перемешивании в аргоне. Добавляется 25 мкл POCl3 и смесь выдерживается в термостате при -20oC. Тем временем 1 ммоль пирофосфорной кислоты растворяется в 0,95 мл три-n-бутиламина и 2 мл метанола и высушивается во вращающемся испарителе. Затем она высушивается испарением дважды из 5 мл пиридина, причем перед вторым разом также добавляется 70 мкл три-n-бутиламина. Наконец, это растворяется в 2 мл сухого диметил формамида. Спустя 90 мин при -20oC смесь фосфорилирования испаряется для удаления избытка POCl3 и добавляется три-n-бутиламмоний пирофосфат в диметил формамиде. Выдерживание проводится в течение 1,5 мин при комнатной температуре. Реакция останавливается путем добавления 5 мл 0,2 М триэтиаламмоний бикарбоната (pH 7,6) и смесь держится на льду 4 часа. Для 5-Cl-dUrd условия будут тождественны, но добавляется 50 мкл POCl3 и фосфорилирование проводится при комнатной температуре в течение 4 часов. После гидролиза смесь испаряется, pH устанавливается на 7,5 и экстрагируется 1 объемом диэтил эфира. Разделение продуктов производится, например, на (2,5 х 20 см) Q-Sepharose колонне с использованием линейного градиента 0,15 М к 0,8 М триэтиламмоний бикарбонату. При хранении замороженными нуклеотиды стабильны длительное время. Можно также использовать неизбирательный аналог базы или универсальную базу, как она сконструирована Николсом и др. (1994). Этот новый аналог, 1-(2'-деокси-бета-D-рибофураносил)-3-нитропиррол (обозначаемый М), был сформирован для использования в пробах олигонуклеотидов и инициирующих веществах для решения проблем проектирования, которые возникают в результате вырождения генетического кода или когда имеются только данные по фрагментарной последовательности пептидов. Этот аналог повышает укладку слоями и одновременно минимизирует взаимодействия с образованием водородных связей, не разрушая пространственно дуплекс ДНК. Аналог М нуклеозида был сконструирован, чтобы максимально увеличить взаимодействия при укладке слоями с использованием апротических полярных заместителей, связанных с гетероароматическими кольцами, повышая внутри- и внепрядевые взаимодействия при укладке, чтобы уменьшить роль водородных связей в специфичности базового спаривания. Николс и др. (1994) предпочитают 3-нитропиррол 2'-деоксирибонуклеозид из-за его структурной и электронной схожести с р-нитроанилином, чьи производные относятся к самым малым известным пропласткам двойной свитой ДНК. Диметокситритил-защищенный фосфорамидит нуклеозида M также может включаться в нуклеозиды, используемые как инициирующие вещества для образования последовательности и цепной реакции полимеразы (PCR). Николс и др. (1994) показали, что значительное количество нуклеотидов могут заменяться M без потери специфичности инициирующего вещества. Уникальное свойство M - это его способность замещать длинные звенья смежных нуклеозидов и все же давать функциональные инициирующие вещества для образования последовательностей. Как сообщалось, все последовательности с 3, 6 и 9 замещениями M дают читаемые "лестницы" образования последовательностей, и все PRC с 3-мя разными содержащими M инициирующими веществами привели к расширению правильного продукта (Николс и др., 1994). Способность содержащих 3-нитропиррол олигонуклеотидов функционировать в качестве инициирующих веществ уверенно показывает, что дуплексная структура должна образовываться с дополняющими прядями. Оптические тепловые профили, полученные для пар олигонуклеотидов d(5'-C2-T5XT5G2-3') и d(5'-C2A5YA5G2-3') (где X и Y могут быть A, C, G, T или M), как сообщалось, подходят под обычный сигмоидальный рисунок, наблюдаемый для перехода от двойной к одной пряди (нити) ДНК. Значения Tm олигонуклеотидов, содержащих базовые пары X

Приготовление образующих последовательностей чипов и рядов
Этот пример описывает физические варианты осуществления образующих последовательности чипов, рассматриваемых изобретателем. Основной пример - это использование 6-меров, прикрепленных к поверхностям в 50 микрон для получения чипа с размерами 3 х 3 мм, который можно комбинировать с получением ряда 20 х 20 см. Другой пример - это использование 9-мерных олигонуклеотидов, прикрепленных к поверхности в 10 х 10 микрон для создания 9-мерного чипа с размерами 5 х 5 мм. 4000 единиц таких чипов можно использовать для создания ряда 30 х 30 см. На фиг. 2A, фиг. 2B и фиг. 2C показан еще один пример ряда, в котором 4000-16000 олигочипов расположены по квадрату. Пластина или набор трубочек, как также указано, можно упаковать с этим рядом как часть набора материалов для создания последовательностей. Ряды можно отделить физически друг от друга или с помощью гидрофобных поверхностей. Один возможный способ использовать разделение гидрофобной полоской - это применить такую технологию, как Iso-Grid Microbiology System, выпускаемую фирмой QA Laboratories, Торонто, Канада. Гидрофобные сеточные мембранные фильтры (HGMF) использовались в аналитической микробиологии пищевых продуктов уже около десятилетия, где они уникально привлекательны тем, что имеют расширенный числовой диапазон и автоматизированный подсчет колоний. Одна промышленно поставляемая сетка - это ISO-GRID(TM) от фирмы QA Laboratories Ltd. (Торонто, Канада), которая состоит из квадрата (60 х 60 см) полисульфонного полимера (Gelman Tuffryn HT-450, размер пор 0,45 мю), на котором отпечатана краской черная гидрофобная сетка, состоящая из 1600 (40 х 40) квадратных ячеек. HGMF был предварительно модифицирован добавкой бактериальных суспензий вакуумной фильтрацией и выдерживался на дифференциальной или селективной среде по выбору. Поскольку рост микробов ограничен ячейками сетки с известным положением и размером мембраны, HGMF функционирует более как аппарат MPN, чем обычная пластина или мембранный фильтр. Петеркин и др. (1987) сообщили, что эти HGMF можно использовать для распространения и хранения геномных библиотек при использовании с репликатором HGMF. Один такой инструмент реплицирует рост от каждой из 1600 ячеек ISO-GRID и позволяет сделать много копий образцового HGMF (Петеркин и др., 1987). Шарп и др. (1989) также применяли ISO-GRID HGMF от QA Laboratories и автоматизированный счетчик HGMF (MI-100 Interpreter) и репликатор RP-100. Они сообщили о методе поддержания и сортировки многих культур микробов. Петеркин и его коллеги после описали способ сортировки проб ДНК с использованием гидрофобного сеточно-мембранного фильтра (Петеркин др., 1989). Эти авторы сообщили о способах эффективной гибридизации колоний прямо на HGMF. Раньше плохие результаты получались из-за низкой связующей ДНК способности полисульфонного полимера, на котором печатаются HGMF. Однако Петеркин и др. (1989) сообщили, что связывание ДНК с поверхностью мембраны улучшилось при обработке реплицированных и выдержанных в термостате HGMF полиэтиленимином, поликатионом, до контакта с ДНК. Хотя в этой ранней работе использовалось ячеистое прикрепление ДНК и цель была отличной от цели этого изобретения, описанную методологию можно легко адаптировать для формата 3 СПГ. Для того чтобы быстро идентифицировать полезные последовательности, Петеркин и др. (1989) использовали радиомеченную плазмидную ДНК из разных клонов и испытывали ее специфичность относительно ДНК на приготовленных HGMF. Таким образом, ДНК из рекомбинантных плазмидов быстро сортировалась гибридизацией колоний относительно 100 организмов на репликатах HGMF, которые можно легко и воспроизводимо приготовить. Нужно решить две основные проблемы. Манипулирование с малыми (2-3 мм) чипами и параллельное выполнение тысяч реакций. Решение, которое предлагает это изобретение, состоит в том, чтобы содержать чипы и пробы в соответствующих рядах. В одном примере чипы, содержащие 250000 9-меров синтезируются на кремниевой подложке в форме пластин 8 х 8 mM (15 мкМ/олигонуклеотид, Пиз и др., 1994), выстроенных в формате 8 х 12 (96 чипов) с желобком между ними в 1 mM. Пробы добавляются либо многоканальной пипеткой, либо рядом штырьков, по одной пробе на 1 чип. Для расчета всех 4000 6-меров нужно применять 42 ряда чипов, или используя разные ряды, или повторно используя один набор рядов чипов несколько раз. В указанном случае при использовании ранней номенклатуры этой заявки, F= 9; P=6; F+P=15. Чипы могут иметь пробы с формулой BxNn, где x - это число специфицированных баз B; а n - это число неспецифицированных баз, так что x=4-10 и n= 1-4. Чтобы достичь более эффективной гибридизации и избежать потенциального влияния любых олигонуклеотидов основы, специфицированные базы можно окружить неспецифированными базами, что представляется такой формулой как (N)nBx(N)m (фиг. 4). Пример IV
Приготовление фрагментов нуклеиновой кислоты
Нуклеиновые кислоты, последовательности которых нужно создать, можно получить из любого подходящего источника, такого, как сДНК, геномная ДНК, хромосомная ДНК, микрорассеченные хромосомные полосы, космидные или YAC вставки и РНК, включая mРНК без каких-либо этапов расширения. Например, Сэмбрук и др. (1989) описывают 3 протокола для изолирования ДНК с высоким молекулярным весом от клеток млекопитающих (стр. 9.14-9.23). Затем нуклеиновые кислоты фрагментируются любым из способов, известных специалистам, включая, например, использование ограничительных ферментов, как описано на стр. 9.24-9.28 у Сэмбрука и др. (1989), сдвиг ультразвуком и обработку NaOH. Сдвиг при низком давлении также уместен, как описано Шрифером и др. (1990). В этом способе образцы ДНК пропускаются через небольшой французский датчик давления с набором давлений от малого до промежуточного. Рычажное устройство позволяет производить контролируемое приложение от малого до промежуточного давления к элементу. Результаты этих исследований указывают, что сдвиг при малом давлении - это полезная альтернатива звуковых и ферментных методов фрагментации ДНК. Один особенно подходящий способ для разделения ДНК на фрагменты, как считается, это тот, где используются две эндонуклеазы с распознаванием базы, CviJI, описанный Фицджералдом и др. (1992). Эти авторы описали подход для быстрой фрагментации и фракционирования ДНК на конкретные размеры, которые они считали пригодными для "дробного" клонирования и создания последовательностей. Настоящий изобретатель предусматривает, что это будет также особенно пригодно для генерирования произвольных, но относительно небольших фрагментов ДНК для использования в настоящей технологии образования связей. Ограничительная эндонуклеаза CviJI обычно расщепляет распознавательную последовательность PnGCPy между G и C с оставлением тупых концов. Нетипичные условия реакции, которые меняют специфичность этого фермента (CviJI**), дают квази-произвольное распределение фрагментов ДНК из малых молекул pUC19 (2688 базовых пар). Фицджералд и др. (1992) количественно оценили произвольность этой стратегии фрагментирования с использованием CviJI** продукта вываривания pUC19, который был фракционирован по размерам способом быстрой гелевой фильтрации и непосредственно связан, без ремонта концов, вектором клонирования lacZ minus M13. Анализ последовательности 76 клонов показал, что CviJI** ограничивает PyGCPy и PuGCPu в дополнение к местам PuGCPy и что новые данные о последовательность накапливаются со скоростью, согласующейся с произвольной фрагментацией. Как сообщается в литературе, преимущества этого подхода по сравнению с фракционированием соникацией (звуком) и агарозным гелем включают в себя: требуются меньшее количество ДНК (0,2-0,5 мкг вместо 2-5 мкг) и имеется меньше этапов (не нужно предварительного связывания, ремонта концов, химической экстракции или электрофореза агарозного геля и элюирования). Предлагается, что эти преимущества также будут полезны при приготовлении ДНК для создания последовательностей по формату 3. Независимо от того, как получаются или готовятся фрагменты нуклеиновой кислоты, важно денатурировать ДНК, чтобы получить для гибридизации одно-завитые кусочки. Это достигается выдерживанием раствора ДНК в течение 2-5 минут при 80-90oC. Затем раствор быстро охлаждают до 2oC для предотвращения повторной натурации фрагментов ДНК до того, как они контактируют с чипом. Фосфатные группы тоже нужно удалить из геномной ДНК, как описано в примере VI. Пример V
Приготовление меченых проб
Пробы олигонуклеотидов можно готовить автоматизированным синтезом, что является рутинным для специалистов, например, с использованием системы Applied Biosystems. В качестве альтернативы пробы можно приготовить, используя методы Biotechnologies Inc. с помощью слоев пористых подложек тефлона. Пробы олигонуклеотидов можно метить, например, радиоактивными метками (355, 32P, 33P и предпочтительно 33P) для рядов с участками 100-200 мкм или 100-400 мкм; нерадиоактивными изотопами (Якобсен и др., 1990); или флуорофорами (Брамбо и др. , 1988). Все такие способы нанесения меток являются обычными в технике, как показано в соответствующих разделах у Сэмбрука и др. (1989) и в другой литературе, например, у Шуберта и др. (1990), Мураками и др. (1991) и Кейта и др. (1991). В отношении радиомечения обычные способы - это мечение концов с использованием T4 полинуклеотидной киназы или нанесение меток с высокой специфической активностью с использованием Кленов или даже T7 полимеразы. Это описывается следующим образом. Синтетические олигонуклеотиды синтезируются без фосфатной группы у своих окончаниях 5' и поэтому легко метятся переносом гамма-32P или гамма-33P из (гамма-32P)ATP или (гамма-33)ATP с использованием фермент бактериофаг T4 полинуклеотид киназы. Если реакция проводится эффективно, специфическая активность таких проб может быть такой высокой, как специфическая активность самих (гамма-32P)ATP или (гамма-33P)ATP. Описанная ниже реакция предназначена метить 10 пмолей олигонуклеотида до высокой специфической активности. Нанесение меток на разные количества олигонуклеотида можно легко достичь путем увеличения или уменьшения размера реакции при поддержании постоянными концентрации всех компонентов. Реакционная смесь будет создаваться с использованием 1,0 мкл олигонуклеотида (10 пмолей/мкл); 2,0 мкл 10х бактериофаг T4 полинуклеотид киназного буфера; 5,0 мкл (гамма-32P)ATP или (гамма-33P)ATP (пр. акт. 5000 Ci/ммоль; 10 mCi/мл в водном растворе) (10 пмолей); и 11,4 мкл воды. 8 единиц (около 1 мкл) бактериофаг T4 полинуклеотидной киназы добавляется к реакционной смеси, хорошо перемешивается и выдерживается 45 минут при 37oC. Реакционная смесь нагревается в течение 10 минут при 68oC для инактивации бактериофаг T4 полинуклеотидной киназы. Затем определяется эффективность переноса 32P или 33P к олигонуклеотиду и его специфическая активность. Если специфическая активность пробы приемлема, она очищается. Если специфическая активность слишком низка, добавляются еще 8 единиц фермента и выдерживаются еще 30 минут при 37oC до нагревания реакционной смеси в течение 10 минут при 68oC для инактивации фермента. Очистка радиомеченных олигонуклеотидов может достигаться путем осаждения с этанолом; осаждением с цетилпиридиний бромидом; хроматографией через биогель P-60; или хроматографией на колонне Sep-Pak C18. Пробы с более высокими специфическими активностями можно получить, используя фрагмент Кленова E.coli ДНК полимеразы I для синтезирования пряди ДНК дополняюще к синтетическому олигонуклеотиду. Короткое инициирующее вещество гибридизирует к шаблону олигонуклеотида, чья последовательность является дополнением желаемой радиомеченной пробы. Затем инициирующее вещество расширяется с использованием фрагмента Кленова E.coli ДНК полимеразы I для включения (альфа-32P)dNTP или (гамма-33P)dNTR в направляемой шаблоном манере. После реакции шаблон и продукт разделяются денатурированием, за чем следует электрофорез через полиакриламидный гель в условиях денатурации. С этим способом при желании можно формировать пробы олигонуклеотидов, содержащие несколько радиоактивных атомов на молекулу олигонуклеотида. Чтобы использовать этот метод, нужно смешать в трубе микрофуги рассчитанные количества (альфа-32P)dNTP или (альфа-33P)dNTP, необходимые для достижения желаемой специфической активности и достаточные для получения полного синтеза всех прядей шаблона. Концентрация dNTP не должна быть меньше 1 мкМ на любом этапе в ходе реакции. Затем в трубу добавляются соответствующие количества инициирующего вещества и шаблона ДНК, причем инициирующее вещество в молярном отношении в 3-10 раз превышает шаблон. Затем добавляется 0,1 объема 10 х буфера Кленова и хорошо перемешивается. Затем добавляются 2-4 единицы фрагмента Кленова E.coli ДНК полимеразы I на 3 мкл реакционного объема, перемешивается и выдерживается 2-3 часа при 4oC. При желании течение реакции можно отслеживать путем удаления небольших (0,1 мкл) кратных и измерения доли радиоактивности, которая стала способна осаждаться, 10% трихлороуксусной кислотой (ТСА). Реакционная смесь разжижается равным объемом наполняющего гелем буфера, нагревается до 80oC в течение 3 минут и затем вся проба загружается на денатурирующий полиакриламидный гель. После электрофореза гель авторадиографируется, что позволяет найти пробу и удалить ее из геля. Имеются также следующие разные способы флуорофобного нанесения меток. Брамбо и др. (1988) описывают синтез флуоресцентно меченных инициирующих веществ. Аналог деоксиуридина с первичным аминовым "плечом образователя связи" из 12 атомов, прикрепленный у C-5, синтезируется. Синтез аналога состоит из дериватизации 2'-деоксиуридина через органометаллические промежуточные вещества с получением 5'(метил пропеноил)-2'-деоксиуридина. Реакция с диметокситритил-хлоридом дает соответствующий привод 5'-диметокситритил. Сложный эфир метила гидролизуется, активизируется и реагирует с соответствующим образом моноацилированным алкил диамином. После очистки результирующие нуклеозиды плеча образователя связи преобразуются в аналоги нуклеозида, способные для химического синтеза олигонуклеотида. Затем получаются олигонуклеотиды, которые содержат одну или две базы с плечом образователя связи с использованием модифицированной химии фосфоридитов. В раствор 50 нмолей олигонуклеотида с плечом образователя связи в 25 мкл бикарбоната натрия 500 mM (pH 9,4) добавляются 20 мкл FITC 300 mM в диметил сульфоксиде. Смесь перемешивается при комнатной температуре 6 часов. Олигонуклеотид отделяется от свободного FITC путем элюирования из колонны Sephadex G-25 1 х 30 см с 20 vV ацетата аммония (pH 6) с комбинированием фракций в первом пике УФ-поглощения. В общем случае флуоресцентное нанесение меток на олигонуклеотид у его 5'-конца в начале предполагало 2 этапа. Сначала N-защищенная производная аминоалкил фосфорамидита добавляется к 5'-концу олигонуклеотида во время автоматизированного синтеза ДНК. После удаления всех защищающих групп сложный эфир NHS соответствующего флуоресцентного красителя соединяется с 5'-амино-группой за полсуток, за чем следует очистка меченого олигонуклеотида от избытка красителя с использованием обратной фазы HPLC или PAGE. Шуберт и др. (1990) описали синтез фосфорамидита, который позволяет получать олигонуклеотиды, меченные флуоресцеином во время автоматизированного синтеза ДНК. Метил-сложный эфир флуоресцеина алкилируется 4-хлоро(4,4'-диметокситритил)бутанолом-1 в присутствии K2CO3 и KI в DMF в течение 17 часов. После удаления группы тритила 1% TFAb в хлороформе продукт фосфитилируется стандартными процедурами посредством бис (диизопропиламино)метоксифосфина. Фосфорилирование указанной полученной производной флуоресцеина приводит к достаточному выходу H-фосфоната. Получающийся амидит (раствор 0,1 М в сухом ацетонитриле) используется для автоматизированного синтеза разных инициирующих веществ с использованием бета-цианоэтил фосфорамидитной химии и синтезатора ДНК. Отщепление от основы и депротекция осуществляются с помощью 25% водного раствора аммиака в течение 36 часов при комнатной температуре. Необработанный продукт очищается посредством PAGE, и меченое инициирующее вещество видимо как бледно-зеленая флуоресцентная полоса на 310 нм. Элюирование и обессолевание с использованием патронов RP 18 дают желаемый продукт. Флуоресцентное мечение 5'-конца пробы в методе Шуберта непосредственно достигается во время синтеза ДНК в последнем цикле образования связей. Выход связей так же высок, как и с обычными фосфорамитидами. После депротекции и удаления аммиака путем лиофилизирования с использованием скоростного вакуума или осаждения этанолом меченные флуоресцентно олигонуклеотиды могут прямо применяться для образования последовательностей ДНК в формате 3 СПГ. Мураками и др. также описывали приготовление меченных флуоресцеином олигонуклеотидов. Этот синтез основан на методе поддерживаемого полимером фосфорамитида и фосфоната водорода. Этилендиамин или гексаметилендиамин используется как привязь. Они вводятся через фосфорамидатную связь, которая была образована окислением водород-фосфонатного промежуточного вещества в растворе CCl4. Модифицированные олигонуклеотиды подвергаются мечению с использованием первичного амин-ориентирующего реагента, FITC, на шариках. Получающийся модифицированный олигонуклеотид отщепляется от шариков и затем очищается RPLC. Кейт и др. (1991) описывают использование проб олигонуклеотидов, непосредственно сопряженных с алкалин фосфатазой в комбинации с прямой хемилюминесцентной подложкой (AMPPD), чтобы позволить обнаружение проб. Фосфатазу алкалина можно ковалентно соединить с модифицированной базой олигонуклеотида. После гибридизации олиго выдерживается в термостате с AMPDD. Фермент алкалин фосфатазы разбивает AMPDD с получением соединения, которое дает флуоресценцию без возбуждения, т.е. лазер не нужен. Считается, что сильный сигнал может формироваться с использованием такой технологии. Меченые пробы можно свободно приобрести в разных промышленных источниках, включая GENsET, а не синтезировать. Пример VI
Удаление фосфатных групп
Как алкалин фосфатаза бактерий (BAP), так и кишечная алкалин фосфатаза телят (CIP) катализируют удаление радикалов 5'-фосфата из ДНК и РНК. Поэтому они уместны для удаления 5'-фосфатов из ДНК или/и РНК для предотвращения образования связей и неправильной гибридизации. Удаление фосфатов, как оно описано Сэмбруком и др. (1989), осуществляется после разрезки или иного сдвига геномной ДНК. BAP более активен из 2-х алкалин фосфатаз, но он также намного более стоек к нагреву и чистящим веществам. Поэтому трудно замедлить BAP полностью у конца реакций дефосфорилирования. Протеиназа K применяется для вываривания CIP, который должен быть полностью удален, если последующие связи должны эффективно работать. Альтернативный метод это инактивация CIP нагреванием до 65oC в течение 1 часа (или 75oC в течение 10 минут) в присутствии 5 mM EDTA (pH 8,0) с последующей очисткой дефосфорилированной ДНК экстрагированием с фенол: хлороформом. Пример VII
Проведение образования последовательности путем двухэтапной гибридизации
Ниже следуют некоторые примеры для описания выполнения методологии образования последовательностей, рассматриваемой изобретателем. Сначала весь чип гибридизируется смесью ДНК сложностью 100 миллионов бп (1 хромосома человека). Руководство по проведению гибридизации можно найти в статьях, таких как Дрманач и др. (1990); Храпко и др. (1991) и Бруд и др. (1994). В этих статьях указаны диапазоны температур гибридизации, буферы и этапы промывки, которые пригодны для использования на начальном этапе формата 3 СПГ. Данный изобретатель в особенности рассматривает проведение гибридизации в течение до нескольких часов при высоких концентрациях соли и при низкой температуре (от -2 до 5oC) из-за относительно малой концентрации получаемой целевой ДНК. Для этой цели применяется буфер SSC вместо буфера фосфата натрия (Дрманач и др. , 1990), который осаждается при 10oC. Промывка не обязательно должна быть экстенсивной (несколько минут) из-за второго этапа и может быть полностью исключена, если проведение циклов гибридизации используется для создания последовательности в высшей степени сложных образцов ДНК. Этот же буфер используется для этапов гибридизации и промывки, чтобы можно было продолжать второй этап гибридизации с мечеными пробами. После должной промывки с использованием простого робототехнического устройства на каждом ряде, например, ряде 8 х 8 мм (пример III), добавляется одна меченая проба, например, 6-мер. Используется 96-кончиковое или 96-штырьковое устройство, выполняя это за 42 операции. Снова используется диапазон избирательных условий, как ранее описывалось в научной литературе. Данный изобретатель в особенности рассматривает использование следующих условий. Сначала, после добавления меченых проб и выдержки только в течение нескольких минут (из-за высокой концентрации добавленных олигонуклеотидов) при низкой температуре (0-5oC) температура повышается до 3-10oC в зависимости от длины F+P и добавляется промывающий буфер. В это время используемый промывающий буфер совместим с любой реакцией образования связей (например, в диапазоне концентрации соли 100 mM). После добавления лигазы температура снова повышается до 15-37oC, чтобы позволить быстрому образованию связей (менее 30 мин) и дальнейшему избиранию гибридов с полным совпадением и несовпадениями. Использование катионных чистящих (моющих) веществ также рассматривается для использования в формате 3 СПГ, как описано Понтиусом и Бергом (1991). Эти авторы описывают использование двух простых катионных чистящих веществ, дедецил- и цетилтриметиламмоний бромида (DTAB и CTAB) в повторной натурации ДНК. DTAB и CTAB - это варианты четвертичного аминтетраметиламмоний бромида (TMAB), в котором одна из групп метила замещена либо 12-углеродной (DTAB), либо 16-углеродной (CTAB) алкильной группой. TMAB - это соль бромида иона тетраметиламмония, реагент, применяемый в экспериментах по повторному натурированию нуклеиновых кислот для уменьшения сдвига содержания G-C температуры расплавления. DTAB и CTAB аналогичны по структуре натрий додецил сульфату (SDS) с замещением отрицательно заряженного сульфата SDS положительно заряженным четвертичным амином. Хотя SDS обычно применяется в буферах гибридизации для уменьшения неспецифического образования связей и для замедления нуклеаз, он не сильно влияет на скорость повторного натурирования. При проведении процесса образования связей можно добавить фермент в меченые пробы или после этапа должной промывки для снижения фона. Хотя ее ранее не предлагали для использования с каким-либо методом СПГ, технология лигазы хорошо установлена в области молекулярной биологии. Например, Худ и коллеги описали метод обнаружения гена посредством лигазы (Ландегрен и др., 1988), методологию которого можно легко приспособить для использования в формате 3 СПГ. Ландегрен описывает анализ присутствия данных последовательностей ДНК на основе способности 2-х олигонуклеотидов отжигаться непосредственно рядом друг с другом на дополняющей целевой молекуле ДНК. Затем два олигонуклеотида соединяются ковалентно под действием ДНК лигазы при условии, что нуклеотиды у места соединения правильно спарены базами. Хотя это ранее не рассматривалось, эта ситуация теперь возникает в образовании последовательности в формате 3. Ву и Уоллас также описывают использование бактериофаг T4 ДНК лигазы для соединения двух соседних коротких синтетических олигонуклеотидов. Их реакции образования связи олиго проводились в 50 mM Tris HCl pH 7,6, 10 mM MgCl2, 1 mM ATP, 1 mM DTT и 5% PEG. Реакции образования связи проводились при нагревании до 100oC в течение 5-10 мин, за чем следовало охлаждение до 0oC до добавления T4 ДНК лигазы (1 единица; Bethesda Research Laboratory). Большинство реакций образования связей проводилось при 30oC и заканчивалось нагреванием до 100oC в течение 5 мин. Затем проводится конечная промывка, пригодная для избирательного обнаружения гибридизированных соседних, или образовавших связь, олигонуклеотидов с длиной (F+P). Этот этап промывки проводится в воде в течение нескольких минут при 40-60oC для вымывания всех необразовавших связи меченых проб и всех других соединений, чтобы максимально уменьшить фон. Благодаря ковалентно связанным меченым олигонуклеотидам обнаружение упрощается (с ним не связаны ограничения по времени и низкой температуре). В зависимости от используемой метки получение изображений чипов производится на разных аппаратах. Для радиоактивных меток можно использовать технологию хранения фосфора с экраном и PhosphorImager в качестве сканера (фирма Molecular Dynamics, Саннивейл, Калифорния). Чипы помещаются в кассету и накрываются фосфористым экраном. После 1-4 часов воздействия экран сканируется и файл изображения хранится на твердом диске компьютера. Для обнаружения флуоресцентных меток используются камеры с ПЗС и эпифлуоресцентная или конфокальная микроскопия. Для чипов, сформированных прямо на элементах изображения камеры с ПЗС, обнаружение может проводиться, как описано Эггерсом и др. (1994). Детекторы с приборами с зарядовой связью (ПЗС) служат в качестве активных твердых основ, которые количественно обнаруживают и формируют изображение распределения меченых целевых молекул в анализах на основе проб. В этих устройствах используются присущие микроэлектронике характеристики, которые сочетают в высшей степени параллельные анализы, сверхчувствительное обнаружение, высокую производительность (пропускную способность), интегральный сбор данных и вычисление. Эггерс и др. (1994) описывают применение ПЗС для основанных на пробах анализов, таких, как формат 3 СПГ настоящего изобретения, которые позволяют количественную оценку с точностью до секунд благодаря высокой чувствительности и применяемой прямой связи. Подход интегрального обнаружения с ПЗС позволяет проводить обнаружение событий образования молекулярных связей на чипах. Детектор быстро формирует двумерную картину, которая уникально характеризует образец. В конкретной работе молекулярного детектора на базе ПЗС отдельные биологические пробы связываются (нейтрализуются) непосредственно на элементах изображения ПЗС и могут прикрепляться к одноразовой полоске-крышке, помещенной на поверхность ПЗС. Молекулы образца можно метить радиоизотопом, хемилюминесцентными или флуоресцентными ярлыками. После воздействия на образец ряда проб на основе ПЗС фотоны или продукты затухания радиоизотопа испускаются у местоположений элементов изображения, где образец образовал связи, в случае формата 3, с двумя дополняющими пробами. В свою очередь пары электрон-дырка генерируются в кремнии, когда заряженные частицы или излучение от меченых образцов
падают на управляющие электроды ПЗС. Затем электроны собираются под соседними управляющими электродами ПЗС и последовательно считываются на модуле дисплея. Количество фотоэлектронов, генерируемое у каждого элемента изображения, прямо пропорционально количеству молекулярных событий образования связей в такой ближайшей области. Следовательно, образование молекулярных связей можно определять количественно (Эггерс и др., 1994). Как недавно сообщалось, ПЗС на базе кремния имеют преимущества как полупроводниковые датчики обнаружения и формирования изображений прежде всего благодаря высокой чувствительности устройств в широком диапазоне длин волн (от 1 до 10000 ангстрем). Кремний очень чувствителен к электромагнитному излучению от видимого спектра до мягких рентгеновских лучей. Для видимого света один фотон, падающий на управляющий электрод ПЗС, приводит к появлению одного заряженного электроном пакета под электродом. Одна бета-частица мягкого рентгеновского излучения (обычно в диапазоне КэВ до МэВ) генерирует от тысяч до десятков тысяч электронов. Вдобавок к высокой чувствительности ПЗС, описанные Эггерсом и др. (1994), предоставляют широкий динамический диапазон (4-5 порядков величины), поскольку обнаружаемый пакет заряда может включать от нескольких до 105 электронов. Характеристика обнаружения является линейной в широком динамическом диапазоне. Путем размещения создающего изображения ряда вблизи от образца эффективность сбора улучшается, как минимум, в 10 раз по сравнению с методами на основе линзы, такими, какие применяются в обычных камерах на ПЗС. То есть образец (эмиттер) находится в близком контакте с детектором (матрицей формирования изображения) и это исключает обычную оптику формирования изображений, такую, как линзы и зеркала. Когда радиоизотопы прикреплены как сообщающие группы к целевым молекулам, энергетические частицы обнаруживаются. Несколько сообщающих групп, которые излучают частицы с разной энергией, успешно использовались с микроизготовленными детекторами, такие как 32P, 33P, 35S, 14C, 125L. Частицы с более высокой энергией, такие как от 32P, обеспечивают самую высокую чувствительность молекулярного обнаружения, тогда как частицы с более низкой энергией, такие, как от 35S, обеспечивают лучшее разрешение. Поэтому выбор сообщающего радиоизотопа может быть сделан по желанию. Когда конкретная радиоизотопная метка выбрана, характеристики обнаружения можно предсказать путем расчета отношения сигнал-шум, как описано Эггерсом и др. (1994). Альтернативная процедура люминесцентного обнаружения предполагает использование флуоресцентных или хемилюминесцентных сообщающих групп, прикрепленных к целевым молекулам. Флуоресцентные метки можно прикреплять ковалентно или через взаимодействие. Флуоресцентные красители, такие, как бромид этидия с сильными полосами поглощения в диапазоне ближнего УФ (300-350 нм) и основными полосами излучения в видимом диапазоне (500-650 нм) наиболее пригодны для используемых устройств с ПЗС, поскольку квантовая эффективность на несколько порядков величины ниже на длине волны возбуждения, чем на длине волны флуоресцентного сигнала. С точки зрения обнаружения люминесценции многокремниевые управляющие электроды (схемы) ПЗС имеют "встроенную" способность отфильтровывать вклад падающего света в УФ-диапазоне, но они очень чувствительны к видимой люминесценции, генерируемой флуоресцентными сообщающими группами. Такая присущая большая избирательность относительно УФ-возбуждения позволяет достигать высоких отношений сигнал-шум (более 100) с помощью ПЗС, как указывалось в статье Эггерса и др. (1994). Для связывания проб на детекторе можно получить матрицы гибридизации на недорогих подложках из SiO2, которые затем помещают на поверхность ПЗС после гибридизации и сушки. Этот формат экономически эффективен, т.к. гибридизация ДНК проводится на недорогих одноразовых подложках из SiO2, что позволяет повторно использовать более дорогой детектор на ПЗС. В качестве альтернативы пробы можно связывать прямо на ПЗС с созданием специализированной матрицы проб. Чтобы связать пробы на покрытии SiO2, однородный эпоксидный слой связывается с поверхностью пленки с использованием эпоксидно-силанового реагента и стандартной химии модификации SiO2. Затем амин-модифицированные пробы олигонуклеотидов связываются с поверхностью SiO2 посредством вторичного образования аминов с эпоксидным кольцом. Получающаяся связь создает 17 способных вращаться связей разделения между 3' базой олигонуклеотида и поверхностью SiO2. Чтобы обеспечить полную депротонацию аминов и минимизировать образование вторичной структуры во время создания связи, реакцию проводят в 0,1 М KOH и выдерживают при 37oC 6 часов. В формате 3 СПГ вообще сигналы считаются на каждую из миллиарда точек. Будет необходимо гибридизировать все ряды, например, 4000 5 х 5 мм за 1 раз и возможно последующее использование меньшего числа рядов. Гибридизации с проведением циклов - это один возможный способ увеличения сигналов гибридизации. За 1 цикл большинство фиксированных проб гибридизируют с фрагментами ДНК с хвостовыми последовательностями, некомплементарными для меченых проб. При увеличении температуры эти гибриды будут расплавляться (фиг. 3). За следующий цикл некоторые из них (около 0,1%) гибридизируются с соответствующим фрагментом ДНК и дополнительные меченые пробы образуют связи. В этом случае происходит избирательное плавление гибридов ДНК с несовпадениями одновременно для обоих наборов проб. В гибридизации с проведением циклов все компоненты добавляются до начала циклов при 37oC для T4 или при более высокой температуре для термостабильной лигазы. Затем температура снижается до 15-37oC и чип выдерживается до 10 минут, а потом температура повышается до 37oC или выше в течение нескольких минут, и потом снова уменьшается. Циклы можно повторить до 10 раз. В одном варианте оптимальную более высокую температуру (10-50oC) можно использовать без циклов и можно провести более длинную реакцию образования связей (1-3 часа). Описанная здесь процедура позволяет изготовлять сложные чипы с использованием стандартного синтеза и точного определения мест олигонуклетидов, потому что нужно относительно небольшое количество олигонуклеотидов. Например, если все 7-мерные олиго синтезированы (16384 пробы), можно определить списки 256 миллиона 14-меров. Один важный вариант изобретенного способа заключается в применении более чем 1 по-разному меченую пробу на базовый ряд. Это можно выполнить, имея в виду 2 цели; мультиплексирование для снижения числа отдельно гибридизированных рядов; или определение списка еще более длинных олиго-последовательностей, таких, как 3 х 6 или 3 х 7. В этом случае, если используются 2 метки, специфичность 3 последовательных олигонуклеидов может быть почти абсолютной, потому что положительные места должны иметь достаточное количество сигналов обоих меток. Еще один дополнительный вариант - использовать чипы, содержащие пробы BxNy, где y составляет от 1 до 4. Эти чипы позволяют считывать последовательности в разных кадрах. Этого можно также достигнуть путем использования соответствующих наборов меченых проб или обе пробы F и P могут иметь некоторые неспецифицированные концевые позиции (т.е. некоторый элемент с оконечным вырождением). Можно также использовать универсальные базы как часть образователя связи для соединения проб с определенной последовательностью с твердой основой. Это делает пробу более готовой к гибридизации и делает строение более стабильным. Если проба имеет 5 баз, можно, например, использовать 3 универсальные базы как образователь связи (фиг. 4). Пример VIII
Анализ полученных данных
Файлы с изображениями анализируются программой анализа изображений, такой, как программа DOTS (Дрманач и др., 1993), и шкалируются и оцениваются включенными статистическими функциями, например, в программу SCORES (Дрманач и др. , 1994). Из распределения сигналов определяется оптимальный порог для преобразования сигнала в +/- выход. Из положения обнаруженной метки определяется F+P последовательности нуклеотидов из фрагментов путем комбинирования известных последовательностей связанных и меченых проб, соответствующих меченым позициям. Полная последовательность нуклеиновой кислоты или подфрагменты последовательности первоначальной молекулы, такой, как хромосома человека, затем собираются из перекрывающихся последовательностей F+P, определенных вычислительным вычитанием. Один вариант состоит в преобразовании сигналов гибридизации, например меток, в +/- выход во время процесса сборки последовательности. В этом случае сборка начинается с последовательности F+P с очень большим счетом, например, с F+P последовательности AAAAAATTTTTT (посл. ид. N.1). Счета всех 4-х возможных перекрывающихся проб AAAAATTTTTTA (посл. ид. N.3), AAAAATTTTTTT (посл. ид. N.4), AAAAATTTTTTC (посл. ид. N.5) и AAAAATTTTTTG (посл. ид. N.6) и 3 дополнительные пробы, которые отличны в начале (TAAAAATTTTTT, посл. ид. N. 7; CAAAAATTTTTT, посл. ид. N.8; GAAAAATTTTTT, посл. ид. N.9) сравниваются и определяются 3 результата: (1) только начальная проба и только 1 из 4-х перекрывающихся проб имеют счета, которые значительного положительны по отношению к другим 6 пробам, в этом случае последовательность AAAAAAATTTTTT (посл. ид. N.1) будет продлена на 1 нуклеотид вправо; (2) ни одна проба, за исключением начальный пробы, имеет значительно положительный счет, сборка остановится, например, последовательность AAAAAATTTTT (посл. ид. N.10) находится на конце молекулы ДНК, последовательность которой создается; (3) обнаружена более чем 1 значительно положительная проба среди перекрывшихся или/и других 3-х проб; сборка останавливается из-за ошибки или разветвления (Дрманач и др., 1989). Процессы вычислительного вычитания используют компьютерные программы с применением существующих алгоритмов (см., например, Певзнер, 1989; Дрманач и др., 1991; Лабат и Дрманач, 1993). Если вдобавок к F+P F(пространство 1)P, F(пространство 2)P, F(пространство 3)P или F(пространство 4)F определяются, алгоритмы будут использоваться, чтобы совместить все наборы данных для корректировки потенциальных ошибок или для разрешения ситуации, когда имеется проблема разветвления (см., например, Дрманач и др., 1989; Бейнс и др., 1988). Пример IX
Повторное использование чипов создания последовательности
Если образование связей используется в процессе создания последовательности, то обычный чип олигонуклеотидов нельзя сразу же повторно использовать. Изобретатель рассматривает, что это можно решить разными способами. Можно использовать рибонуклеотиды для второй пробы, пробы P, так что эту пробу можно затем удалить обработкой PHКазой. В обработке PHКазой может использоваться PHКаза A, эндорибонуклеаза, которая специфически разъедает одно-свитую РНК 3' до радикалов пиримидина и расщепляет связь фосфата до соседнего нуклеотида. Конечными продуктами являются пиримидин 3' фосфаты и олигонуклеотиды с оконечными пиримидин 3' фосфатами. PHКаза A работает в отсутствии адъюнктов и двухвалентных катионов. Чтобы использовать PHКазу, обычно выдерживают чип в любом пригодном содержащем PHКазу буфере, как описано Сэмбруком и др. (1989). Уместно использовать 30-50 мкл содержащего PHКазу буфера на 8 х 8 мм или 9 х 9 мм матрицы при 37oC от 10 до 60 минут. Затем промывают буфером гибридизации. Хотя это не применяется широко, можно также использовать базу урацила, как описали Крейг и др. (1989), в конкретных примерах осуществления. Разрушение комбинаций связанной пробы для получения повторно используемого чипа можно достичь вывариванием ремонтным ферментом E.coli, ураци-ДНК гликосилазой, которая удаляет урацил из ДНК. Можно также сформировать специфично расщепляемую связь между пробами и затем расщепить связь после обнаружения. Например, этого можно достичь химическим образованием связи, как описано Шабаровой и др. (1991) и Долинной и др. (1988). Шабарова и др. (1991) описывают конденсацию олигодеоксирибо нуклеотидов цианоген бромидом как конденсирующим веществом. В их одноэтапной химической реакции образования связи олигонуклеотиды нагреваются до 97oC, медленно охлаждаются до 0oC, затем добавляется 1 мкл 10 М BrCN в ацетонитриле. Долинная и др. (1988) показывают как включать межнуклеотидные связи фосфорамидата и пирофосфата в дуплексы ДНК. Они также используют метод образования химической связи для модификации сахаро-фосфатного основания ДНК с растворимым в воде карбодиимидом (CDI) как связующим веществом. Селективное расщепление фосфоамидных связей предполагает контакт с 15% CH3COOH в течение 5 мин при 95oC. Селективное расщепление связи пирофосфата предполагает контакт со смесью пиридин-вода (9: 1) и с только что дистиллированным (CF3CO)2O. Хотя соединения и способы согласно этому изобретению были описаны в терминах предпочтительных примеров его осуществления, для специалистов будет очевидно, что можно изменить соединение, способы и этапы или последовательность этапов описанного здесь способа, не отходя от замысла, духа и объема изобретения. Более конкретно очевидно, что некоторые вещества, которые связаны химически и физиологически, могут заменяться описанными здесь веществами, и будут получены те же самые или похожие результаты. Все такие аналогичные заменители и модификации, очевидные для специалистов, считаются находящимися в духе, рамках и замысле изобретения, определяемого прилагаемой формулой изобретения. Все заявленное, вещества и способы, могут получаться и выполняться без ненужного экспериментирования.
Формула изобретения
РИСУНКИ
Рисунок 1, Рисунок 2, Рисунок 3, Рисунок 4, Рисунок 5, Рисунок 6, Рисунок 7, Рисунок 8, Рисунок 9, Рисунок 10, Рисунок 11