Прежде чем перейти к статье, хочу вам представить, экономическую онлайн игру Brave Knights, в которой вы можете играть и зарабатывать. Регистируйтесь, играйте и зарабатывайте!
Примерно в каждой второй теме на Хабре, касающейся космонавтики или электроники, всплывает тема радиационной стойкости. Через новости об отечественной космонавтике красной нитью проходит тематика импортозамещения радстойкой элементной базы, но в то же самое время Элон Маск использует дешевые обычные чипы и гордится этим. А изральтяне в «Берешите» использовали радстойкий процессор и тоже гордятся этим. Да и в принципе микроэлектронная отрасль в России живет по большей части за счет госзаказа с соответствующими требованиями. Наблюдение за регулярными спорами насчет того, как надо правильно строить спутники, показывает, что подготовка участников обычно невысока, а их аргументация отягощена стереотипами, случайно услышанными вырванными из контекста фактами и знаниями, устаревшими много лет назад. Я подумал, что читать это больше нет сил, поэтому, дорогие аналитики, устраивайтесь поудобнее на своих диванах, и я начну небольшой (на самом деле большой) рассказ о самых популярных заблуждениях на тему того, что такое радиационная стойкость интегральных микросхем.
Рисунок 1. Непременная красивая картинка про космическое излучение и хрупкую Землю.
Самые популярные тезисы относительно радиационной стойкости, используемые в околокосмических спорах, выглядят примерно так:
Как видите, некоторые из этих тезисов прямо противоречат друг другу — что регулярно и служит предметом спора или причиной для далеко идущих неверных выводов.
Начать разговор нужно с важного дисклеймера: радиационная стойкость не является центром мира и единственным качеством, которым должна обладать подходящая для использования в космосе или другой агрессивной среде микросхема. Радиационная стойкость — это лишь одно требование из длинного ряда, включающего в себя надежность, расширенный температурный диапазон, устойчивость к электростатическому разряду, вибростойкость — и достоверное подтверждение всех вышеперечисленных параметров, то есть длительную и дорогую сертификацию. Важно все, что может не позволить чипу проработать весь необходимый срок службы, причем большинство применений радстойких чипов предполагают невозможность ремонта или замены. С другой стороны, если по одному из параметров что-то не так, конструктор конечного изделия часто может найти способ обойти ограничение — поставить самую чувствительную к дозе радиации микросхему за толстую стенку, мониторить ток потребления уязвимого к тиристорному эффекту чипа и сбрасывать его питание при необходимости, или термостатировать чип с узким температурным диапазоном. А может не найти, и единственным способом решить поставленную задачу будет заказ новой радстойкой ASIC.
Также полезно помнить, что разработчики систем специального назначения — такие же люди, как и любые другие разработчики. Многие из них тоже любят писать ко вчерашнему дедлайну наполненный костылями код и использовать железо помощнее, чтобы он точно на нем заработал; некоторые и Ардуино бы использовали, если б оно было соответствующим образом сертифицировано. И, разумеется, люди, которые ставят задачи разработчикам систем специального назначения и разработчикам микросхем для них, редко стесняются в требованиях, и к надёжности, и к производительности, и к радстойкости. Поэтому современные проектные нормы на спутниках еще как нужны — хочется и большие объемы DRAM, и многоядерные процессоры, и самые современные ПЛИС. Я уже упомянул выше о том, что последствия плохой радиационной стойкости и других потенциальных проблем можно по крайней мере частично обойти, поэтому от применения всего этого великолепия разработчиков в большей степени удерживаетничего отсутствие данных о том, что именно надо обходить, чем коммерческий статус чипов.
Понятия «радиационная стойкость» и «радиационностойкая микросхема» — это грандиозные упрощения. На самом деле существует много разных источников ионизирующего излучения, и они могут влиять на функционирование электронных приборов по-разному. Соответственно, для разных применений необходима стойкость к разным наборам воздействующих факторов и разным уровням воздействия, так что «стойкая» микросхема, предназначенная для работы на низкой околоземной орбите совершенно не обязана нормально работать при разборе завалов в Чернобыле.
Ионизирующее излучение называется так, потому что выделение в объеме вещества энергии при торможении прилетающих частиц ионизирует вещество. У каждого материала своя энергия, необходимая для ионизации и создания электронно-дырочной пары. Для кремния это 17 эВ, для его оксида — 3.6 эВ, для арсенида галлия — 4.8 эВ. Также энерговыделение может “сдвинуть” атом с правильного места в кристаллической решетке (в кремнии для этого нужно передать атому 21 эВ). Созданные в веществе электронно-дырочные пары могут по-разному влиять на электрические и физические свойства и на поведение электрической схемы. Радиационные эффекты можно разделить на четыре большие группы: эффекты полной поглощенной дозы, эффекты мощности дозы, эффекты, вызванные попаданием одиночных частиц, и эффекты смещения. Это разделение — до некоторой степени условность: например, облучение потоком тяжелых ионов, вызывающих одиночные эффекты, приводит и к набору полной поглощенной дозы.
Дозовые эффекты
Полная поглощенная доза излучения измеряется в радах, с указанием вещества, поглощающего излучение. 1 рад = 0.01 Дж/кг, то есть количество энергии, выделившееся в единице массы вещества. Реже используется единица измерения Грэй, равная 100 рад (или 1 Дж/кг). При этом важно понимать, что поглощенная доза в разных веществах будет различаться для одного и того же количества ионизирующих частиц, выпущенных источником радиации (это экспозиционная доза). В случае с кремниевыми микросхемами нужный материал — это оксид кремния, потому что воздействие на него, а не на кремний, в основном влияет на электрические характеристики схемы, так как подвижность дырок в SiO2 при нормальной температуре настолько мала, что они накапливаются в оксиде, создавая встроенный положительный заряд. Типичные уровни дозовой стойкости коммерческих микросхем лежат в диапазоне 5-100 крад(Si), востребованные покупателями уровни радиационной стойкости начинаются на 30 крад(Si) и заканчиваются где-то в районе 1 Град(Si), в зависимости от назначения микросхем. Смертельная доза для человека — около 6 Грэй.
Рисунок 2. Примеры расчетов набора полной поглощенной дозы за 10 лет на различных круговых орбитах за защитой в 1г/см^2. Источник — Н.В. Кузнецов, «Радиационная опасность на околоземных орбитах и межпланетных траекториях космических аппаратов».
Эффекты воздействия полной дозы связаны с накоплением этого положительного заряда в диэлектриках и проявляются в КМОП-схемах несколькими основными путями:
В биполярных схемах основной дозовый эффект — падение коэффициента усиления, вызванное ростом базового тока из-за утечки из эмиттера в базу по границе кремния и пассивирующего оксида. Другой специфический для биполярных транзисторов дозовый эффект состоит в том, что они могут (не обязательно) реагировать не только на уровень набранной дозы, но и на скорость ее набора — чем медленнее набирается доза, тем хуже стойкость. Этот эффект называется ELDRS (Enhanced Low Dose Rate Sensitivity) и он сильно усложняет и удорожает тестирование, причем часто не только биполярных, но и КМОП-схем — потому что в них тоже иногда бывают биполярные транзисторы и потому что проще заставить всех тестироваться единообразно, чем разбираться, где ELDRS может быть, а где нет.
Мощность дозы
Другая часть эффектов, связанных с мощностью дозы — это сверхбыстрый набор дозы, при котором в микросхеме генерируется настолько большое количество электронно-дырочных пар, что они не успевают рекомбинировать, и в чип вносится огромный электрический заряд, который рассасывается через линии земли и питания в течение значительного времени — на которое схема перестает работать. Это время называется «время потери работоспособности» и является основной характеристикой стойкости микросхемы или прибора к подобного рода эффектам. Кроме этого, большое количество внесенного в микросхему заряда серьезно изменяет потенциалы областей, соединенных с землей и с питанием — что может привести к возникновению тиристорного эффекта.
Именно эффекты высокой мощности дозы — то, ради стойкости к чему изначально развивалась технология «кремний на сапфире» и «кремний на изоляторе», потому что единственный способ уменьшить вносимый в схему заряд состоит в том, чтобы отделить активную область микросхемы от объема подложки, не дав заряду из подложки поучаствовать в процессе. Почему эти эффекты важны? Большая мощность дозы в течение небольшого времени — типичное следствие ядерного взрыва.
Одиночные эффекты
Одиночные эффекты связаны не с длительным воздействием излучения, а с измеримым эффектом от попадания единственной ионизирующей частицы. Их можно разделить на две большие группы:
Удельная энергоотдача ионизирующей частицы называется «линейная передача энергии» (ЛПЭ) и измеряется в МэВ, передаваемых за единицу длины пролета частицы в материале, на единицу плотности материала, то есть в (МэВ*см^3)/(мг*см) или в (МэВ*см^2)/мг. ЛПЭ нелинейно и немонотонно зависит от энергии частицы и взаимосвязана с длиной пробега, которая для актуальных в микроэлектронике частиц и материалов может составлять от сотен нанометров до сотен миллиметров.
Количество частиц, встречающихся в космосе, убывает с ростом ЛПЭ (см. рисунок 4). Важные значения — 30 (соответствует ионам железа) и 60 или 80 (после которых вероятность события считается пренебрежимо малой). Кроме этого, важной является цифра в 15 МэВ*см^2/(мг) — это максимальная ЛПЭ, которую могут иметь продукты ядерной реакции при попадании протона или нейтрона в кремний. Протоны — один из основных видов солнечного излучения, и хотя их собственная ЛПЭ невелика (десятые доли единицы), они оказывают существенное влияние из-за ядерных реакций и вторичной ионизации. Вторичная ионизация может возникать прямо в активной области, а может быть следствием попадания протона в атом какого-то материала с большим атомным номером — например, вольфрама или тантала. Тяжелые элементы активно используются в современной микроэлектронной технологии, например, для создания контактов от кремния к первому слою металлизации. Вторичная ионизация также является причиной, по которой не стоит для повышения радиационной стойкости паковать чипы в свинцовые коробки.
Рисунок 3. Зависимость ЛПЭ от энергии для разных типов частиц.
Отдельно стоит обратить внимание на ядра гелия (альфа-частицы) — не только потому, что их достаточно много в составе солнечной радиации, но и потому, что довольно много источников альфа-излучения можно встретить в обычной жизни.
Рисунок 4. Сравнение количества частиц разных типов за двухлетнюю миссию на орбите, по статье Xapsos et.al., «Model for Cumulative Solar Heavy Ion Energy and Linear Energy Transfer Spectra», IEEE TNS, Vol. 5, No. 6., 2007
1, 30 или 60 МэВ*см^2/(мг) — насколько это много? Порог сбоя стандартной ячейки памяти в технологии 7 нм находится намного ниже единицы, в 180 нм — в пределах от единицы до десятки. Применение специальной схемотехники позволяет поднять порог, например, до сотни, но обычно разумнее добиться цифры в 15 или 30 единиц, а остатки редких событий отфильтровать с помощью помехоустойчивого кодирования. 60 единиц — это цифра, обычно фигурирующая в требованиях по стойкости к разрушающим эффектам.
Эффекты смещения
Эффекты смещения — это локальное разрушение кристаллической решетки, то есть «выбивание» атома из предназначенного для него места. Энергия, необходимая для повреждения кристаллической решетки, обычно довольно велика, поэтому большинство пролетающих частиц не вызывают этот эффект. Зато его причиной может быть ядерная реакция в результате попадания протона или нейтрона, которых на орбите много. Такие локальные дефекты решетки приводят к уменьшению подвижности носителей заряда, росту шумов и некоторым другим эффектам. Они сказываются на обычных КМОП-микросхемах меньше, чем «обычные» дозовые эффекты, но доминируют в солнечных батареях, фотоприемниках, силовых транзисторах, а также в сложных полупроводниках, у которых нет оксида, например в арсениде галлия и нитриде галлия. Именно этим и объясняется их высокая дозовая стойкость — в них просто нет эффектов, вызывающих быструю деградацию кремниевых чипов, а то, что есть, проявляется слабее и позже. Количество излучения, вызывающего эффекты смещения измеряется в частицах (обычно протонах или нейтронах) на квадратный сантиметр площади чипа.
Итак, с описанием воздействующих факторов излучения разобрались, теперь давайте посмотрим, где и в каких сочетаниях они угрожают микросхемам.
На рисунке 2 показан пример расчета набора полной дозы на разных орбитах. Дальше надо обсудить множество допущений — солнечную активность, форму, материал и толщину защиты и так далее, но в целом, несмотря на то, что рисунок представляет собой типичного сферического коня в вакууме, тренд ясен: на разных орбитах скорость набора полной дозы может различаться на пять порядков. При этом на низких орбитах, под первым поясом Ван Аллена, доза набирается так медленно, что многие обычные коммерческие микросхемы способны выдержать несколько лет в таких условиях. Да что микросхемы, даже гораздо более хрупкие люди летают там годами без серьезных последствий для здоровья. А между тем, низкие орбиты — это практически вся пилотируемая космонавтика, дистанционное зондирование земли, спутниковая связь, обещаемый уже совсем скоро спутниковый интернет и, как говорят американцы, the last but not least, практически все кубсаты запускаются на низкие орбиты.
Коммерческие микросхемы на низких орбитах
Собственно, именно из популярности и важности низких орбит и растут ноги у спекуляций на тему того, что дорогие радстойкие микросхемы не нужны, и вполне можно обходиться обычными. Но у использования в космосе коммерческих микросхем есть и подводные камни, проявляющиеся даже на низких орбитах.
Во-первых, пояса ван Аллена защищают Землю и ее ближние окрестности только от легких частиц, в основном от солнечных электронов и протонов. Более тяжелые частицы, хоть и встречаются намного реже, спокойно долетают даже до нашего последнего щита — атмосферы — и, правильно, вызывают одиночные эффекты, в том числе тиристорный эффект, способный в любой момент необратимо разрушить какую-нибудь микросхему и с ней весь космический аппарат. Поэтому применять коммерческие микросхемы можно только в случае, если приняты меры по их защите от одиночных эффектов.
Вторая проблема состоит в том, что микросхемы на спутнике — это не только процессоры и память, но и множество других видов чипов, в том числе силовых и аналоговых, и с их радиационной стойкостью все гораздо сложнее и намного менее предсказуемо. Да и современные системы на кристалле содержат большое количество нецифровых блоков; например, у большинства чипов флэш-памяти первым перестает работать используемый для записи генератор высокого напряжения, а у аналоговых КМОП-схем сдвигается опорное напряжение, генерируемое при помощи пары биполярных транзисторов, и даже небольшие утечки могут серьезно изменить рабочую точку малопотребляющих аналоговых каскадов. Стойкость силовых ключей к разрушающим одиночным эффектам может сильно зависеть от приложенного к ним напряжения, и так далее и тому подобное.
Третья важная проблема использования коммерческих микросхем в космосе состоит в том, что стойкость к полной дозе и тиристорному эффекту чувствительна к изменению параметров техпроцесса, в том числе небольшим, так что если на фабрике что-то поменяли, вы можете выкинуть результаты своих испытаний в мусорную корзину. А для коммерческих микросхем производитель гарантирует стабильность функциональных параметров, а не технологического процесса. Более того, в разных партиях вам могут встретиться кристаллы с разных фабрик; например, процессор из шестого айфона, Apple A9, производился на 16 нм TSMC и 14 нм Samsung, и пользователю не сообщалось, какая версия стоит в его телефоне. Для борьбы с этой проблемой во всем мире для разработки радстойких микросхем используются институты Trusted Foundry или сертифицированных техпроцессов — словом, какой-то формы гарантии неизменности техпроцесса со стороны фабрики.
Итого правильный ответ на вопрос «можно ли применять в космосе обычные коммерческие микросхемы?» звучит так: «Да, можно, на некоторых орбитах и при соблюдении ряда требований и условий». Полезный совет: если вы все же решили использовать коммерческий чип и вложиться в его испытания, купите запас сразу лет на десять вперед. Это, кстати, вполне себе бизнес-модель большой и уважаемой компании 3DPlus — они испытывают на радстойкость все коммерческие микросхемы подряд, находят те, которые имеют (по сути случайно) достаточные показатели, закупают большие партии и дальше пакуют чипы в собственные корпуса под собственной маркой.
Другие орбиты
Однако, спутники летают не только на низкой околоземной орбите. В качестве примера других требований давайте рассмотрим единственный способ обеспечить стабильную связь в окрестностях Северного полюса — а это стратегически важный для России район — орбиту “Молния”, названную так в честь первого запущенного на нее аппарата.
Рисунок 5. Орбита “Молния”.
Главная особенность этой орбиты состоит в том, что из-за большой вытянутости (минимальная высота — около 500 км над поверхностью Земли, максимальная — до 40 000 км, период 12 часов) аппарат четыре раза в сутки пересекает радиационные пояса. Срок активного существования самых первых спутников “Молния” составлял всего около полугода — в первую очередь, из-за вызванного радиацией падения мощности солнечных панелей, которым нужно было питать мощный (орбита-то высокая) радиопередатчик.
На геостационарной орбите или на орбитах навигационных аппаратов рисунок 2 обещает нам дозу в несколько сотен крад(Si) — а дозовая стойкость коммерческих микросхем может легко составлять 5-10 крад(Si), то есть ни о каких 10-15 годах активного существования таких чипов на орбите речи быть не может. Точнее, может, но для этого понадобится гораздо более толстая защита — или защита из чего-то более плотного, чем алюминий. Впрочем, тут мы погружаемся в дивный мир конструирования космических аппаратов, так что давайте ограничимся фразой о том, что доставка каждого килограмма на орбиту дорога, а идея спрятать наиболее уязвимую электронику поглубже внутрь корпуса, экранировав ее с помощью других компонентов — неплоха, но полностью проблем не решит.
Военные микросхемы
Занимаясь вопросом развенчания мифов о радстойкости, необходимо обязательно сказать о том, что нельзя ставить знак равенства между «радстойкими», «космическими» и «военными» микросхемами. Не все военные микросхемы — радстойкие, и не все радстойкие — военные. Если мы обратимся к американскому военному стандарту Mil-Std-883 (к американскому, потому что его российский аналог засекречен), то мы найдем в нем множество разных тестов на влияние окружающей среды — термоциклирование, влажность, воздух с морской солью и т.д. и т.п.
Радиации касаются следующие пункты:
1017.2 Neutron irradiation
1019.8 Ionizing radiation (total dose) test procedure
1020.1 Dose rate induced latchup test procedure
1021.3 Dose rate upset testing of digital microcircuits
1023.3 Dose rate response of linear microcircuits
Полная доза и мощность дозы. Одиночные эффекты? Никак нет. В техническом задании на микросхему могут фигурировать требования на стойкость к одиночным сбоям и/или тиристорному эффекту, но эти требования не стандартизованы и каждый раз определяются заново, исходя из потребностей конкретных заказчиков каждого чипа. Получается, что статус «military» не является гарантией возможности запустить микросхему в космос? Да, это так. Примером может служить судьба печально знаменитого «Фобос-грунта», гибель которого была вызвана, согласно официальной версии (очень сложно доказуемой, зато очень удобной), попаданием тяжелой заряженной частицы в американскую микросхему памяти класса «military», которая не была стойкой к одиночным сбоям.
Мирный атом и другие
Важность радиационной стойкости не ограничивается только космическими и военными применениями. Естественный радиационный фон на уровне моря во много раз ниже даже того, что происходит на низкой орбите, но атмосфера Земли не только служит последним щитом на пути космического излучения, но и рождает вторичные частицы при взаимодействии с ним. Вторичные частицы — в основном нейтроны. Появляясь в верхних слоях атмосферы, они обычно не долетают до поверхности, однако на высотах полетов гражданских авиалайнеров и доза излучения набирается значительная, и по одиночным сбоям собрана весьма внушительная статистика. В медицине давным-давно применяется рентгеновское излучение, а радиотерапия — один из важных способов борьбы со злокачественными опухолями, и в подобных установках тоже нужна электроника.
И, конечно же, не стоит забывать, что вся возня с нежно любимым всеми электронщиками бессвинцовым припоем была затеяна во многом из-за того, что свинец и некоторые другие материалы, применяемые при производстве микросхем, содержат примеси более тяжелых элементов, в частности урана, и их применение приводит к генерации небольшого, но все же хорошо измеримого потока альфа-частиц — прямо около уязвимого кремния. В случае c BGA-корпусами или 3D-сборками — по всей поверхности уязвимого кремния.
Рисунок 6. Иллюстрация шарика припоя как источника альфа-частиц.
Хорошая новость — у альфа-частиц достаточно маленькая глубина пробега в кремнии (от единиц до десятков микрон, в зависимости от энергии), и многослойная металлизация помогает уменьшить их влияние. Плохая новость — на низких проектных нормах все альфа-частицы, которые все-таки долетают до кремния, вызывают сбои, и не только одиночные, но и множественные (об этом подробнее чуть ниже). Например, в прошлом году TSMC опубликовали на 2018 IEEE International Reliability Physics Symposium статью об измерении количества сбоев от загрязнения альфа-частицами в памяти по проектным нормам 7 нм, то есть эта проблема продолжает существовать и требовать каких-то действий и в мире, где все перешли на бессвинцовый припой.
Еще одно применение радиационностойких микросхем, о котором хотелось бы сказать пару слов — это физика высоких энергий и атомная энергетика. В активных зонах адронных коллайдеров и атомных реакторов (а также в технике, предназначенной для ликвидации радиационных катастроф) тоже нужна электроника, причем крайне желательно такая, которая не нуждается в замене и ремонте на протяжении значительного времени. Требования по полной поглощенной дозе для таких применений — десятки и даже сотни Мегарад(Si), то есть на три порядка больше, чем в обычных космических применениях. Дополнительно усложняет ситуацию то, что такая стойкость требуется не от цифровых схем, а от силовых и аналоговых — схем управления электроприводами и первичной обработки показаний многоканальных сенсоров. И если с обеспечением дозовой стойкости цифровых схем все более-понятно даже при больших дозах, то в случае с аналогом разработка электрической схемы имеет принципиальное значение, а сама получившаяся схема составляет даже большее ноу-хау, чем это обычно бывает в аналоговом дизайне.
Рисунок 7. Обычная и радстойкая схема источника опорного напряжения. Из статьи Y. Cao et.al., «A 4.5 MGy TID-Tolerant CMOS Bandgap Reference Circuit Using a Dynamic Base Leakage Compensation Technique», IEEE TNS, Vol.60, N.4, 2013
Проиллюстрирую масштаб задач, стоящих перед разработчиками чипов для атомной энергетики, своим любимым примером. Источник опорного напряжения (ИОН), равного ширине запрещенной зоны кремния (bandgap voltage reference) — относительно простая и хорошо известная схема. При воздействии радиации меняются параметры биполярных транзисторов, используемых в качестве диодов (падает коэффициент усиления из-за появления утечки эмиттер-база). В результате опорное напряжение обычной схемы ИОН, определяющее точность всех измерений, может сместиться, скажем, на 15-20%, что соответствует эффективной разрядности АЦП в два-три бита. У схемы справа опорное напряжение изменяется в пределах 1% (что больше 7 бит) при дозе ионизирующего излучения в 4.5 МГр. Для того, чтобы добиться этого впечатляющего результата, схему потребовалось серьезно переработать, добавив целую россыпь обратных связей, компенсирующих дозовую утечку. В радстойком варианте примерно в четыре раза больше элементов, чем в обычном, и его энергопотребление в два раза больше. А самая плохая новость заключается в том, что для каждой новой схемы стратегию обеспечения радиационной стойкости и ее реализацию приходится разрабатывать отдельно. А ведь есть еще проблема защиты аналоговых схем от одиночных эффектов, решение которой тоже достаточно плохо формализуется.
На сайте одной микроэлектронной фабрики довольно долго красовалось утверждение, что радиационной стойкости нельзя добиться на проектных нормах ниже 600 нм, потому что иначе «заряженные частицы прошивают кремний». По удивительному совпадению, минимальными проектными нормами, доступными той фабрике, были как раз 600 нм. А один высокопоставленный сотрудник другой фабрики сообщал в интервью, что сделать микросхемы для космоса на проектных нормах ниже 90 нм «технологически невозможно». И снова так совпало, что технологически невозможно сделать что-то на нормах ниже 90 нм на этой конкретной фабрике. Маркетинговые причины этих ситуаций и сиюминутная выгода от них вполне понятны, но в долгосрочной перспективе подобные фразы, сказанные на широкую аудиторию, как мне кажется, приносят больше вреда, чем пользы.
Также регулярно встречаются не привязанные ни к какому маркетингу рассуждения о том, что микросхемы, выполненные по проектным нормам грубее некоторого предела, иммунны к разрушающим одиночным сбоям (в частности, к тиристорному эффекту), а значит многолетнее использование давно устаревших технологий не только оправдано, но и необходимо.
Или наоборот, фразы о том, что к тиристорному эффекту иммунны микросхемы с проектными нормами ниже 250 нм, потому что у них настолько низкие рабочие напряжения, что тиристор просто не может открыться. Или есть мнения, что на самом деле проблема не в проектных нормах, а в том, что КМОП-технология принципиально уязвима к радиации (что подтверждается сделанными заявителем в семидесятых испытаниями), а старые радстойкие чипы — биполярные/КНС/GaAs. А раз КМОП-технология принципиально плоха, но все современные чипы делаются на ней — это значит, что современные чипы нерадстойкие по определению, и единственный верный путь для космонавтики — вложение денег в доведение до ума давно заброшенного арсенида галлия (заодно и на коммерческом рынке Intel победим) или возврат к проверенной временем дискретной логике. А еще лучше — к лампам.
Радстойкие — значит старые и отсталые?
Справедливости ради, надо отметить, что в проектных нормах около пары микрон и больше действительно обычно не бывает ни тиристорного эффекта, ни одиночных сбоев — просто потому, что для переключения элементов на таких проектных нормах нужна очень большая энергия. При нормальной работе — тоже, так что хотелось бы пожелать тем, кто предлагает продолжать пользоваться старыми микросхемами, попробовать собрать процессор Intel Core на логике 74 серии, и подумать, какая ракета вообще способна будет поднять в воздух получившегося монстра.
С другой стороны, не процессорами едиными жива микроэлектроника. Существует огромное количество задач, для которых совсем маленькие проектные нормы не нужны или не настолько обязательны, и вполне хватает уровней 500-90 нм. Мировой коммерческий рынок микросхем на пластинах диаметром 200 мм (а это проектные нормы 90 нм и выше) уже несколько лет растет, вплоть до дефицита производственного оборудования. На «устаревших» проектных нормах производятся как давно разработанные, так и совершенно новые микросхемы, и многие фабрики готовы гарантировать долгосрочное будущее техпроцессов (но не обязательно их полную неизменность). Поэтому «отсталость» той или иной фабрики от условного TSMC вовсе не означает невозможность коммерческого успеха ни на гражданском, ни на спецстойком поприще.
Дороговизна разработки, производства и сертификации радстойких микросхем — еще большая головная боль для производителей, чем в автомобильной или промышленной электронике. Маленькие тиражи (а речь часто идет если не о сотнях, то о тысячах штук) усложняют коммерциализацию подобного рода разработок, ведь если нужно разделить на тысячу чипов миллион долларов (стоимость разработки относительно несложного чипа по нормам 180 нм), то это уже тысяча долларов на чип, а ведь еще нужна сертификация, которая тоже легко может вылиться в несколько миллионов (особенно если испытывать КМОП-схемы на ELDRS). А если нужно окупить на маленьком тираже миллиард долларов? Именно столько стоит разработка по нормам 5-7 нм. Дороговизна разработки и сертификации привела к тому, что во всем мире разработка значительной части радстойких микросхем напрямую или косвенно дотируется государствами. Это сильно сокращает количество новых проектов, побуждает дольше и изобретательнее продавать то, что есть, и максимально переиспользовать проверенные IP-блоки. В итоге востребованные радстойкие микросхемы производятся и используются по много лет, создавая иллюзию, что все радстойкие микросхемы — старые. И клиенты в большинстве случаев этим довольны, потому что в ситуации, когда надежность все же первична по отношению к производительности, переиспользование уже зарекомендовавшего себя решения — это часто лучшее, что можно придумать, а наличие «flight heritage» — колоссальное конкурентное преимущество. Это тоже способствует продлению срока активного производства удачных разработок — даже тогда, когда они уже морально устаревают, и когда уже есть замена. Кроме того, даже установка pin-to-pin-совместимого аналога в большинстве случаев требует как минимум пересогласования конструкторской документации, а как максимум проведения дорогостоящих испытаний. И это в ситуации, когда никакой разработки не требуется, что же говорить о случае, когда для применения нового чипа что-то действительно надо переделывать? Разумеется, в такой ситуации разработчики аппаратуры стремятся переиспользовать проверенные решения целиком.
Не помогает восприятию обществом и то, что путь новых разработок в космос долог и тернист — и в новости еще дольше, а ведь именно из научно-популярных новостей обыватели обычно узнают о достижениях космической индустрии. В 2015 году было несколько сообщений вида «на спутнике New Horizons, долетевшем до Плутона, стоит такой же процессор, как в приставке Sony PlayStation», а приставке этой на момент выхода новостей было уже за двадцать лет. Отличная и очень грамотная подача материала, ничего не скажешь. New Horizons был запущен в 2006 году, а разработка проекта началась в 2000 году — в год первого полета процессора Mongoose-V, то есть это был самый новый доступный процессор с уже имеющимся опытом работы на орбите. Разработка этого процессора закончилась в 1998 году, а началась в 1994 году — аккурат одновременно с выходом PlayStation. Вот другой пример: процессоры архитектуры Power750 вышли для гражданских применений в 1997 году, в 1998 году дебютировал iMac с таким процессором. В 2001 году была закончена разработка радстойкого аналога — RAD750. В космос этот процессор впервые попал в 2005 году, а в новости — только в 2012, после мягкой посадки на Марс ровера Curiosity. Конечно же, тогда тоже не обошлось без желтых заголовков про процессор пятнадцатилетней давности, а ведь разработка проекта Curiosity началась в 2003 году, то есть даже до первого полета процессора RAD750.
Передовые рубежи
Несмотря на все вышеизложенное, прямо сейчас уровень проектных норм, на котором ведутся разработки вычислительных платформ для космоса — это 65-45-22 нм. По 45 нм уже выпущен в серийное производство американский комплект микросхем RAD5500, по 28 нм в следующем году должен выйти европейский процессор DAHLIA, по 65 нм в бельгийском IMEC сейчас активно создается рассчитанная на долгосрочное применение платформа для разработки ASIC. Не отстают и российские разработчики — в дорожной карте НИИСИ РАН на будущий год значится выход радстойкого процессора на 65 нм, а публикации на эту тему говорят о создании платформы разработки, то есть у этих проектных норм большое будущее не только в Европе, но и в России.
И даже на этом уровне проектных норм развитие радстойкой электроники не останавливается — если посмотреть в свежие номера IEEE Transactions on Nuclear Science, там можно найти достаточно работ по изучению транзисторов с проектными нормами 20-16-14 нм, подготавливающих почву для новых поколений космических микропроцессоров. На таких проектных нормах разработчиков ожидает много нового и интересного: во-первых, нельзя сделать кольцевые транзисторы, во-вторых, в FinFET совсем другая геометрия канала и изоляции, в-третьих, есть FDSOI-технологии, в которых тоже достаточно специфики.
Уменьшение проектных норм, безусловно, влияет на радиационную стойкость изготавливаемых на них микросхем, но вовсе не обязательно в худшую сторону. Общий тренд состоит в том, что со снижением проектных норм влияние полной дозы уменьшается, а одиночных эффектов увеличивается. Сдвиг порогового напряжения в проектных нормах 180 нм и ниже измеряется в единицах или десятках милливольт даже для больших доз: подзатворный оксид такой тонкий, что накапливающийся в нем заряд туннелирует в канал вместо того, чтобы накапливаться. Переходной слой в технологиях с изоляцией STI достаточно компактный, что позволяет во многих случаях обеспечить низкие утечки при полной дозе в несколько десятков или даже сотен крад(Si). А если применить в глубоко субмикронной объемной технологии кольцевые транзисторы и охранные кольца, то мы разом избавимся от всех дозовых проблем.
Рисунок 8. Примеры радиационностойких элементов AND разработки компании «Миландр» на технологии SOI BCD.
На рисунке 8 — два варианта реализации одного и того же логического элемента AND для разных условий. Слева мы видим полный фарш — кольцевые транзисторы в индивидуальных охранных кольцах. Справа — вариант попроще, для низкой полной дозы: транзисторы линейные, вместо охранных колец только хорошие контакты в земле. И в обоих случаях диэлектрическая изоляция n-канальных транзисторов от p-канальных, чтобы обезопасить микросхему от тиристорного эффекта. В объемной технологии эту функцию выполняют охранные кольца. При этом надо отметить, что для многих космических применений вполне достаточно стойкости к полной дозе на уровне 50-100 крад(Si), и линейные транзисторы прекрасно с этим справляются, не требуя существенно ухудшать функциональные параметры схемы ради достижения стойкости.
С одиночными сбоями ситуация такая: приблизительный диаметр области, из которой идет сбор заряда при попадании одиночной частицы — порядка одного микрона, то есть больше размеров ячейки памяти, выполненной по глубоко субмикронным проектным нормам. И действительно, экспериментально обнаруживаются так называемые множественные сбои, когда одна частица вызывает переключение сразу нескольких бит. Более того, с уменьшением проектных норм уменьшается и энергия, необходимая для переключения бита памяти, то есть к сбоям приводит большее количество попаданий, чем для чипов, выполненных по более грубым проектным нормам. В том числе — попадание альфа-частиц из радиоактивных примесей в конструкционных материалах.
Рисунок 9. Сравнение количества сбоев от попадания одиночной частицы для двух разных вариантов 6T SRAM в технологии с проектными нормами 65 нм. Источник — А. Балбеков и др., «Вопросы применимости СБИС по 65 нм КМОП технологии в условиях воздействия факторов космического пространства».
На рисунке 9 изображены экспериментальные данные по одиночным сбоям в объемной технологии 65 нм. Слева — обычная 6T-SRAM. Десять сбоев от одного попадания! От такого код Хэмминга вас не защитит. Так что, если мы говорим о коммерческих микросхемах, то на грубых проектных нормах с одиночными сбоями все будет несколько лучше, чем на тонких. По крайней мере, они останутся одиночными, и их будет реально исправить при помощи кодирования. Но если микросхема специально создается для космических применений, то в арсенале разработчика есть огромное количество архитектурных, схемных и топологических решений, способных обеспечить высокую стойкость одновременно с высокой производительностью. В правой части рисунка — тоже 6T-SRAM, с точно такой же электрической схемой, но с другой топологией. Цена улучшений, убирающих множественные сбои, тиристорный эффект и повышающих стойкость к полной дозе — четырехкратный рост площади. Звучит не очень приятно, но никто не говорил, что будет легко. Тем не менее, Radiation Hardening by Design работает и позволяет достигать заранее заданных показателей стойкости на маленьких проектных нормах на любой объемной технологии.
Почему заранее заданных? Потому что достижение разных уровней стойкости требует применения разных методов ее повышения, и для каждой технологии и технического задания нужный набор методов свой. Тогда почему бы не применять все сразу, чтобы точно было хорошо? Потому что достижение радиационной стойкости всегда происходит за счет ухудшения функциональных параметров (энергопотребления, площади кристалла, скорости и т.д.), а они являются первым приоритетом. Именно поэтому нужны четкие требования технического задания, как по функциональности, так и по стойкости. Правда, микросхемы не так часто делаются для решения одной-единственной задачи, особенно радстойкие, у которых тираж для каждого из имеющихся применений может составлять несколько десятков штук. Но все же хорошее понимание требований позволяет, например, не использовать кольцевые транзисторы, сильно увеличивающие площадь и ток потребления, и получать в итоге более конкурентоспособные продукты.
Глаз внимательного читателя наверняка зацепился за слово «объемной» во фразе «заранее заданных показателей стойкости на маленьких проектных нормах на любой объемной технологии». Не лишнее ли оно там? Всем же известно, что радстойкие микросхемы нужно делать на технологии «кремний на изоляторе» или «кремний на сапфире».
За технологией «кремний на изоляторе» давно и прочно закрепилась слава радиационностойкой. Корни этого популярного заблуждения уходят в седую древность, когда предшественник КНИ, кремний на сапфире, активно использовался для военных разработок. Почему? Транзисторы в такой технологии электрически отделены друг от друга и, что более важно, от подложки. Это означает, что область сбора радиационно-индуцированного заряда при кратковременном воздействии на чип излучения с высокой мощностью дозы, будет маленькой. Это, в свою очередь, существенно уменьшает время потери работоспособности — то, что нужно для работы в условиях атомной войны. И действительно, никакого другого метода снижения времени потери работоспособности, кроме полной диэлектрической изоляции, не существует.
Вторая важная часть мифа «КНИ = радстойкость» — это устойчивость к тиристорному эффекту, в том числе при воздействии с высокой мощностью дозы. Тиристорный эффект или «защелка» — чуть ли не главная головная боль разработчиков микросхем и приборов для космоса, и неудивительно, что технология, позволяющая от него избавиться, заслужила славу радиационностойкой. Но на самом деле ситуация опять несколько сложнее.
Рисунок 10. Сечение объемной КМОП-технологии с паразитным тиристором.
Причина возникновения тиристорного эффекта — паразитная тиристорная структура, присутствующая внутри элементов объемной КМОП-технологии. Если сопротивления Rs и Rw достаточно велики, то эта тиристорная структура при попадании заряженной частицы может открыться и закоротить землю чипа с питанием, что, сами понимаете, нехорошо. Насколько велики эти сопротивления в реальных микросхемах? Ответ на этот вопрос довольно прост: контакт к подложке или карману — это лишняя площадь, поэтому их количество стараются минимизировать. А это, в свою очередь значит, что по умолчанию тиристорный эффект в «обычной» микросхеме скорее будет, чем нет. Правда, тиристорный эффект может случиться не только от радиации, но и при воздействии, например, электростатического разряда или даже просто от повышенной температуры и большой плотности тока при неудачной топологии. В «обычных» применениях с тиристорным эффектом сталкиваются производители силовой и автомобильной электроники.
В значительной части космических систем вполне допустима перезагрузка в случае непредвиденных обстоятельств, то есть можно попробовать применить подверженный «защелке» чип, поставив в линию питания схему контроля тока потребления и сброса питания при превышении нормы. Это, собственно, регулярно и делается в ситуациях, когда очень надо применить высокопроизводительную коммерческую микросхему, а чипы защиты от тиристорного эффекта (Latchup Current Limiter) — довольно популярный радстойкий продукт. Но у такого решения есть много ограничений. Сбросить питание можно не везде и не всегда, перезагрузка в процессе выполнения важного маневра способна поставить крест на длительной миссии. Ток потребления современной микросхемы может различаться во много раз в зависимости от режима ее работы, то есть потребление в режиме «ничего не происходит и есть защелка» может быть меньше, чем в случае штатной работы в другом режиме. На какой уровень ставить ограничение тока? Тоже непонятно. Время, за которое нужно успеть отключить питание и предотвратить разрушение чипа, зависит от множества факторов, в том числе от конкретной микросхемы. Где-то можно никуда не спешить и сбрасывать питание столько раз, сколько будет нужно, а где-то уже после первого-второго раза чип все равно необратимо сгорает.
В микросхеме, выполненной по технологии КНИ, тиристорного эффекта не может быть в принципе, потому что все транзисторы электрически разделены. И самое лучшее — то, что для достижения стойкости к тиристорному эффекту не надо делать вообще ничего. То есть, коммерческие микросхемы, выполненные по технологии КНИ, тоже абсолютно устойчивы к нему, что сильно облегчает их применение в космосе. Так, например, коммерческий КНИ процессор будет управлять новым американским космическим кораблем «Орион».
Рисунок 11. Радиационно-индуцированные утечки в объемной КМОП-технологии. Источник — J. Schwank et.al., «Radiation effects in MOS oxides», IEEE TNS, Vol. 55, No. 4, 2008
В чем проблема? В том, что, кроме эффектов мощности дозы и «защелки», есть еще одиночные сбои и полная поглощенная доза, с которыми у КНИ-технологии все далеко не так радужно. На рисунке показаны два пути утечки в объемной КМОП-технологии. Оба этих пути легко закрываются при правильном топологическом проектировании — один использованием кольцевых n-канальных транзисторов, второй — при помощи охранных колец. Эти решения имеют недостатки с точки зрения функционирования схемы (ограничения на минимальный размер кольцевого транзистора, потери площади при использовании охранных колец), но с точки зрения обеспечения радиационной стойкости они очень эффективны.
Рисунок 12. Дополнительный механизм утечки в КНИ технологии.
В технологии КНИ есть еще один путь утечки из истока в сток по границе кремния и скрытого оксида. Скрытый оксид намного толще подзатворного, а значит, в нем может накопиться много положительного заряда. Если мы рассмотрим «нижний» транзистор (правая часть рисунка 12), для которого скрытый оксид является подзатворным, то увидим, что в нормальной ситуации напряжение «исток-затвор» этого транзистора — ноль, а его пороговое напряжение — несколько десятков Вольт, то есть ток через этот транзистор не течет. При облучении в скрытом оксиде накапливается положительный заряд (на этот процесс влияет геометрия основного транзистора, в частности — толщина приборного слоя кремния), и пороговое напряжение «нижнего» n-канального транзистора падает. Как только оно падает ниже нуля, ток начинает свободно течь через транзистор по неуправляемому нижнему каналу. Таким образом, с точки зрения полной поглощенной дозы технология КНИ принципиально строго хуже объемной технологии. Но, может быть, есть способ как-то исправить положение?
Обычно подложка микросхемы заземлена, но ведь в КНИ нам ничего не мешает подать на нее не землю, а отрицательное напряжение и таким образом закрыть нижний транзистор? С одной стороны, идея здравая и она активно используется. Причем в случае с полностью обедненным КНИ (FDSOI) и нормами 45-28 нм контроль потенциала под скрытым оксидом используется и при нормальном функционировании. С другой стороны, электрическое поле в скрытом оксиде не только закрывает паразитный транзистор, но и ускоряет накопление положительного заряда в скрытом оксиде. В итоге, в зависимости от параметров техпроцесса и величины приложенного отрицательного напряжения, дозовая стойкость микросхемы с поданным на подложку отрицательным напряжением может не только не улучшиться, но и стать хуже! Дальше, как это обычно водится, есть тонкости, но принципиально ситуация состоит в том, что топологические и схемотехнические методы на объемной технологии позволяют добиться практически любых разумных уровней стойкости к полной дозе, и под «разумными уровнями» я здесь понимаю, скажем 100 Мрад(Si). На КНИ же существуют фундаментальные ограничения, и уровень стойкости конкретного техпроцесса может быть достаточно низким. Обойти эти ограничения без вмешательства в технологию (обычно недоступного из коммерческих соображений) никак нельзя, и узнать параметры дозовой стойкости без дорогостоящих испытаний тоже не получится.
Ничуть не менее интересна и ситуация с одиночными сбоями в КНИ. С одной стороны, в КНИ гораздо меньше объем, из которого собирается выделившийся при попадании ионизирующей частицы заряд (хотя насчет точной формы этого объема много лет идут споры между ведущими учеными). С другой стороны, подзатворная область («тело») КНИ МОП транзистора настолько мала, что попадание в нее даже небольшого заряда способно существенно поднять напряжение в ней. Если напряжение поднимется достаточно высоко для открывания pn-перехода исток-тело, то включится паразитный биполярный транзистор исток-тело-сток, и заряд, внесенный ионизирующей частицей, умножится на коэффициент усиления этого транзистора. На практике это означает падение пороговой ЛПЭ до уровней ниже 1 МэВ*см^2/(мг), то есть к сбою приводит попадание в микросхему чего угодно. Конечно же, с паразитным тиристорным эффектом в КНИ можно справиться — присоединив подзатворную область к истоку транзистора или к земле/питанию. Но, во-первых, этого никто не делает в коммерческих микросхемах (потому что нет необходимости), а во-вторых, контакт к телу — это потеря площади, особенно чувствительная для ключей, где он должен быть независимым. В каждой ячейке кэш-памяти как минимум два ключа, что приводит к значительному росту площади кэша и кристалла в целом. В то же самое время в объемной технологии для подавления тиристорного эффекта и паразитного биполярного эффекта может быть достаточно одного контакта на 4-8 ячеек памяти, да и даже охранные кольца можно сделать с меньшими потерями площади, чем на контакты к телу транзистора в КНИ. Важным преимуществом КНИ в глубоко субмикронных технологиях является то, что диэлектрическая изоляция предотвращает распространение заряда и множественные сбои с большой кратностью, которые могут появляться в объемной технологии. Однако, размер трека ионизирующей частицы как минимум сравним с размерами ячейки памяти, так что двойные сбои в КНИ вполне себе регистрируются.
Итого ситуация с радиационной стойкостью технологии «кремний на изоляторе» выглядит таким образом, что она не «радиационно стойкая сама по себе», а имеет ряд преимуществ и ряд недостатков относительно объемной технологии. Часть недостатков КНИ можно обойти при помощи специальных приемов проектирования, но то же самое можно сделать и в объемной технологии. Поэтому при выборе коммерческой микросхемы для использования в условиях воздействия радиации нельзя полагаться на КНИ как на панацею, а при выборе технологии для разработки специализированной радстойкой СБИС надо тщательно взвешивать все «за» и «против» КНИ и объемной технологии для решения конкретной задачи и обеспечения требуемых уровней стойкости к различным радиационным эффектам.
Над обеспечением радиационной стойкости интегральных микросхем работают сотни тысяч специалистов по всему миру, и объять необъятное одной научно-популярной статьей невозможно. Да это и тема не для статьи и даже не для диссертации. Во всяком случае, не для кандидатской диссертации. В силу специфики формата, коллеги-специалисты найдут здесь достаточно упрощений, неточностей и может даже фактических ошибок. Хотелось бы, чтобы нет, но сообщения о необходимых правках принимаются в личку. Не претендуя на полноту и новизну, я надеюсь, что справился с тем, чтобы наглядно описать самые популярные связанные с радиационной стойкостью вопросы и заблуждения, а также донести до читателя мысль, что микроэлектроника вообще и космическая микроэлектроника в частности — одна из самых быстро прогрессирующих областей науки и техники, поэтому проверенные временем знания и стереотипы на поверку часто оказываются устаревшими, неполными или неправильными, а простые и очевидные рецепты никто не использует, потому что на самом деле их не существует.
Рисунок 1. Непременная красивая картинка про космическое излучение и хрупкую Землю.
Самые популярные тезисы относительно радиационной стойкости, используемые в околокосмических спорах, выглядят примерно так:
- Радстойкие микросхемы не нужны. Кубсаты прекрасно летают на обычных, на МКС стоят обычные ноутбуки Lenovo, в Dragon стоят обычные микросхемы, да даже NASA в Orion поставило обычные микросхемы!
- На спутники вполне можно ставить очень старые микросхемы, вплоть до «рассыпухи», никакая серьезная производительность там не нужна. Зато без радстойкости никуда, поэтому и летают на старье.
- Тезис, дополняющий предыдущий: радстойкие микросхемы в принципе нельзя сделать на низких проектных нормах, поэтому и применение проверенных временем компонентов не просто оправдано, но и необходимо.
- Для того, чтобы микросхема была радстойкой, необходимо и достаточно сделать ее по технологии «кремний на изоляторе» или «кремний на сапфире».
- Все «военные» микросхемы — радстойкие, а все радстойкие — «военные».
Как видите, некоторые из этих тезисов прямо противоречат друг другу — что регулярно и служит предметом спора или причиной для далеко идущих неверных выводов.
Начать разговор нужно с важного дисклеймера: радиационная стойкость не является центром мира и единственным качеством, которым должна обладать подходящая для использования в космосе или другой агрессивной среде микросхема. Радиационная стойкость — это лишь одно требование из длинного ряда, включающего в себя надежность, расширенный температурный диапазон, устойчивость к электростатическому разряду, вибростойкость — и достоверное подтверждение всех вышеперечисленных параметров, то есть длительную и дорогую сертификацию. Важно все, что может не позволить чипу проработать весь необходимый срок службы, причем большинство применений радстойких чипов предполагают невозможность ремонта или замены. С другой стороны, если по одному из параметров что-то не так, конструктор конечного изделия часто может найти способ обойти ограничение — поставить самую чувствительную к дозе радиации микросхему за толстую стенку, мониторить ток потребления уязвимого к тиристорному эффекту чипа и сбрасывать его питание при необходимости, или термостатировать чип с узким температурным диапазоном. А может не найти, и единственным способом решить поставленную задачу будет заказ новой радстойкой ASIC.
Также полезно помнить, что разработчики систем специального назначения — такие же люди, как и любые другие разработчики. Многие из них тоже любят писать ко вчерашнему дедлайну наполненный костылями код и использовать железо помощнее, чтобы он точно на нем заработал; некоторые и Ардуино бы использовали, если б оно было соответствующим образом сертифицировано. И, разумеется, люди, которые ставят задачи разработчикам систем специального назначения и разработчикам микросхем для них, редко стесняются в требованиях, и к надёжности, и к производительности, и к радстойкости. Поэтому современные проектные нормы на спутниках еще как нужны — хочется и большие объемы DRAM, и многоядерные процессоры, и самые современные ПЛИС. Я уже упомянул выше о том, что последствия плохой радиационной стойкости и других потенциальных проблем можно по крайней мере частично обойти, поэтому от применения всего этого великолепия разработчиков в большей степени удерживает
Радиационные эффекты
Понятия «радиационная стойкость» и «радиационностойкая микросхема» — это грандиозные упрощения. На самом деле существует много разных источников ионизирующего излучения, и они могут влиять на функционирование электронных приборов по-разному. Соответственно, для разных применений необходима стойкость к разным наборам воздействующих факторов и разным уровням воздействия, так что «стойкая» микросхема, предназначенная для работы на низкой околоземной орбите совершенно не обязана нормально работать при разборе завалов в Чернобыле.
Ионизирующее излучение называется так, потому что выделение в объеме вещества энергии при торможении прилетающих частиц ионизирует вещество. У каждого материала своя энергия, необходимая для ионизации и создания электронно-дырочной пары. Для кремния это 17 эВ, для его оксида — 3.6 эВ, для арсенида галлия — 4.8 эВ. Также энерговыделение может “сдвинуть” атом с правильного места в кристаллической решетке (в кремнии для этого нужно передать атому 21 эВ). Созданные в веществе электронно-дырочные пары могут по-разному влиять на электрические и физические свойства и на поведение электрической схемы. Радиационные эффекты можно разделить на четыре большие группы: эффекты полной поглощенной дозы, эффекты мощности дозы, эффекты, вызванные попаданием одиночных частиц, и эффекты смещения. Это разделение — до некоторой степени условность: например, облучение потоком тяжелых ионов, вызывающих одиночные эффекты, приводит и к набору полной поглощенной дозы.
Дозовые эффекты
Полная поглощенная доза излучения измеряется в радах, с указанием вещества, поглощающего излучение. 1 рад = 0.01 Дж/кг, то есть количество энергии, выделившееся в единице массы вещества. Реже используется единица измерения Грэй, равная 100 рад (или 1 Дж/кг). При этом важно понимать, что поглощенная доза в разных веществах будет различаться для одного и того же количества ионизирующих частиц, выпущенных источником радиации (это экспозиционная доза). В случае с кремниевыми микросхемами нужный материал — это оксид кремния, потому что воздействие на него, а не на кремний, в основном влияет на электрические характеристики схемы, так как подвижность дырок в SiO2 при нормальной температуре настолько мала, что они накапливаются в оксиде, создавая встроенный положительный заряд. Типичные уровни дозовой стойкости коммерческих микросхем лежат в диапазоне 5-100 крад(Si), востребованные покупателями уровни радиационной стойкости начинаются на 30 крад(Si) и заканчиваются где-то в районе 1 Град(Si), в зависимости от назначения микросхем. Смертельная доза для человека — около 6 Грэй.
Рисунок 2. Примеры расчетов набора полной поглощенной дозы за 10 лет на различных круговых орбитах за защитой в 1г/см^2. Источник — Н.В. Кузнецов, «Радиационная опасность на околоземных орбитах и межпланетных траекториях космических аппаратов».
Эффекты воздействия полной дозы связаны с накоплением этого положительного заряда в диэлектриках и проявляются в КМОП-схемах несколькими основными путями:
- Сдвиг порогового напряжения транзисторов, возникающий из-за накопления положительного заряда в подзатворном диэлектрике и изменения электрического поля в канале транзистора. У n-канальных транзисторов порог обычно уменьшается (но зависимость может быть немонотонной), а у p-канальных увеличивается, причем величина сдвига имеет корреляцию с толщиной подзатворного оксида, то есть с проектными нормами. Пороги транзисторов в схемах с грубыми проектными нормами могут измениться настолько, чтобы послужить причиной функционального отказа (n-канальные транзисторы перестают закрываться, p-канальные — открываться); в субмикронных технологиях этот эффект менее важен, но в аналоговых схемах способен доставить много головной боли.
- Возникновение неуправляемого тока утечки. Он может течь из истока транзистора в его же сток или в соседний транзистор. Причина утечек — накопление положительного заряда, но только не в подзатворном диэлектрике, а в толстом изолирующем. Фактически, параллельно основному транзистору формируется паразитный транзистор, напряжение на затворе которого управляется дозой радиации. Проявление этого эффекта определяется особенностями геометрии перехода от подзатворного диэлектрика к изолирующему, то есть в намного большей мере зависит от конкретной технологии, чем от проектных норм.
- Уменьшение подвижности носителей заряда из-за накопления дефектов, на которых рассеиваются носители заряда. Влияние этого фактора на субмикронные цифровые схемы на кремнии невелико, но он более важен для силовых транзисторов, в том числе на сложных полупроводниках (нитриде галлия и карбиде кремния).
- Увеличение 1/f шумов, вызванное паразитными краевыми транзисторами. Оно важно для аналоговых и радиочастотных схем. Значение этого эффекта растет с уменьшением проектных норм, когда влияние остальных дозовых эффектов уменьшается.
В биполярных схемах основной дозовый эффект — падение коэффициента усиления, вызванное ростом базового тока из-за утечки из эмиттера в базу по границе кремния и пассивирующего оксида. Другой специфический для биполярных транзисторов дозовый эффект состоит в том, что они могут (не обязательно) реагировать не только на уровень набранной дозы, но и на скорость ее набора — чем медленнее набирается доза, тем хуже стойкость. Этот эффект называется ELDRS (Enhanced Low Dose Rate Sensitivity) и он сильно усложняет и удорожает тестирование, причем часто не только биполярных, но и КМОП-схем — потому что в них тоже иногда бывают биполярные транзисторы и потому что проще заставить всех тестироваться единообразно, чем разбираться, где ELDRS может быть, а где нет.
Мощность дозы
Другая часть эффектов, связанных с мощностью дозы — это сверхбыстрый набор дозы, при котором в микросхеме генерируется настолько большое количество электронно-дырочных пар, что они не успевают рекомбинировать, и в чип вносится огромный электрический заряд, который рассасывается через линии земли и питания в течение значительного времени — на которое схема перестает работать. Это время называется «время потери работоспособности» и является основной характеристикой стойкости микросхемы или прибора к подобного рода эффектам. Кроме этого, большое количество внесенного в микросхему заряда серьезно изменяет потенциалы областей, соединенных с землей и с питанием — что может привести к возникновению тиристорного эффекта.
Именно эффекты высокой мощности дозы — то, ради стойкости к чему изначально развивалась технология «кремний на сапфире» и «кремний на изоляторе», потому что единственный способ уменьшить вносимый в схему заряд состоит в том, чтобы отделить активную область микросхемы от объема подложки, не дав заряду из подложки поучаствовать в процессе. Почему эти эффекты важны? Большая мощность дозы в течение небольшого времени — типичное следствие ядерного взрыва.
Одиночные эффекты
Одиночные эффекты связаны не с длительным воздействием излучения, а с измеримым эффектом от попадания единственной ионизирующей частицы. Их можно разделить на две большие группы:
- Неразрушающие. К ним относятся сбои в разного рода запоминающих элементах (кэш-памяти, регистровых файлах, конфигурационной памяти ПЛИС и т.д.), переходные процессы в комбинационной логике и в аналоговых схемах. Главная особенность этого вида эффектов — они не приводят к физическому разрушению микросхемы и могут быть исправлены программно или аппаратно. Более того, переходные процессы исправляются сами по себе через какое-то время (вопрос в том, насколько оно велико). Основной практический интерес представляют сбои в массивах памяти — просто потому, что они составляют львиную долю всех сбоев в силу большого количества памяти в современных микроэлектронных системах.
- Разрушающие. К ним относятся тиристорный эффект и разнообразные, но, к счастью, редкие эффекты типа пробивания затвора или лавинного выгорания транзистора. Их отличительная черта — то, что они необратимо разрушают элемент микросхемы. В случае с тиристорным эффектом чип обычно (но не всегда!) можно спасти, если быстро сбросить питание. Разрушающие эффекты представляют серьезную опасность для некоторых видов флэш-памяти и для приборов с высокими напряжениями и плотностями тока, самыми важными из которых являются силовые ключи.
Удельная энергоотдача ионизирующей частицы называется «линейная передача энергии» (ЛПЭ) и измеряется в МэВ, передаваемых за единицу длины пролета частицы в материале, на единицу плотности материала, то есть в (МэВ*см^3)/(мг*см) или в (МэВ*см^2)/мг. ЛПЭ нелинейно и немонотонно зависит от энергии частицы и взаимосвязана с длиной пробега, которая для актуальных в микроэлектронике частиц и материалов может составлять от сотен нанометров до сотен миллиметров.
Количество частиц, встречающихся в космосе, убывает с ростом ЛПЭ (см. рисунок 4). Важные значения — 30 (соответствует ионам железа) и 60 или 80 (после которых вероятность события считается пренебрежимо малой). Кроме этого, важной является цифра в 15 МэВ*см^2/(мг) — это максимальная ЛПЭ, которую могут иметь продукты ядерной реакции при попадании протона или нейтрона в кремний. Протоны — один из основных видов солнечного излучения, и хотя их собственная ЛПЭ невелика (десятые доли единицы), они оказывают существенное влияние из-за ядерных реакций и вторичной ионизации. Вторичная ионизация может возникать прямо в активной области, а может быть следствием попадания протона в атом какого-то материала с большим атомным номером — например, вольфрама или тантала. Тяжелые элементы активно используются в современной микроэлектронной технологии, например, для создания контактов от кремния к первому слою металлизации. Вторичная ионизация также является причиной, по которой не стоит для повышения радиационной стойкости паковать чипы в свинцовые коробки.
Рисунок 3. Зависимость ЛПЭ от энергии для разных типов частиц.
Отдельно стоит обратить внимание на ядра гелия (альфа-частицы) — не только потому, что их достаточно много в составе солнечной радиации, но и потому, что довольно много источников альфа-излучения можно встретить в обычной жизни.
Рисунок 4. Сравнение количества частиц разных типов за двухлетнюю миссию на орбите, по статье Xapsos et.al., «Model for Cumulative Solar Heavy Ion Energy and Linear Energy Transfer Spectra», IEEE TNS, Vol. 5, No. 6., 2007
1, 30 или 60 МэВ*см^2/(мг) — насколько это много? Порог сбоя стандартной ячейки памяти в технологии 7 нм находится намного ниже единицы, в 180 нм — в пределах от единицы до десятки. Применение специальной схемотехники позволяет поднять порог, например, до сотни, но обычно разумнее добиться цифры в 15 или 30 единиц, а остатки редких событий отфильтровать с помощью помехоустойчивого кодирования. 60 единиц — это цифра, обычно фигурирующая в требованиях по стойкости к разрушающим эффектам.
Эффекты смещения
Эффекты смещения — это локальное разрушение кристаллической решетки, то есть «выбивание» атома из предназначенного для него места. Энергия, необходимая для повреждения кристаллической решетки, обычно довольно велика, поэтому большинство пролетающих частиц не вызывают этот эффект. Зато его причиной может быть ядерная реакция в результате попадания протона или нейтрона, которых на орбите много. Такие локальные дефекты решетки приводят к уменьшению подвижности носителей заряда, росту шумов и некоторым другим эффектам. Они сказываются на обычных КМОП-микросхемах меньше, чем «обычные» дозовые эффекты, но доминируют в солнечных батареях, фотоприемниках, силовых транзисторах, а также в сложных полупроводниках, у которых нет оксида, например в арсениде галлия и нитриде галлия. Именно этим и объясняется их высокая дозовая стойкость — в них просто нет эффектов, вызывающих быструю деградацию кремниевых чипов, а то, что есть, проявляется слабее и позже. Количество излучения, вызывающего эффекты смещения измеряется в частицах (обычно протонах или нейтронах) на квадратный сантиметр площади чипа.
Итак, с описанием воздействующих факторов излучения разобрались, теперь давайте посмотрим, где и в каких сочетаниях они угрожают микросхемам.
Что? Где? Когда?
На рисунке 2 показан пример расчета набора полной дозы на разных орбитах. Дальше надо обсудить множество допущений — солнечную активность, форму, материал и толщину защиты и так далее, но в целом, несмотря на то, что рисунок представляет собой типичного сферического коня в вакууме, тренд ясен: на разных орбитах скорость набора полной дозы может различаться на пять порядков. При этом на низких орбитах, под первым поясом Ван Аллена, доза набирается так медленно, что многие обычные коммерческие микросхемы способны выдержать несколько лет в таких условиях. Да что микросхемы, даже гораздо более хрупкие люди летают там годами без серьезных последствий для здоровья. А между тем, низкие орбиты — это практически вся пилотируемая космонавтика, дистанционное зондирование земли, спутниковая связь, обещаемый уже совсем скоро спутниковый интернет и, как говорят американцы, the last but not least, практически все кубсаты запускаются на низкие орбиты.
Коммерческие микросхемы на низких орбитах
Собственно, именно из популярности и важности низких орбит и растут ноги у спекуляций на тему того, что дорогие радстойкие микросхемы не нужны, и вполне можно обходиться обычными. Но у использования в космосе коммерческих микросхем есть и подводные камни, проявляющиеся даже на низких орбитах.
Во-первых, пояса ван Аллена защищают Землю и ее ближние окрестности только от легких частиц, в основном от солнечных электронов и протонов. Более тяжелые частицы, хоть и встречаются намного реже, спокойно долетают даже до нашего последнего щита — атмосферы — и, правильно, вызывают одиночные эффекты, в том числе тиристорный эффект, способный в любой момент необратимо разрушить какую-нибудь микросхему и с ней весь космический аппарат. Поэтому применять коммерческие микросхемы можно только в случае, если приняты меры по их защите от одиночных эффектов.
Вторая проблема состоит в том, что микросхемы на спутнике — это не только процессоры и память, но и множество других видов чипов, в том числе силовых и аналоговых, и с их радиационной стойкостью все гораздо сложнее и намного менее предсказуемо. Да и современные системы на кристалле содержат большое количество нецифровых блоков; например, у большинства чипов флэш-памяти первым перестает работать используемый для записи генератор высокого напряжения, а у аналоговых КМОП-схем сдвигается опорное напряжение, генерируемое при помощи пары биполярных транзисторов, и даже небольшие утечки могут серьезно изменить рабочую точку малопотребляющих аналоговых каскадов. Стойкость силовых ключей к разрушающим одиночным эффектам может сильно зависеть от приложенного к ним напряжения, и так далее и тому подобное.
Третья важная проблема использования коммерческих микросхем в космосе состоит в том, что стойкость к полной дозе и тиристорному эффекту чувствительна к изменению параметров техпроцесса, в том числе небольшим, так что если на фабрике что-то поменяли, вы можете выкинуть результаты своих испытаний в мусорную корзину. А для коммерческих микросхем производитель гарантирует стабильность функциональных параметров, а не технологического процесса. Более того, в разных партиях вам могут встретиться кристаллы с разных фабрик; например, процессор из шестого айфона, Apple A9, производился на 16 нм TSMC и 14 нм Samsung, и пользователю не сообщалось, какая версия стоит в его телефоне. Для борьбы с этой проблемой во всем мире для разработки радстойких микросхем используются институты Trusted Foundry или сертифицированных техпроцессов — словом, какой-то формы гарантии неизменности техпроцесса со стороны фабрики.
Итого правильный ответ на вопрос «можно ли применять в космосе обычные коммерческие микросхемы?» звучит так: «Да, можно, на некоторых орбитах и при соблюдении ряда требований и условий». Полезный совет: если вы все же решили использовать коммерческий чип и вложиться в его испытания, купите запас сразу лет на десять вперед. Это, кстати, вполне себе бизнес-модель большой и уважаемой компании 3DPlus — они испытывают на радстойкость все коммерческие микросхемы подряд, находят те, которые имеют (по сути случайно) достаточные показатели, закупают большие партии и дальше пакуют чипы в собственные корпуса под собственной маркой.
Другие орбиты
Однако, спутники летают не только на низкой околоземной орбите. В качестве примера других требований давайте рассмотрим единственный способ обеспечить стабильную связь в окрестностях Северного полюса — а это стратегически важный для России район — орбиту “Молния”, названную так в честь первого запущенного на нее аппарата.
Рисунок 5. Орбита “Молния”.
Главная особенность этой орбиты состоит в том, что из-за большой вытянутости (минимальная высота — около 500 км над поверхностью Земли, максимальная — до 40 000 км, период 12 часов) аппарат четыре раза в сутки пересекает радиационные пояса. Срок активного существования самых первых спутников “Молния” составлял всего около полугода — в первую очередь, из-за вызванного радиацией падения мощности солнечных панелей, которым нужно было питать мощный (орбита-то высокая) радиопередатчик.
На геостационарной орбите или на орбитах навигационных аппаратов рисунок 2 обещает нам дозу в несколько сотен крад(Si) — а дозовая стойкость коммерческих микросхем может легко составлять 5-10 крад(Si), то есть ни о каких 10-15 годах активного существования таких чипов на орбите речи быть не может. Точнее, может, но для этого понадобится гораздо более толстая защита — или защита из чего-то более плотного, чем алюминий. Впрочем, тут мы погружаемся в дивный мир конструирования космических аппаратов, так что давайте ограничимся фразой о том, что доставка каждого килограмма на орбиту дорога, а идея спрятать наиболее уязвимую электронику поглубже внутрь корпуса, экранировав ее с помощью других компонентов — неплоха, но полностью проблем не решит.
Военные микросхемы
Занимаясь вопросом развенчания мифов о радстойкости, необходимо обязательно сказать о том, что нельзя ставить знак равенства между «радстойкими», «космическими» и «военными» микросхемами. Не все военные микросхемы — радстойкие, и не все радстойкие — военные. Если мы обратимся к американскому военному стандарту Mil-Std-883 (к американскому, потому что его российский аналог засекречен), то мы найдем в нем множество разных тестов на влияние окружающей среды — термоциклирование, влажность, воздух с морской солью и т.д. и т.п.
Радиации касаются следующие пункты:
1017.2 Neutron irradiation
1019.8 Ionizing radiation (total dose) test procedure
1020.1 Dose rate induced latchup test procedure
1021.3 Dose rate upset testing of digital microcircuits
1023.3 Dose rate response of linear microcircuits
Полная доза и мощность дозы. Одиночные эффекты? Никак нет. В техническом задании на микросхему могут фигурировать требования на стойкость к одиночным сбоям и/или тиристорному эффекту, но эти требования не стандартизованы и каждый раз определяются заново, исходя из потребностей конкретных заказчиков каждого чипа. Получается, что статус «military» не является гарантией возможности запустить микросхему в космос? Да, это так. Примером может служить судьба печально знаменитого «Фобос-грунта», гибель которого была вызвана, согласно официальной версии (очень сложно доказуемой, зато очень удобной), попаданием тяжелой заряженной частицы в американскую микросхему памяти класса «military», которая не была стойкой к одиночным сбоям.
Мирный атом и другие
Важность радиационной стойкости не ограничивается только космическими и военными применениями. Естественный радиационный фон на уровне моря во много раз ниже даже того, что происходит на низкой орбите, но атмосфера Земли не только служит последним щитом на пути космического излучения, но и рождает вторичные частицы при взаимодействии с ним. Вторичные частицы — в основном нейтроны. Появляясь в верхних слоях атмосферы, они обычно не долетают до поверхности, однако на высотах полетов гражданских авиалайнеров и доза излучения набирается значительная, и по одиночным сбоям собрана весьма внушительная статистика. В медицине давным-давно применяется рентгеновское излучение, а радиотерапия — один из важных способов борьбы со злокачественными опухолями, и в подобных установках тоже нужна электроника.
И, конечно же, не стоит забывать, что вся возня с нежно любимым всеми электронщиками бессвинцовым припоем была затеяна во многом из-за того, что свинец и некоторые другие материалы, применяемые при производстве микросхем, содержат примеси более тяжелых элементов, в частности урана, и их применение приводит к генерации небольшого, но все же хорошо измеримого потока альфа-частиц — прямо около уязвимого кремния. В случае c BGA-корпусами или 3D-сборками — по всей поверхности уязвимого кремния.
Рисунок 6. Иллюстрация шарика припоя как источника альфа-частиц.
Хорошая новость — у альфа-частиц достаточно маленькая глубина пробега в кремнии (от единиц до десятков микрон, в зависимости от энергии), и многослойная металлизация помогает уменьшить их влияние. Плохая новость — на низких проектных нормах все альфа-частицы, которые все-таки долетают до кремния, вызывают сбои, и не только одиночные, но и множественные (об этом подробнее чуть ниже). Например, в прошлом году TSMC опубликовали на 2018 IEEE International Reliability Physics Symposium статью об измерении количества сбоев от загрязнения альфа-частицами в памяти по проектным нормам 7 нм, то есть эта проблема продолжает существовать и требовать каких-то действий и в мире, где все перешли на бессвинцовый припой.
Еще одно применение радиационностойких микросхем, о котором хотелось бы сказать пару слов — это физика высоких энергий и атомная энергетика. В активных зонах адронных коллайдеров и атомных реакторов (а также в технике, предназначенной для ликвидации радиационных катастроф) тоже нужна электроника, причем крайне желательно такая, которая не нуждается в замене и ремонте на протяжении значительного времени. Требования по полной поглощенной дозе для таких применений — десятки и даже сотни Мегарад(Si), то есть на три порядка больше, чем в обычных космических применениях. Дополнительно усложняет ситуацию то, что такая стойкость требуется не от цифровых схем, а от силовых и аналоговых — схем управления электроприводами и первичной обработки показаний многоканальных сенсоров. И если с обеспечением дозовой стойкости цифровых схем все более-понятно даже при больших дозах, то в случае с аналогом разработка электрической схемы имеет принципиальное значение, а сама получившаяся схема составляет даже большее ноу-хау, чем это обычно бывает в аналоговом дизайне.
Рисунок 7. Обычная и радстойкая схема источника опорного напряжения. Из статьи Y. Cao et.al., «A 4.5 MGy TID-Tolerant CMOS Bandgap Reference Circuit Using a Dynamic Base Leakage Compensation Technique», IEEE TNS, Vol.60, N.4, 2013
Проиллюстрирую масштаб задач, стоящих перед разработчиками чипов для атомной энергетики, своим любимым примером. Источник опорного напряжения (ИОН), равного ширине запрещенной зоны кремния (bandgap voltage reference) — относительно простая и хорошо известная схема. При воздействии радиации меняются параметры биполярных транзисторов, используемых в качестве диодов (падает коэффициент усиления из-за появления утечки эмиттер-база). В результате опорное напряжение обычной схемы ИОН, определяющее точность всех измерений, может сместиться, скажем, на 15-20%, что соответствует эффективной разрядности АЦП в два-три бита. У схемы справа опорное напряжение изменяется в пределах 1% (что больше 7 бит) при дозе ионизирующего излучения в 4.5 МГр. Для того, чтобы добиться этого впечатляющего результата, схему потребовалось серьезно переработать, добавив целую россыпь обратных связей, компенсирующих дозовую утечку. В радстойком варианте примерно в четыре раза больше элементов, чем в обычном, и его энергопотребление в два раза больше. А самая плохая новость заключается в том, что для каждой новой схемы стратегию обеспечения радиационной стойкости и ее реализацию приходится разрабатывать отдельно. А ведь есть еще проблема защиты аналоговых схем от одиночных эффектов, решение которой тоже достаточно плохо формализуется.
Радиационная стойкость и проектные нормы
На сайте одной микроэлектронной фабрики довольно долго красовалось утверждение, что радиационной стойкости нельзя добиться на проектных нормах ниже 600 нм, потому что иначе «заряженные частицы прошивают кремний». По удивительному совпадению, минимальными проектными нормами, доступными той фабрике, были как раз 600 нм. А один высокопоставленный сотрудник другой фабрики сообщал в интервью, что сделать микросхемы для космоса на проектных нормах ниже 90 нм «технологически невозможно». И снова так совпало, что технологически невозможно сделать что-то на нормах ниже 90 нм на этой конкретной фабрике. Маркетинговые причины этих ситуаций и сиюминутная выгода от них вполне понятны, но в долгосрочной перспективе подобные фразы, сказанные на широкую аудиторию, как мне кажется, приносят больше вреда, чем пользы.
Также регулярно встречаются не привязанные ни к какому маркетингу рассуждения о том, что микросхемы, выполненные по проектным нормам грубее некоторого предела, иммунны к разрушающим одиночным сбоям (в частности, к тиристорному эффекту), а значит многолетнее использование давно устаревших технологий не только оправдано, но и необходимо.
Или наоборот, фразы о том, что к тиристорному эффекту иммунны микросхемы с проектными нормами ниже 250 нм, потому что у них настолько низкие рабочие напряжения, что тиристор просто не может открыться. Или есть мнения, что на самом деле проблема не в проектных нормах, а в том, что КМОП-технология принципиально уязвима к радиации (что подтверждается сделанными заявителем в семидесятых испытаниями), а старые радстойкие чипы — биполярные/КНС/GaAs. А раз КМОП-технология принципиально плоха, но все современные чипы делаются на ней — это значит, что современные чипы нерадстойкие по определению, и единственный верный путь для космонавтики — вложение денег в доведение до ума давно заброшенного арсенида галлия (заодно и на коммерческом рынке Intel победим) или возврат к проверенной временем дискретной логике. А еще лучше — к лампам.
Радстойкие — значит старые и отсталые?
Справедливости ради, надо отметить, что в проектных нормах около пары микрон и больше действительно обычно не бывает ни тиристорного эффекта, ни одиночных сбоев — просто потому, что для переключения элементов на таких проектных нормах нужна очень большая энергия. При нормальной работе — тоже, так что хотелось бы пожелать тем, кто предлагает продолжать пользоваться старыми микросхемами, попробовать собрать процессор Intel Core на логике 74 серии, и подумать, какая ракета вообще способна будет поднять в воздух получившегося монстра.
С другой стороны, не процессорами едиными жива микроэлектроника. Существует огромное количество задач, для которых совсем маленькие проектные нормы не нужны или не настолько обязательны, и вполне хватает уровней 500-90 нм. Мировой коммерческий рынок микросхем на пластинах диаметром 200 мм (а это проектные нормы 90 нм и выше) уже несколько лет растет, вплоть до дефицита производственного оборудования. На «устаревших» проектных нормах производятся как давно разработанные, так и совершенно новые микросхемы, и многие фабрики готовы гарантировать долгосрочное будущее техпроцессов (но не обязательно их полную неизменность). Поэтому «отсталость» той или иной фабрики от условного TSMC вовсе не означает невозможность коммерческого успеха ни на гражданском, ни на спецстойком поприще.
Дороговизна разработки, производства и сертификации радстойких микросхем — еще большая головная боль для производителей, чем в автомобильной или промышленной электронике. Маленькие тиражи (а речь часто идет если не о сотнях, то о тысячах штук) усложняют коммерциализацию подобного рода разработок, ведь если нужно разделить на тысячу чипов миллион долларов (стоимость разработки относительно несложного чипа по нормам 180 нм), то это уже тысяча долларов на чип, а ведь еще нужна сертификация, которая тоже легко может вылиться в несколько миллионов (особенно если испытывать КМОП-схемы на ELDRS). А если нужно окупить на маленьком тираже миллиард долларов? Именно столько стоит разработка по нормам 5-7 нм. Дороговизна разработки и сертификации привела к тому, что во всем мире разработка значительной части радстойких микросхем напрямую или косвенно дотируется государствами. Это сильно сокращает количество новых проектов, побуждает дольше и изобретательнее продавать то, что есть, и максимально переиспользовать проверенные IP-блоки. В итоге востребованные радстойкие микросхемы производятся и используются по много лет, создавая иллюзию, что все радстойкие микросхемы — старые. И клиенты в большинстве случаев этим довольны, потому что в ситуации, когда надежность все же первична по отношению к производительности, переиспользование уже зарекомендовавшего себя решения — это часто лучшее, что можно придумать, а наличие «flight heritage» — колоссальное конкурентное преимущество. Это тоже способствует продлению срока активного производства удачных разработок — даже тогда, когда они уже морально устаревают, и когда уже есть замена. Кроме того, даже установка pin-to-pin-совместимого аналога в большинстве случаев требует как минимум пересогласования конструкторской документации, а как максимум проведения дорогостоящих испытаний. И это в ситуации, когда никакой разработки не требуется, что же говорить о случае, когда для применения нового чипа что-то действительно надо переделывать? Разумеется, в такой ситуации разработчики аппаратуры стремятся переиспользовать проверенные решения целиком.
Не помогает восприятию обществом и то, что путь новых разработок в космос долог и тернист — и в новости еще дольше, а ведь именно из научно-популярных новостей обыватели обычно узнают о достижениях космической индустрии. В 2015 году было несколько сообщений вида «на спутнике New Horizons, долетевшем до Плутона, стоит такой же процессор, как в приставке Sony PlayStation», а приставке этой на момент выхода новостей было уже за двадцать лет. Отличная и очень грамотная подача материала, ничего не скажешь. New Horizons был запущен в 2006 году, а разработка проекта началась в 2000 году — в год первого полета процессора Mongoose-V, то есть это был самый новый доступный процессор с уже имеющимся опытом работы на орбите. Разработка этого процессора закончилась в 1998 году, а началась в 1994 году — аккурат одновременно с выходом PlayStation. Вот другой пример: процессоры архитектуры Power750 вышли для гражданских применений в 1997 году, в 1998 году дебютировал iMac с таким процессором. В 2001 году была закончена разработка радстойкого аналога — RAD750. В космос этот процессор впервые попал в 2005 году, а в новости — только в 2012, после мягкой посадки на Марс ровера Curiosity. Конечно же, тогда тоже не обошлось без желтых заголовков про процессор пятнадцатилетней давности, а ведь разработка проекта Curiosity началась в 2003 году, то есть даже до первого полета процессора RAD750.
Передовые рубежи
Несмотря на все вышеизложенное, прямо сейчас уровень проектных норм, на котором ведутся разработки вычислительных платформ для космоса — это 65-45-22 нм. По 45 нм уже выпущен в серийное производство американский комплект микросхем RAD5500, по 28 нм в следующем году должен выйти европейский процессор DAHLIA, по 65 нм в бельгийском IMEC сейчас активно создается рассчитанная на долгосрочное применение платформа для разработки ASIC. Не отстают и российские разработчики — в дорожной карте НИИСИ РАН на будущий год значится выход радстойкого процессора на 65 нм, а публикации на эту тему говорят о создании платформы разработки, то есть у этих проектных норм большое будущее не только в Европе, но и в России.
И даже на этом уровне проектных норм развитие радстойкой электроники не останавливается — если посмотреть в свежие номера IEEE Transactions on Nuclear Science, там можно найти достаточно работ по изучению транзисторов с проектными нормами 20-16-14 нм, подготавливающих почву для новых поколений космических микропроцессоров. На таких проектных нормах разработчиков ожидает много нового и интересного: во-первых, нельзя сделать кольцевые транзисторы, во-вторых, в FinFET совсем другая геометрия канала и изоляции, в-третьих, есть FDSOI-технологии, в которых тоже достаточно специфики.
Уменьшение проектных норм, безусловно, влияет на радиационную стойкость изготавливаемых на них микросхем, но вовсе не обязательно в худшую сторону. Общий тренд состоит в том, что со снижением проектных норм влияние полной дозы уменьшается, а одиночных эффектов увеличивается. Сдвиг порогового напряжения в проектных нормах 180 нм и ниже измеряется в единицах или десятках милливольт даже для больших доз: подзатворный оксид такой тонкий, что накапливающийся в нем заряд туннелирует в канал вместо того, чтобы накапливаться. Переходной слой в технологиях с изоляцией STI достаточно компактный, что позволяет во многих случаях обеспечить низкие утечки при полной дозе в несколько десятков или даже сотен крад(Si). А если применить в глубоко субмикронной объемной технологии кольцевые транзисторы и охранные кольца, то мы разом избавимся от всех дозовых проблем.
Рисунок 8. Примеры радиационностойких элементов AND разработки компании «Миландр» на технологии SOI BCD.
На рисунке 8 — два варианта реализации одного и того же логического элемента AND для разных условий. Слева мы видим полный фарш — кольцевые транзисторы в индивидуальных охранных кольцах. Справа — вариант попроще, для низкой полной дозы: транзисторы линейные, вместо охранных колец только хорошие контакты в земле. И в обоих случаях диэлектрическая изоляция n-канальных транзисторов от p-канальных, чтобы обезопасить микросхему от тиристорного эффекта. В объемной технологии эту функцию выполняют охранные кольца. При этом надо отметить, что для многих космических применений вполне достаточно стойкости к полной дозе на уровне 50-100 крад(Si), и линейные транзисторы прекрасно с этим справляются, не требуя существенно ухудшать функциональные параметры схемы ради достижения стойкости.
С одиночными сбоями ситуация такая: приблизительный диаметр области, из которой идет сбор заряда при попадании одиночной частицы — порядка одного микрона, то есть больше размеров ячейки памяти, выполненной по глубоко субмикронным проектным нормам. И действительно, экспериментально обнаруживаются так называемые множественные сбои, когда одна частица вызывает переключение сразу нескольких бит. Более того, с уменьшением проектных норм уменьшается и энергия, необходимая для переключения бита памяти, то есть к сбоям приводит большее количество попаданий, чем для чипов, выполненных по более грубым проектным нормам. В том числе — попадание альфа-частиц из радиоактивных примесей в конструкционных материалах.
Рисунок 9. Сравнение количества сбоев от попадания одиночной частицы для двух разных вариантов 6T SRAM в технологии с проектными нормами 65 нм. Источник — А. Балбеков и др., «Вопросы применимости СБИС по 65 нм КМОП технологии в условиях воздействия факторов космического пространства».
На рисунке 9 изображены экспериментальные данные по одиночным сбоям в объемной технологии 65 нм. Слева — обычная 6T-SRAM. Десять сбоев от одного попадания! От такого код Хэмминга вас не защитит. Так что, если мы говорим о коммерческих микросхемах, то на грубых проектных нормах с одиночными сбоями все будет несколько лучше, чем на тонких. По крайней мере, они останутся одиночными, и их будет реально исправить при помощи кодирования. Но если микросхема специально создается для космических применений, то в арсенале разработчика есть огромное количество архитектурных, схемных и топологических решений, способных обеспечить высокую стойкость одновременно с высокой производительностью. В правой части рисунка — тоже 6T-SRAM, с точно такой же электрической схемой, но с другой топологией. Цена улучшений, убирающих множественные сбои, тиристорный эффект и повышающих стойкость к полной дозе — четырехкратный рост площади. Звучит не очень приятно, но никто не говорил, что будет легко. Тем не менее, Radiation Hardening by Design работает и позволяет достигать заранее заданных показателей стойкости на маленьких проектных нормах на любой объемной технологии.
Почему заранее заданных? Потому что достижение разных уровней стойкости требует применения разных методов ее повышения, и для каждой технологии и технического задания нужный набор методов свой. Тогда почему бы не применять все сразу, чтобы точно было хорошо? Потому что достижение радиационной стойкости всегда происходит за счет ухудшения функциональных параметров (энергопотребления, площади кристалла, скорости и т.д.), а они являются первым приоритетом. Именно поэтому нужны четкие требования технического задания, как по функциональности, так и по стойкости. Правда, микросхемы не так часто делаются для решения одной-единственной задачи, особенно радстойкие, у которых тираж для каждого из имеющихся применений может составлять несколько десятков штук. Но все же хорошее понимание требований позволяет, например, не использовать кольцевые транзисторы, сильно увеличивающие площадь и ток потребления, и получать в итоге более конкурентоспособные продукты.
Глаз внимательного читателя наверняка зацепился за слово «объемной» во фразе «заранее заданных показателей стойкости на маленьких проектных нормах на любой объемной технологии». Не лишнее ли оно там? Всем же известно, что радстойкие микросхемы нужно делать на технологии «кремний на изоляторе» или «кремний на сапфире».
Кремний на изоляторе
За технологией «кремний на изоляторе» давно и прочно закрепилась слава радиационностойкой. Корни этого популярного заблуждения уходят в седую древность, когда предшественник КНИ, кремний на сапфире, активно использовался для военных разработок. Почему? Транзисторы в такой технологии электрически отделены друг от друга и, что более важно, от подложки. Это означает, что область сбора радиационно-индуцированного заряда при кратковременном воздействии на чип излучения с высокой мощностью дозы, будет маленькой. Это, в свою очередь, существенно уменьшает время потери работоспособности — то, что нужно для работы в условиях атомной войны. И действительно, никакого другого метода снижения времени потери работоспособности, кроме полной диэлектрической изоляции, не существует.
Вторая важная часть мифа «КНИ = радстойкость» — это устойчивость к тиристорному эффекту, в том числе при воздействии с высокой мощностью дозы. Тиристорный эффект или «защелка» — чуть ли не главная головная боль разработчиков микросхем и приборов для космоса, и неудивительно, что технология, позволяющая от него избавиться, заслужила славу радиационностойкой. Но на самом деле ситуация опять несколько сложнее.
Рисунок 10. Сечение объемной КМОП-технологии с паразитным тиристором.
Причина возникновения тиристорного эффекта — паразитная тиристорная структура, присутствующая внутри элементов объемной КМОП-технологии. Если сопротивления Rs и Rw достаточно велики, то эта тиристорная структура при попадании заряженной частицы может открыться и закоротить землю чипа с питанием, что, сами понимаете, нехорошо. Насколько велики эти сопротивления в реальных микросхемах? Ответ на этот вопрос довольно прост: контакт к подложке или карману — это лишняя площадь, поэтому их количество стараются минимизировать. А это, в свою очередь значит, что по умолчанию тиристорный эффект в «обычной» микросхеме скорее будет, чем нет. Правда, тиристорный эффект может случиться не только от радиации, но и при воздействии, например, электростатического разряда или даже просто от повышенной температуры и большой плотности тока при неудачной топологии. В «обычных» применениях с тиристорным эффектом сталкиваются производители силовой и автомобильной электроники.
В значительной части космических систем вполне допустима перезагрузка в случае непредвиденных обстоятельств, то есть можно попробовать применить подверженный «защелке» чип, поставив в линию питания схему контроля тока потребления и сброса питания при превышении нормы. Это, собственно, регулярно и делается в ситуациях, когда очень надо применить высокопроизводительную коммерческую микросхему, а чипы защиты от тиристорного эффекта (Latchup Current Limiter) — довольно популярный радстойкий продукт. Но у такого решения есть много ограничений. Сбросить питание можно не везде и не всегда, перезагрузка в процессе выполнения важного маневра способна поставить крест на длительной миссии. Ток потребления современной микросхемы может различаться во много раз в зависимости от режима ее работы, то есть потребление в режиме «ничего не происходит и есть защелка» может быть меньше, чем в случае штатной работы в другом режиме. На какой уровень ставить ограничение тока? Тоже непонятно. Время, за которое нужно успеть отключить питание и предотвратить разрушение чипа, зависит от множества факторов, в том числе от конкретной микросхемы. Где-то можно никуда не спешить и сбрасывать питание столько раз, сколько будет нужно, а где-то уже после первого-второго раза чип все равно необратимо сгорает.
В микросхеме, выполненной по технологии КНИ, тиристорного эффекта не может быть в принципе, потому что все транзисторы электрически разделены. И самое лучшее — то, что для достижения стойкости к тиристорному эффекту не надо делать вообще ничего. То есть, коммерческие микросхемы, выполненные по технологии КНИ, тоже абсолютно устойчивы к нему, что сильно облегчает их применение в космосе. Так, например, коммерческий КНИ процессор будет управлять новым американским космическим кораблем «Орион».
Рисунок 11. Радиационно-индуцированные утечки в объемной КМОП-технологии. Источник — J. Schwank et.al., «Radiation effects in MOS oxides», IEEE TNS, Vol. 55, No. 4, 2008
В чем проблема? В том, что, кроме эффектов мощности дозы и «защелки», есть еще одиночные сбои и полная поглощенная доза, с которыми у КНИ-технологии все далеко не так радужно. На рисунке показаны два пути утечки в объемной КМОП-технологии. Оба этих пути легко закрываются при правильном топологическом проектировании — один использованием кольцевых n-канальных транзисторов, второй — при помощи охранных колец. Эти решения имеют недостатки с точки зрения функционирования схемы (ограничения на минимальный размер кольцевого транзистора, потери площади при использовании охранных колец), но с точки зрения обеспечения радиационной стойкости они очень эффективны.
Рисунок 12. Дополнительный механизм утечки в КНИ технологии.
В технологии КНИ есть еще один путь утечки из истока в сток по границе кремния и скрытого оксида. Скрытый оксид намного толще подзатворного, а значит, в нем может накопиться много положительного заряда. Если мы рассмотрим «нижний» транзистор (правая часть рисунка 12), для которого скрытый оксид является подзатворным, то увидим, что в нормальной ситуации напряжение «исток-затвор» этого транзистора — ноль, а его пороговое напряжение — несколько десятков Вольт, то есть ток через этот транзистор не течет. При облучении в скрытом оксиде накапливается положительный заряд (на этот процесс влияет геометрия основного транзистора, в частности — толщина приборного слоя кремния), и пороговое напряжение «нижнего» n-канального транзистора падает. Как только оно падает ниже нуля, ток начинает свободно течь через транзистор по неуправляемому нижнему каналу. Таким образом, с точки зрения полной поглощенной дозы технология КНИ принципиально строго хуже объемной технологии. Но, может быть, есть способ как-то исправить положение?
Обычно подложка микросхемы заземлена, но ведь в КНИ нам ничего не мешает подать на нее не землю, а отрицательное напряжение и таким образом закрыть нижний транзистор? С одной стороны, идея здравая и она активно используется. Причем в случае с полностью обедненным КНИ (FDSOI) и нормами 45-28 нм контроль потенциала под скрытым оксидом используется и при нормальном функционировании. С другой стороны, электрическое поле в скрытом оксиде не только закрывает паразитный транзистор, но и ускоряет накопление положительного заряда в скрытом оксиде. В итоге, в зависимости от параметров техпроцесса и величины приложенного отрицательного напряжения, дозовая стойкость микросхемы с поданным на подложку отрицательным напряжением может не только не улучшиться, но и стать хуже! Дальше, как это обычно водится, есть тонкости, но принципиально ситуация состоит в том, что топологические и схемотехнические методы на объемной технологии позволяют добиться практически любых разумных уровней стойкости к полной дозе, и под «разумными уровнями» я здесь понимаю, скажем 100 Мрад(Si). На КНИ же существуют фундаментальные ограничения, и уровень стойкости конкретного техпроцесса может быть достаточно низким. Обойти эти ограничения без вмешательства в технологию (обычно недоступного из коммерческих соображений) никак нельзя, и узнать параметры дозовой стойкости без дорогостоящих испытаний тоже не получится.
Ничуть не менее интересна и ситуация с одиночными сбоями в КНИ. С одной стороны, в КНИ гораздо меньше объем, из которого собирается выделившийся при попадании ионизирующей частицы заряд (хотя насчет точной формы этого объема много лет идут споры между ведущими учеными). С другой стороны, подзатворная область («тело») КНИ МОП транзистора настолько мала, что попадание в нее даже небольшого заряда способно существенно поднять напряжение в ней. Если напряжение поднимется достаточно высоко для открывания pn-перехода исток-тело, то включится паразитный биполярный транзистор исток-тело-сток, и заряд, внесенный ионизирующей частицей, умножится на коэффициент усиления этого транзистора. На практике это означает падение пороговой ЛПЭ до уровней ниже 1 МэВ*см^2/(мг), то есть к сбою приводит попадание в микросхему чего угодно. Конечно же, с паразитным тиристорным эффектом в КНИ можно справиться — присоединив подзатворную область к истоку транзистора или к земле/питанию. Но, во-первых, этого никто не делает в коммерческих микросхемах (потому что нет необходимости), а во-вторых, контакт к телу — это потеря площади, особенно чувствительная для ключей, где он должен быть независимым. В каждой ячейке кэш-памяти как минимум два ключа, что приводит к значительному росту площади кэша и кристалла в целом. В то же самое время в объемной технологии для подавления тиристорного эффекта и паразитного биполярного эффекта может быть достаточно одного контакта на 4-8 ячеек памяти, да и даже охранные кольца можно сделать с меньшими потерями площади, чем на контакты к телу транзистора в КНИ. Важным преимуществом КНИ в глубоко субмикронных технологиях является то, что диэлектрическая изоляция предотвращает распространение заряда и множественные сбои с большой кратностью, которые могут появляться в объемной технологии. Однако, размер трека ионизирующей частицы как минимум сравним с размерами ячейки памяти, так что двойные сбои в КНИ вполне себе регистрируются.
Итого ситуация с радиационной стойкостью технологии «кремний на изоляторе» выглядит таким образом, что она не «радиационно стойкая сама по себе», а имеет ряд преимуществ и ряд недостатков относительно объемной технологии. Часть недостатков КНИ можно обойти при помощи специальных приемов проектирования, но то же самое можно сделать и в объемной технологии. Поэтому при выборе коммерческой микросхемы для использования в условиях воздействия радиации нельзя полагаться на КНИ как на панацею, а при выборе технологии для разработки специализированной радстойкой СБИС надо тщательно взвешивать все «за» и «против» КНИ и объемной технологии для решения конкретной задачи и обеспечения требуемых уровней стойкости к различным радиационным эффектам.
Заключение
Над обеспечением радиационной стойкости интегральных микросхем работают сотни тысяч специалистов по всему миру, и объять необъятное одной научно-популярной статьей невозможно. Да это и тема не для статьи и даже не для диссертации. Во всяком случае, не для кандидатской диссертации. В силу специфики формата, коллеги-специалисты найдут здесь достаточно упрощений, неточностей и может даже фактических ошибок. Хотелось бы, чтобы нет, но сообщения о необходимых правках принимаются в личку. Не претендуя на полноту и новизну, я надеюсь, что справился с тем, чтобы наглядно описать самые популярные связанные с радиационной стойкостью вопросы и заблуждения, а также донести до читателя мысль, что микроэлектроника вообще и космическая микроэлектроника в частности — одна из самых быстро прогрессирующих областей науки и техники, поэтому проверенные временем знания и стереотипы на поверку часто оказываются устаревшими, неполными или неправильными, а простые и очевидные рецепты никто не использует, потому что на самом деле их не существует.