Инструментирование пост-кремниевой валидации. Инновации в проверке

Переиздано Платоном

Читают: 0

Инструментирование пост-кремниевой проверки — не новая идея, но здесь есть неожиданный поворот. Использование (до-кремниевой) эмуляции для выбора структур наблюдения отладки для инструментирования в кристалле. Пол Каннингем (GM, Verification в Cadence), Рауль Кампосано (Silicon Catalyst, предприниматель, бывший технический директор Synopsys) и я продолжаем серию статей об исследовательских идеях. Как всегда, обратная связь приветствуется.

Инструментарий посткремниевой проверки

Инновация

Выбор в этом месяце Инфраструктура эмуляции для оценки аппаратных утверждений для пост-кремниевой проверки. Этот документ был представлен на конференции IEEE Transactions on VLSI 2017 года. Авторы из Университета Макмастера, Гамильтон, Онтарио, Канада.

Авторы различают логические и электрические пост-кремниевые ошибки и в этой статье уделяют внимание электрическим ошибкам, обнаруживаемым посредством перестановки битов на флопах. Их подход заключается в определении оптимального набора утверждений в докремниевом анализе. Затем они реализуют их в кристалле для поддержки пост-кремниевой отладки. Докремниевый анализ аналогичен ошибкам в анализе безопасности: внесение ошибок на флопах соответствует электрическим ошибкам, как намекает в статье. Они генерируют список кандидатов утверждений, используя синтез утверждений; Суть их инноваций заключается в том, чтобы предоставить метод классификации этих утверждений по тому, насколько эффективно каждое из них обнаруживает множественные ошибки.

Генерация входных данных является случайной, при этом вносимые неисправности (рассматриваемые как переходные) анализируются последовательно. Они допускают указанное пользователем количество циклов обнаружения каждой неисправности. На следующем этапе они измеряют эффективность, используя два разных метода охвата. Для покрытия триггера они засчитывают утверждение, если оно обнаруживает введенную ошибку на любом флопе. При покрытии с переворотом битов они оценивают количество ошибок, обнаруженных на отдельных флопах. Эти метрики вместе с оценками площади они используют (поочередно) для выбора предпочтительных утверждений.

Взгляд Павла

Эта бумага прекрасно сочетается с нашей Блог за август 2020 г. о быстром обнаружении ошибок (КЭД). QED ускоряет обнаружение функциональных ошибок в пост-кремниевых устройствах, и этот блог посвящен обнаружению электрических ошибок в пост-кремниевых устройствах. Статью легко читать, хотя полезно сначала прочитать ссылку [23].

Электрические неисправности трудно обнаружить, и даже в этом случае их трудно воспроизвести и найти основную физическую причину. Авторы предлагают метод с помощью встроенной логики, позволяющий обнаружить, когда такие ошибки приводят к перевороту флопа на неправильное значение (они не копают глубже, чем находят эти перевороты).

Суть статьи и сопутствующей ссылки [23] — это многоэтапный метод создания и синтеза этой логики обнаружения. Он начинается с анализа свойств проекта как временных утверждений с использованием Инструмент GoldMine. Они ранжируют утверждения на основе оценки их способности обнаруживать перевороты битов и оценки площади/стоимости проводки для реализации в кремнии. Ранжирование основано на выполнении множества предварительных симуляций с утверждениями-кандидатами, введении ошибок переворота битов и подсчете обнаруженных переворотов по утверждениям. В исходной статье они использовали логическое моделирование, здесь они ускоряют это моделирование, отображая проект на плате Altera FPGA.

Мне нравится, как они объединили несколько инноваций в единый метод обнаружения переворота битов после кремния: интеллектуальный анализ утверждений, синтез утверждений и элегантную функцию ранжирования для выбора утверждений. Однако в разделе результатов статьи указано, что обнаружение смены битов в n% триггеров требует примерно n% увеличения площади проектирования. Это кажется сложной задачей для коммерческого применения, тем более что это помогает только находить электрические неисправности. Потенциально можно было бы достичь аналогичного результата, клонировав логический конус, управляющий триггером, а затем сравнить выходные данные этой клонированной логики с исходной логикой. Казалось бы, это генерирует те же издержки области, что и их метод, в пределе клонирования всего проекта (т. е. 100% служебных данных области) для обнаружения флипов в 100% флопов в проекте.

Взгляд Рауля

Статья самостоятельная и содержит достаточное количество деталей. Авторы провели эксперименты на трех последовательных схемах ISCAS (около 3К вентилей, 12 FF). Подготовительные эксперименты вводят 2000 ошибок за один триггер и используют все утверждения, сгенерированные GoldMine. Из-за ограниченности возможностей ПЛИС авторы разделили прогоны до 256 «сессий» на одну схему. Результаты показывают, что даже при 45 сеансах ускорение анализа по сравнению с моделированием в 45–20 раз (только до 500 ошибок, поскольку моделирование становится слишком медленным, 8 часов). Максимально достижимое покрытие триггеров составляет 105%, 55% и 89% для трех контуров. Количество добытых утверждений контролирует покрытие.

Выполнение с выбранными утверждениями (соответствующими служебным нагрузкам области 5–50 %) и 1–256 инъекций приводит к покрытию битов 2.2–34 %. Большую часть времени майнер утверждений работал 228 часов. Одна вещь, которая меня смутила, — это их данные о времени выполнения и внесенных ошибках. При моделировании увеличение выглядит разумным (линейным). Но в эмуляции оно резко возрастает: с 0.045 часа до 5.4 часа, что приводит к увеличению количества ошибок от 2 до 8. Я хотел бы получить больше объяснений по этому поводу.

Это методический документ. Мне нравится, что почти каждый шаг можно заменить коммерческим инструментом. Вместе с использованием большой платы FPGA (в качестве эмулятора) методология масштабируется. Методологии, конечно, очень сложно коммерциализировать, но это хорошее применение для существующих технологий!

Мой взгляд

Метод изучения техники анализа безопасности для пост-кремниевой отладки интригует. Новая идея, хотя и приводит к несколько непрактичному результату для коммерческого применения.

Поделитесь этим постом через: Источник: https://semiwiki.com/artificial-intelligence/301350-instrumenting-post-silicon-validation/

Отметка времени: Июль 28, 2021