ram may be vulnerable to high frequency row hammer bit flips что это значит
Тестирование модулей памяти компьютера и загрузочная флешка с утилитой memtest86
После установки в моноблок Dell XPS 2720 модулей памяти Patriot, приобретённых в США, конечно же первым делом решил их протестировать. В Dell XPS 2720 при загрузке достаточно нажать F12, после чего выбрать диагностическую утилиту (Diagnostics), позволяющую тщательно протестировать данный моноблок, в том числе его оперативную память.
Но для тестирования модулей памяти я предпочитаю использовать специализированную утилиту Memtest86. Поскольку на свои компьютеры устанавливаю Ubuntu Linux, то при загрузке ранее достаточно было выбрать в менеджере загрузки Grub соответствующий пункт меню с Memtest86. К сожалению, данный пункт стал отсутствовать на компьютерах с UEFI (так что даже если вы установите memtest86 или memtest86+ в Ubuntu, после чего откроете Grub, то данная утилита всё равно будет отсутствовать в менеджере загрузки).
Для использования Memtest86 на компьюетрах с UEFI придётся создавать загрузочную флешку (или загрузочный CD диск). Для начала нужно скачать архив для создания флешки (или CD) с memtest86.com/download.htm (хотя можно использовать не коммерческий продукт с бесплатными возможностями, а Memtest86+ с memtest.org, т.к. последний всегда был и будет бесплатным продуктом с открытым исходным кодом, в отличии от оригинального Memtest86, который сейчас управляется PassMark Software Pty Ltd).
Обратите внимание, что memtest86, начиная с версии v5 поддерживает только UEFI загрузку. Создавать такой загрузочный диск для старых систем без UEFI не стоит.
ZIP архив для создания флешки с сайта memtes86.com находится по ссылке «Image for creating bootable USB Drive», причём нужен вариант для вашей операционной. Архив нужно распаковать в отдельную папку.
В Ubuntu легко найти нужную флешку при помощи утилиты Disks или GParted. Но можно и набрать в терминале следующую команду, чтобы найти последнее используемое устройство:
sudo dd if=memtest86-usb.img of=/dev/sdc1
В Windows нужно запустить imageUSB.exe из распакованного архива, после чего выбрать букву диска, соответствующую флешке, и создать загрузочную флешку.
После создания загрузочной флешки нужно перезагрузить компьютер и выбрать нужную флешку при загрузке. В Dell XPS 2720 для этого нужно нажать при первоначальной загрузке компьютера клавишу F12. При этом в меню есть пункты загрузки с флешки с использованием UEFI (UEFI Boot: Flash Drive), а также с использованием BIOS (Legacy BIOS: Flash Drive). Я выбрал вариант с UEFI.
После запуска утилиты тестирования памяти memtest86 достаточно нажать кнопку S на клавиатуре, чтобы запустить тестирование.
По умолчанию memtest86 делает 4 повтора тестов, на каждый из которых у меня ушло минут 40. К счастью, при тестировании моих модулей памяти Patriot ошибок не было обнаружено.
Обновление (27 марта 2020 г.)
Модули памяти Patriot оказались вовсе не лучшим выбором. Чтобы выявить проблемный модуль памяти из двух, пришлось использовать memtest86. Оказалось что мемтест86 не позволяет указать, какой конкретно модуль сбоит. Оно просто выводит ошибку. Чтобы выявить, с каким модулем возникает проблема, пришлось тестировать их по очереди. Оказалось, что только с одним модулем тест оканчивался с ошибками вроде «Test: 10 Addr: 2F6099188 Expecte: 00000000 Actual: 04000000 CPU: 0».
В основном ошибки возникают нечасто. Но неприятно, если компьютер виснет. Судя по всему, в жаркую погоду ситуация сильно ухудшается.
Что касается проблемного модуля памяти, то есть несколько вариантов, что с ним делать:
А вот что не рекомендуется делать, так это оставлять проблемный модуль памяти работать. Данные на накопитель в нужный момент могут не записаться. Да и банальное зависание никто не отменял.
Обновление (31 марта 2021 г.)
При тестировании модулей памяти стали появляться ошибки «RAM may be vulnerable to high frequency row hammer bit flips». На самом деле, это не самая страшная ошибка. Для домашнего использования особых проблем возникнуть не должно, поэтому вряд ли стоит менять модули памяти на новые. А вот при использовании с каким-нибудь критическим оборудованием вроде медицинского, можно поискать модули, для которых данная проблема не характерна. Но приобрести их не так просто.
MemTest тестирование памяти
При установке планок оперативной памяти на материнскую плату могут быть следующие ситуации:
— оперативная память вообще не совместима с данной материнской платой (контроллером) — ПК не стартует
— оперативная память частично совместима (китайские клоны) — ПК стартует, но при работе выход в синий экран
— в отдельных планках есть дефект — ПК стартует, но иногда при работе выход в синий экран
— только при нагреве (длительной работе) есть ошибки — выход в синий экран
Почему лучше использовать memtest, а не встроенное средство диагностики Win 7/8/10?
— Memtest умеет работать по кругу (бесконечно), т.е. можно выявить ошибки памяти, которые возникают из-за нагрева
— Memtest умеет себя перемещать внутри тестируемой памяти — ведь нам надо всю память протестировать, а там где-то «живет» сама программа, которая эту память тестирует 🙂
Программа предназначена только для обычной памяти. Следует понимать, что при работе серверной памяти ECC ошибочные сегменты просто исключаются из работы.
Основной сайт www.memtest.org (до 2013 года)
Сайт новой компании www.memtest86.com
Скачиваем, создаем загрузочную флешку (или CD/DVD, если не поддерживается загрузка с флешки), загружаемся.
Выбираем «1» — запуск по умолчанию (выбор 2 — однократный проход). На текущий момент последняя версия — 5.01 (от 2013 г.).
Компания была куплена PassMark — вот тут совсем свежее v7.2 (в состав включена v4 для старых ПК) http://www.memtest86.com/download.htm
В ходе проверки программа запускает следующие тесты (для v7.2):
Test 0 | [Address test, walking ones, no cache] | тест для определения проблем с адресацией памяти |
Test 1 | [Address test, own address, Sequential] | более углубленный тест для определения проблем с адресацией памяти |
Test 2 | [Address test, own address, Parallel] | проверяет в быстром режиме аппаратную часть памяти. Тестирование происходит параллельно с использованием всех процессоров. |
Test 3 | [Moving inversions, ones&zeros, Parallel] | тестирует в быстром режиме аппаратную часть памяти. Использует 8-ми битный алгоритм. |
Test 4 | [Moving inversions, 8 bit pattern] | быстрая проверка на аппаратные или трудноуловимые ошибки, только используется 8 битный алгоритм прохода нулей и единиц |
Test 5 | [Moving inversions, random pattern] | тест для поиска проблем в схемах памяти |
Test 6 | [Block move, 64 moves] | эффективен для определения data sensitive errors |
Test 7 | [Moving inversions, 32 bit pattern] | находит ошибки памяти в процессе записи |
Test 8 | [Random number sequence] | тест, проверяющий ошибки записи памяти. |
Test 9 | [Modulo 20, Random pattern] | детальный тест, который проверяет кеш-память |
Test 10 | [Bit fade test, 2 patterns] | особый тест, который можно запустить вручную. Запоминает адреса в памяти, после чего засыпает на полтора часа. После этого проверяет не изменились ли биты в адресах. Требует 3 часа для прохождения через меню конфигурации (клавиша C). |
Test 11 | [Random number sequence, 64-bit] | сканирует ошибки кеш используя собственные 64-разрядные инструкции. |
Test 12 | [Random number sequence, 128-bit] | сканирует ошибки кеш используя собственные 128-битные инструкции. |
Test 13 | [Hammer Test] | детально сканирует систему для выявления глобальных проблем с памятью. |
Вот здесь более детально про тесты v7.2 (на английском языке) http://www.memtest86.com/technical.htm
Программа работает по кругу, один проход — pass. Рекомендуется запускать на ночь (6-8 часов), как раз планки памяти нагреются, пройдет порядка 10-15 проходов. Если ошибок нет — значит с памятью все в порядке.
История версий — с официального сайта:
Enhancements in v4.20 :
Enhancements in v4.10 :
Enhancements in v4.00 :
PS : Memtest86+ «3.00» was skipped and renamed 4.00 in order to avoid confusion with the original Memtest.
Enhancements in v2.11 :
Enhancements in v2.10 :
Enhancements in v2.01 :
Enhancements in v2.00 :
Вы можете сохранить ссылку на эту страницу себе на компьютер в виде htm файла
Row hammer: причина сбоев DDR3
Недавно был обнаружен новый механизм сбоев DDR3 памяти и его удачно назвали Row hammer. Сбой происходит когда большое количество активаций некой строки памяти влияет на заряд конденсаторов близлежащих строк вплоть до изменения логического состояния битов в ней. Активации «выбивают» заряд. Картинка — Marc Greenberg
Спецификации DDR3 никак не запрещают row hammering, и производители никак не тестируют свои микросхемы на предмет появления этого эффекта, хотя, очевидно, что он существенен. Вот, к примеру, код:
Вполне может повлиять на содержимое памяти даже не принадлежащей текущему процессу. Самое интересное, что тесты памяти которые используются сейчас не могут найти такие ошибки.
ECC тут тоже не особо поможет. Дело в том, что ECC (кроме того, что дорогой и медленный) может исправить ошибку всего в 1 бит. А когда происходит Row hammering портится вся строка. Скорее-всего, при этом контроллер просто обнаружит ошибку, а дальше все будет зависеть от того, как эта ошибка обработается.
А почему-же мы не видим этой ошибки каждый день, работая за компьютером? Дело в том, что в современных процессорах есть кэш и ячейка памяти к которой необходим постоянный доступ просто «переносятся» во внутреннюю SRAM процессора. А вот если вы разрабатываете систему с ПЛИС, где непосредственно управляете контроллером памяти, то придется задуматься, как бы избежать этой проблемы. Самое очевидное решение — перенести память к которой будет постоянный доступ во внутреннюю память ПЛИС или во внешний SRAM.
Вот видео от производителя девайса для обнаружения Row hammer:
Железо: решение проблем
Имеется БП на 600 ватт. В принципе все устраивает, но после того как поменял систему на новую (и более тихую), оказалось, что вентилятор БП самый шумный компонент в системе. БП остался от старой системы. Вопросы:
2. Новый вентиль присмотрел, но был бы рад выслушать рекомендации.
з.ы. Смазать\почистить не предлагать ибо уже. Я бы возможно и вообще БП поменял, но пока жаба душит.
2. Новый вентиль присмотрел, но был бы рад выслушать рекомендации.
может не тем смазывал, там разница колоссальна
Другой марки, но примерно тем же самым, я так полагаю, что он шумным был изначально, просто я за ревом турбины и процессорного кулера не обращал внимания. Корпус с шумкой конечно демпфирует, но отнюдь не идеально.
Имеется БП на 600 ватт. В принципе все устраивает, но после того как поменял систему на новую (и более тихую), оказалось, что вентилятор БП самый шумный компонент в системе.
В общем заменил вентилятор. Посмотрел на старый, оказывается у него вал ходуном ходил. Соответственно шум и вибрация даже на малых оборотах.
Сейчас выключил пк, подожду, может в нём остынет что-нибудь и проблема исчезнет)
Всем доброго вечера, после включения компа, прога HDS выдала сообщение что мол здоровье ssd диска Samsung 860 evo 256гб, после 200 дней работы, 98%, стоит задуматься или ничего страшного (диск для системы ну и пара игр которые включаю крайне редко, пару раз в месяц)?
Всем доброго вечера, после включения компа, прога HDS выдала сообщение что мол здоровье ssd диска Samsung 860 evo 256гб, после 200 дней работы, 98%, стоит задуматься или ничего страшного (диск для системы ну и пара игр которые включаю крайне редко, пару раз в месяц)?
Тут такое дело, примерно после 150 дней стало показывать 98% здоровья, в саппорте сказали что это еще рано беспокоится.
Теперь после овер 500 дней Hard Disk Sentinel показывает 99% здоровья, а CrystalDiskInfo показывает 100% здоровья. Вот и думай что тут к чему.
А замена резистора? Естественно, это вмешательство в конструкцию платы*. Гарантийки летели и по причине царапины, не говоря о модернизации.
*Кроме отдельных, оговоренных производителем случаев.
Кстати, а почему не поменять его по гарантии?
Кстати, а почему не поменять его по гарантии?
Купите на алике точно такой же да поменяйте. Вообще проблем не вижу и не понимаю, откуда возник вопрос о гарантии. Или у вас все детали на карте пломбами обклеены?
У меня так 570ая сгорела. Не мониторил температуру а там две из трех вертушек отъехали. так что лучше не тянуть с этим
Можно перенести всю папку «Мои Документы» на другой диск. Это самое простое.
Заходишь в свою учётку, в проводнике. Находишь там папку «Мои документы». В её свойствах в разделе «Местоположение» указываешь другой путь.
Вот эту папку по вышеуказанному принципу тоже надо будет перенести на другой раздел\винт.
У меня так 570ая сгорела. Не мониторил температуру а там две из трех вертушек отъехали. так что лучше не тянуть с этим
Но я всё же планирую периодически проверять, не сдох ли опять.
Можно перенести всю папку «Мои Документы» на другой диск. Это самое простое.
Лучше профиль целиком. Только на сетевой нежелательно.
Нормальный ли СМАРТ у харда?
Ему лет 11-12, стали что-то часто игры фризить с него, а на ссд нормально.
Из последних фризы в метро исход и фар край 5 и нью даун.
АОТ: У меня такой вопрос. Вчера два раза ось вылетела в синий экран с ошибкой 7b. Сейчас проверяю память мемтестом, идёт 13-й тест, найдено пока 21 ошибка. Не знаю, что там дальше будет. О, уже 22. В общем, может завязать уже, а то почти полтора часа прошло, да и заказывать новую память? Всё равно набор буду брать, так что не особо волнует, с какой из двух проблемы. Хм, пока писал, уже 24 ошибки.
Upd: на первой планке 27 ошибок. Началось тестирование второй.
Один момент вызывает сомнение. По спецификации должно быть 10-10-10-27, а прога определяет как 9-9-9-27. В биосе я ничего не менял. Может, материнка некорректно тайминги выставила? И с чего бы это вдруг? Ведь всё нормально же было до этого.
К тому же, прога пишет: RAM may be vulnerable to high frequency row hammer bit flips.
Не знаю, так ли уж критично повышены тайминги, что так много ошибок.
На второй планке пока ни одной ошибки на тех же таймингах, идёт 5-й тест. Первая после двух тестов уже 3 ошибки казала.
Upd2: блин, сглазил, моментально 15 ошибок выскочило.
Подожду окончания теста, потом схожу в биос, выставлю правильные тайминги, если нужно.
А там видно будет.
Из последних фризы в метро исход и фар край 5 и нью даун.
Сейчас современные игрушки на хард никто не ставит по хорошему, иначе есть вероятность столкнуться с проблемами.
Сейчас проверяю память мемтестом, идёт 13-й тест, найдено пока 21 ошибка. Не знаю, что там дальше будет.
Насколько мы поняли, вы используете блокировщик рекламы в вашем браузере. Скорее всего, это AdBlock или AdBlock Plus.
Учитывая, сколько агрессивной рекламы можно встретить на различных сайтах, это, возможно, и оправданно.
Однако Riot Pixels — пока ещё небольшой сайт, мы существуем в основном на деньги, получаемые от различных рекламодателей. Пользователей же с установленным AB/ABP на Riot Pixels сейчас — более 30%. Это очень много.
У блокировщиков рекламы есть еще одно плохое свойство — у вас может «поехать» дизайн или перестанут показываться скриншоты.
Мы не хотим предпринимать активных действий в отношении блокировщиков рекламы (например, закрывать контент) — это не по-человечески. Однако и безучастно смотреть никак не можем. Поэтому у нас к вам большая просьба — пожалуйста, внесите Riot Pixels в «белый список» вашего блокировщика. Это поможет нам и дальше жить и развиваться, а вам ничего не будет стоить.
Announcement
[Note] RAM may be vulnerable to high frequency row hammer bit flips
I see this error (showing that max speed row hammer triggers errors, where a slower test does not). But it doesn’t show me any details (memory address, bits in error).
Improvement request: show these details even when showing the ‘partial’ warning note.
(using version 7.1, just downloaded)
The details (error address, bits, etc) of the row hammer errors are logged in the MemTest86.log file under the EFI\BOOT\ directory of the USB drive.
In the Pro version, you can also specify the ‘REPORTNUMWARN’ parameter in the configuration file to record the row hammer errors that occurred in the first pass (maximum hammer rate) but not the second pass (lower hammer rate).
Comment
The details (error address, bits, etc) of the row hammer errors are logged in the MemTest86.log file under the EFI\BOOT\ directory of the USB drive.
In the Pro version, you can also specify the ‘REPORTNUMWARN’ parameter in the configuration file to record the row hammer errors that occurred in the first pass (maximum hammer rate) but not the second pass (lower hammer rate).
That’s nice to know, but I usually run this from a cd (read only), or a read only flash drive. Also note that this can cover up more serious errors.
I stand on my request for improvement, show the details for this error on screen.
Also the other memtest (the one where the author is MIA) has a summary mode that shows bits in error and range and which test failed without needing to show each error. Any chance we can get an option similar to that in this memtest?
Comment
CD drives are nearly dead. Like the floppy drive before it, for which we have already dropped support. If you want the logs then don’t use a read only flash drive.
For normal errors the bit count is displayed on the screen. It is only for the row hammer warning we don’t display the details. (it is nearly always a random 1 bit error for row hammer in any case).
Comment
CD drives are nearly dead. Like the floppy drive before it, for which we have already dropped support. If you want the logs then don’t use a read only flash drive.
For normal errors the bit count is displayed on the screen. It is only for the row hammer warning we don’t display the details. (it is nearly always a random 1 bit error for row hammer in any case).
The thing that bothers me is that a computer that is out of its mind with bad ram (or might be, who knows, that’s why I’m testing it) will be mounting and writing to my filesystem I am using to test it. Right now I have a writeable flash drive which is no-longer bootable, did bad unmounts or ram corrupt it? Also, I have another EFI bootable partition on the drive, memtest decided to write most of it’s log to that partition rather than the partition memtest resides on.
Memtest isn’t going to write to my CD-R (disc closed), or create a new burn session by accident. My cd will always work unless I damage it.
Can we count the possibility of a bad unmounts, or mounting and writing to the filesystem while under the influence of bad ram as a bug in memtest 7.1? It’s not like you can tell me not to use memtest on a pc with bad ram.