Отказоустойчивость хранилища данных

Бэкенд-система хранения EVS использует тройное резервирование для повышения отказоустойчивости и производительности.

С этой технологией одна часть данных разбивается на несколько блоков по 1 МиБ. Блоки с данными хранятся в виде множественных копий, которые распределяются между несколькими узлами хранения, что позволяет повысить надежность хранения.

Например, для блока с данными P1 на физическом диске А сервера А система хранения выполняет резервное копирование этих данных на P1" на физический диск B сервера B и на P1' на физический диск C сервера C. Блоки с данными P1, P1' и P1" являются тремя копиями одного и того же блока с данными. Если физический диск А, на котором находится P1, неисправен, P1' и P1" могут продолжать хранить данные, обеспечивая непрерывность обслуживания.

../_images/schm__raid.svg

Как тройное резервирование обеспечивает консистентность данных?

Консистентность данных включает в себя два аспекта:

  • Когда приложение записывает часть данных в систему, три копии данных в системе хранения должны быть согласованы.

  • Когда приложение позже считывает любую из трех копий, данные в этой копии согласуются с ранее записанными в нее данными.

Тройное резервирование обеспечивает консистентность данных следующими способами:

  • Когда приложение записывает данные, система хранения записывает их одновременно в три копии данных. Кроме того, система возвращает приложению ответ об успешной записи только после того, как данные будут записаны во все три копии.

  • Когда приложению не удается прочитать данные, система автоматически определяет причину сбоя. Если данные не могут быть прочитаны из сектора физического диска, система считывает данные из другой копии данных на другом узле и записывает их обратно в исходный сектор диска. Это обеспечивает правильное количество копий данных и их консистентность.

Как с помощью тройного резервирования можно быстро восстановить данные?

Каждый физический диск в системе хранит несколько блоков с данными, копии которых распределены на узлах в системе. При обнаружении сбоя физического сервера или диска система хранения автоматически восстанавливает данные. Поскольку копии блоков с данными распределены по разным узлам, система хранения начнет перестроение данных на нескольких узлах одновременно во время восстановления данных с небольшим объемом данных на каждом узле. Таким образом, система устраняет потенциальные узкие места производительности, которые могут возникнуть, когда большой объем данных необходимо перестроить на одном узле, и, следовательно, сводит к минимуму неблагоприятное воздействие, оказываемое на приложения верхнего уровня.

../_images/schm__raid2.svg
Запустили Evolution free tier
для Dev & Test
Получить