Страница 1 из 1

hadoop: методы backup'a

Добавлено: 15 май 2015, 11:10
skeletor
Всем привет.
Планирую поднимать кластер с общим хранилищем для метаданных через nfs, но в данном кластере слабое звено - это как раз NFS. Как можно бэкапить/дублировать это хранилище? Rsync+inotify может не спасти, так как там данные в бинарном формате.

Re: hadoop: методы backup'a

Добавлено: 15 май 2015, 13:49
Stranger03
skeletor писал(а):Всем привет.
Планирую поднимать кластер с общим хранилищем для метаданных через nfs, но в данном кластере слабое звено - это как раз NFS. Как можно бэкапить/дублировать это хранилище? Rsync+inotify может не спасти, так как там данные в бинарном формате.
Киев, Украина, мы ж для вас заклятые враги, агрессоры так сказать, :).

Re: hadoop: методы backup'a

Добавлено: 15 май 2015, 20:58
skeletor
Stranger03 писал(а):
skeletor писал(а):Всем привет.
Планирую поднимать кластер с общим хранилищем для метаданных через nfs, но в данном кластере слабое звено - это как раз NFS. Как можно бэкапить/дублировать это хранилище? Rsync+inotify может не спасти, так как там данные в бинарном формате.
Киев, Украина, мы ж для вас заклятые враги, агрессоры так сказать, :).
Конкретно вас, агрессора, я о помощи не просил :)

Re: hadoop: методы backup'a

Добавлено: 27 май 2015, 10:21
Stranger03
skeletor писал(а):Конкретно вас, агрессора, я о помощи не просил :)
:lol: :lol: :lol: :lol: :lol:

Re: hadoop: методы backup'a

Добавлено: 28 май 2015, 09:18
Stranger03
skeletor писал(а):Как можно бэкапить/дублировать это хранилище? Rsync+inotify может не спасти, так как там данные в бинарном формате.
Как я понимаю, хочется бесплатного решения? Нечто вроде Семантека?

Re: hadoop: методы backup'a

Добавлено: 28 май 2015, 09:23
skeletor
В общем случае да. Проблему решил методом дублирования NameNode, ResMan с использованием журнала. Конкретно так:
http://hadoop.apache.org/docs/r2.7.0/ha ... thQJM.html
http://hadoop.apache.org/docs/r2.7.0/ha ... gerHA.html

Re: hadoop: методы backup'a

Добавлено: 28 май 2015, 09:37
Stranger03
skeletor писал(а):В общем случае да. Проблему решил методом дублирования NameNode, ResMan с использованием журнала. Конкретно так:
http://hadoop.apache.org/docs/r2.7.0/ha ... thQJM.html
http://hadoop.apache.org/docs/r2.7.0/ha ... gerHA.html
Восстанавливать пробовали?

Re: hadoop: методы backup'a

Добавлено: 28 май 2015, 10:19
skeletor
Это не бэкап, а что-то наподобии кластера: при отпадании одной NN, RM автоматически выбирается резервный и становится главным. То есть единой точки отказа уже нет. Понятное дело, что там существуют свои ограничения (максимально только 2 NN, 2RM).

Re: hadoop: методы backup'a

Добавлено: 28 май 2015, 11:01
Stranger03
skeletor писал(а):Это не бэкап, а что-то наподобии кластера: при отпадании одной NN, RM автоматически выбирается резервный и становится главным. То есть единой точки отказа уже нет. Понятное дело, что там существуют свои ограничения (максимально только 2 NN, 2RM).
Ну я на своей практике видел столько падений самых разных систем, что ничто меня не убедит в отсутствии необходимости бекапа, :mrgreen:

Re: hadoop: методы backup'a

Добавлено: 28 май 2015, 11:02
Stranger03
skeletor
Да и изначальный вопрос был в бекапе схд, а не в построении кластера

Re: hadoop: методы backup'a

Добавлено: 28 май 2015, 11:04
skeletor
Нет. Изначальный вопрос был в дублировании слабого звена - NFS. Это как раз и является единой точкой отказа. Все остальные узлы - задублированы.

Re: hadoop: методы backup'a

Добавлено: 28 май 2015, 11:14
Stranger03
Ну это не я писал, да и тема "методы бекапа". Ну ладно, не суть, все равно ж я агрессор, :mrgreen:
skeletor писал(а):Как можно бэкапить/дублировать это хранилище?