ElasticSearch als noSQL Ersatz

ElasticSearch ist eine Suchmaschine basierend auf Apache Lucene. Sie ist extrem einfach in eigene Anwendungen integrierbar, erlaubt Echtzeitsuche und ist Cloud- und Cluster fähig.

Ist man mit ElasticSearch erst einmal warm geworden, fragt man sich, wieso man Daten in einer Datenbank ablegen soll, wenn möglicherweise nahezu alle Daten auch im Suchindex von ElasticSearch liegen.

Ist erst einmal klar, dass der Funktionsumfang von ElasticSearch die Datenbank komplett ersetzen kann, bleibt meist nur noch eine Frage offen:

Wie unterziehe ich ElasticSearch einem Backup, möglichst einem Hotbackup?

Meist wird der Index von Suchmaschinen als Sekundärdatenbestand angesehen – alle Daten existieren noch einmal in der Primärdatenbank. Der Index kann durch Re-Indexing aus der primären Datenquelle wieder hergestellt werden. Da kann man das Backup schon mal etwas lockerer sehen.

Wollen wir aber nun ElasticSearch als Primärdatenbank betreiben, gewinnt das Backup an Bedeutung.

Dieser Artikel zeigt die Einrichtung eines Hotbackups für ElasticSearch in einem speziellen, vielleicht aber auch typischen Scenario, wenn ElasticSearch als Ersatz für die konventionelle Datenbank geplant ist: 2 Maschinen im Cluster, Hot Standby oder auch balanced.

Wo sind die Daten?

ElasticSearch legt die Indexdateien in einem Verzeichnis ab, welches über das Konfigurationsproperty path.data festgelegt wird. Nun könnte man meinen, dass das Sichern dieses Verzeichnisses ausreicht, um eine ElasticSearch Instanz wieder herzustellen.

Doch es gibt noch einige Feinheiten zu beachten.

Gateways

ElasticSearch kennt verschiedene Methoden, Indexdaten zu persistieren. Dies sind als Gateways implementiert. Je nach Gateway werden die Daten anders im Cluster verteilt und strukturiert. Für unser Anliegen kommen nur 2 Gateways in Frage: local und fs ...

Zum vollständigen Artikel

Cookies helfen bei der Bereitstellung unserer Dienste. Durch die Nutzung erklären Sie sich mit der Cookie-Setzung einverstanden. Mehr OK