RapidMiner mit OrientDB JDBC verbinden - Tutorial

Hier möchte ich euch kurz zeigen wie ihr OrientDB mit RapidMiner verbinden könnt. Der JDBC-Treiber ist zwar immer noch instabil aber reicht für erste Gehversuche auf jede Fälle aus. Eine Verbindung ist sehr einfach zu realisieren damit und das schauen wir uns nun einmal an. Die verwendete RapidMiner Version ist 5.3.015.

OrientDB herunterladen und kompilieren

Besucht zuerst die OrientDB-JDBC Github Webseite. Von hier ladet ihr euch das JDBC-Projekt herunter.

Nach dem Entpacken benötigt ihr nun Maven. Solltest du Maven noch nicht installiert haben dann findest du hier eine Anleitung dazu. Geht nun in das JDBC-Verzeichnis per Konsole. Dort tippt ihr dann mvn clean assembly:assembly ein. Nach Abschluss des Vorgangs solltet ihr dann folgende Ansicht bekommen.

OrientDB Server starten und Person anlegen

Damit RapidMiner Daten laden kann brauchen wir diese natürlich in OrientDB. Ich habe daher die Klasse Person erzeugt und einfach 4 Personen angelegt.

RapidMiner starten, JDBC Treiber laden und Verbindung speichern

Jetzt starten wir RapidMiner und wollen eine Verbindung zu OrientDB aufbauen. Dazu gehen wir auf Manage Database Drivers. Hier treffen wir die Einstellungen wie im Bild zu sehen. Achtet darauf, dass ihr die ...all.jar verwendet! Nachdem ihr auf Save klickt nicht vergessen RapidMiner neu zu starten! Externe Dateien werden nur bei einem Neustart geladen!

Im Anschluss legen wir noch eine Verbindung an. Das macht das Ganze später sehr komfortabel wenn ihr Operatoren nutzt. Dazu auf Tools und Manage Database Connections. Hier ist es wichtig, dass ihr beim Datenbank-Schema euren Datenbank-Namen einsetzt. Meine Datenbank heißt demnach test. Unten könnt ihr dann die Verbindung testen. Wenn die Connection ok ist könnt ihr weitermachen.

Prozess erstellen und Datenbank auslesen

Um die Verbindung zu OrientDB zu testen legen wir einen neuen Prozess an. Danach fügen wir einen Read Database Operator hinzu. Wir wählen auf diesem eine vordefinierte Verbindung(OrientDB) aus. Danach erstellen wir die Query SELECT name FROM Person.

Jetzt können wir den Prozess starten. Wir ihr sehen könnt, bekommen wir nun 4 Namen zurück, eben jene aus unserer OrientDB-Datenbank.

Fazit

Noch ist man mit dem OrientDB-JDBC Treiber sehr instabil unterwegs. An etlichen Stellen werden Exceptions geworfen, die den Workflow stark einschränken. Ich bin jedoch zuversichtlich, dass das noch sehr frische Projekt schon in Kürze mehr Beachtung gewinnen wird und die meisten Fehler dann behoben sind.

Kommentar schreiben

Kommentare: 1
  • #1

    Sebastian Tros (Mittwoch, 05 November 2014 22:01)

    Sehr spezieller Beitrag aber warum nicht. Sehr schön, dass du auch die etwas unbekannteren Projekte wie OrientDB beleuchtest. Find ich echt Klasse. Danke für jedes weitere Tutorial.

    Liebe Grüße
    Sebastion