Personen und Schriftstücke - Fallbeispiel Datensatz

Dieser Datensatz wird in einigen Import-Beispielen verschiedener Anwendungen verwendet. Liest euch bitte hier durch wie das Schema dieser Dateien aussieht und ladet die notwendigen Daten herunter.

Beispiel-Datensatz

Damit ihr Schritte des Tutorials nachvollziehen könnt, ist es wichtig die gleichen Daten, sowie Dateinamen und wenn möglich selbiges Schema wie hier zu verwenden. Daher stelle ich die verwendeten Daten zum Download bereit. Wir schauen uns nun zusammen das Schema der Daten genauer an.

Schema

Das Schema unseres Beispiel-Datensatzes ist simpel und sollte dennoch viele Fälle abdecken. Es gibt 4 Dateien, welche 3 Knoten und und 2 Relationen erzeugen sollen. Man kan das Schema mit den Worten beschreiben:

  • es gibt eine Person, die eine Anwendung geschrieben hat, über die WROTE-Relation
  • es gibt eine Anwendung, die einen Titel hat, über die HAS_TITLE-Relation

Die Kardinalität sagt aus:

  • Relation WROTE ist 0..*, somit muss eine Person keine Anwendung geschrieben haben aber kann unendlich viele schreiben
  • Relation HAS_TITLE ist 0..1, somit kann eine Anwendung einen Titel haben oder eben nicht

Zu WROTE ist zu sagen, dass dies natürlich kein normales Verhalten ist, dass es Personen in der Datenbank gibt, die keine Anwendung geschrieben haben. Bei unseren zufällig generierten Daten, können wir jedoch nicht sicher stellen, dass dies so ist.

Downloads

Die Dateien haben den folgenden Aufbau:


Name


IMPORT_Appln.csv

IMPORT_Title.csv

IMPORT_Person.csv

IMPORT_Per2App.csv



Spalten-Bezeichnungen


appln_id,appln_nr,appln_filing_date

appln_id,appln_title

person_id,person_name

person_id,appln_id



Zeilen (ohne 1.Zeile)


100.000

90.000

50.000

100.000



Ladet euch nun die folgenden Dateien herunter. Diese Daten verschiebt ihr auf dem Linux-System unter /home/data.

Download
Downloade die verwendete CSV oder generiere dir selber deine: http://www.mockaroo.com/90394440/download?count=100000
IMPORT_Appln.csv
Comma Separated Value Datei 2.0 MB
Download
Downloade die verwendete CSV oder generiere dir selber deine: http://www.mockaroo.com/c7504ef0/download?count=90000
IMPORT_Title.csv
Comma Separated Value Datei 18.4 MB
Download
Downloade die verwendete CSV oder generiere dir selber deine: http://www.mockaroo.com/6ad386a0/download?count=50000
IMPORT_Person.csv
Comma Separated Value Datei 956.7 KB
Download
Downloade die verwendete CSV oder generiere dir selber deine: http://www.mockaroo.com/45aeb860/download?count=100000
IMPORT_Per2App.csv
Comma Separated Value Datei 1.1 MB

Habt ihr Fragen zu verwendeten Daten, dann könnt ihr sie hier loswerden.

Kommentar schreiben

Kommentare: 2
  • #1

    Razi Garzia (Donnerstag, 06 November 2014 11:24)

    Sehr gute Arbeit. Endlich mal ein gut dokumentierter Datensatz, der vor allem auch in diversen Szenarien hier wiederverwendet wird.

    Mach weiter so kwoxer.

  • #2

    kwoxer (Freitag, 07 November 2014 11:49)

    Ja das war meine Intension dabei. Ein Datensatz und zig Beispiele wie man diesen in verschiedenen Systemen importieren kann.

    Schön, dass es gut ankommt und ja das mach ich natürlich

    LG