Vergleich von Entities

3xplor3r

Neuer Benutzer
Beiträge
4
Hi,

ich habe eine fachliches Problem und da ich dieses Forum für diese Frage für richtig halte, wollte ich nachfragen, ob einer oder mehrere von euch mir weiterhelfen würden. Wenn euch nicht danach ist, dann hört hier auf zu lesen. Ansonsten freue ich mich, dass ihr hier weiterlesen und mit helfen wollt. Ich hatte keinen passenden Zweig für dieses Thema gefunden. Also wenn es nicht passend ist, dann bitte ich um Vergebung und Verschiebung des Threads.

Ich beschäftige mich momentan mit dem Reverse Engineering bestehender Datenmodelle im Datenbankbereich, wobei das Datenbanksystem nicht einzugrenzen ist. Es kann mal ein Oracle oder mal ein DB2 oder mal ein ganz anderes System sein. Das Reverse Engineering an sich sollte nicht das große Problem werden. Nebenbei erwähnt benutze ich dafür ERwin. Gemacht habe ich es noch nicht, aber für Hilfe ist in dem Bereich schon gesorgt.

Die Situtation ist folgende: Über mehrere Jahre sind verschiedene Datenbanken historisch gewachsen und mittlerweile gibt es in einigen Datenbanken mehrere hundert Entitäten bzw. Tabellen. Meine Aufgabe ist es, ein Konzept zu entwickeln, mit dem man die Gleichheit von Entitäten herausfinden kann, also von mehreren hundert auf ein paar Dutzend herunterkommt, denn es wird vermutet, dass in jedem System eine Vielzahl an Dubletten und somit auch Datenredundanzen existieren. Das heißt also, dass im Detail zwei Entitäten miteinander verglichen werden sollen und geschaut werden soll, ob eine von den beiden überflüssig oder durch Umstrukturierung eine von den beiden Tabellen die Aufgaben beider übernehmen kann und folglich die andere nicht mehr benötigt wird. Umstrukturieren heißt, dass beispielsweise Attribute von einer Tabelle in die andere übernommen wird und demnach wiederum eine Tabelle überflüssig ist.

Jetzt habe ich mir meinen Studentenkopf schon ein paar Tage zerbrochen und Kommilitonen gefragt, die aber auch keine Ideen hatten. Nun wollte ich es bei euch versuchen, auf der Hoffnung mehr Input zu erlangen. Zum Schluss beschreibe ich noch meine bisherigen Ideen. Wenn ihr Ideen kundgeben wollt, dies aber unbefangen von meinen vorhabt, dann lest hier jetzt nicht weiter und schreiben sie auf. Ansonsten wünsche ich viel Spaß in meiner noch kleinen Ideensammlung.

Beste Grüße und danke für die Hilfe.


Ich hatte mir per Mindmap und Brainstorming Gedanken gemacht und hier folgen die Ergebnisse. Zum Aufbau ist zu sagen, dass beispielsweise Datenmodell einen Oberpunkt darstellt und mit Anführungsstrichen die jeweiligen Teilpunkte folgen.







Datenmodell


  • Dokumentation

    • Analyse der für das entsprechende Datenmodell zur Verfügung stehenden Beschreibungen und Dokumentationen, um doppelt vorhandenen Tabellen und Attribute zu identifizieren
Entitäten


  • Datenobjekt

    • Prüfung der enthaltenen Attribute auf Gleichheit zwischen Bezeichnungen oder Deklarationen bei allen Entitäten innerhalb des entsprechenden Datenmodells, doppelt vorhandene Attribute sollen so herausgefunden und entfernt werden


  • Datensatz

    • Suche nach redundanten Datensätzen bei allen Entitäten innerhalb des entsprechenden Datenmodells


  • Entitätsbezeichnung

    • Auffinden von gleichen oder ähnlichen Bezeichnungen bei allen Tabellen innerhalb des entsprechenden Datenmodells und anschließender Vergleich der enthaltenen Attribute, gleichnamige Tabellen, die eventuell die gleiche Funktion erfüllen sollen so gefunden werden


  • Relation

    • Suche nach Relationen zu gleichen oder ähnlichen Tabellenund Beachtung derer Eigenschaften (Anzahl, Kardinalität und Integrität der Relationen), d. h. dass es vielleicht Tabellen gibt, die genau die gleichen Beziehungen zu anderen Tabellen aufweisen wie eine zweite Tabelle
 
Werbung:
Zurück
Oben