Familie Weiland

Genealogische Homepage

Datenmenge vs. Datenqualität

Seit Juni 2012 forsche ich nun nach meinen Vorfahren und vor wenigen Tagen hat der Stammbaum die Anzahl von 3000 Personen überschritten. Angefangen hat das alles mit etwas über 20 Personen. Aber es geht hier nicht darum, möglichst viele Personen in die Datenbank einzutragen, sondern auch die Datenqualität ist wichtig. Wie wird das erreicht?

menschengruppeDie Hauptanwendung für den Stammbaum ist Webtrees. Leider bietet Webtrees sehr wenige Möglichkeiten, die Datenqualität sicherzustellen. Die die vorhanden sind werden aber genutzt. So habe ich letzte Woche damit begonnen, die Schreibung von Ortsnamen zu vereinheitlichen, die Geokoordinaten in das Google Maps Modul einzupflegen, damit Lebensereignisse von Personen auch auf der Landkarte dargestellt werden können und ich habe die Duplettensuche von Webtrees genutzt, wobei diese momentan nur eingeschränkt empfehlenswert ist. Für die Bereinigung der Ortsnamen hat sich das Suchen- und Ersetzen-Werkzeug von Webtrees bewährt.

Als nächstes steht dann die Vereinheitlichung der Quellenangaben auf dem Programm. Auch hier hat sich leider ein gewisser Wildwuchs ergeben und gerade in der Anfangszeit meiner Familienforschung habe ich den Quellen zu wenig Bedeutung beigemessen, wie leider viele andere Familienforscher auch.

Alle paar Monate exportiere ich den Stammbaum als GEDCOM-Datei und lese diese Datei dann mit den GSP – Gedcom Service Programmen ein. Das Programmmodul GEDCOM-Validierung bietet mir hier alles was ich benötige. So werden Dupletten sehr zuverlässig gefunden und auch logische Fehler, z.B. Sterbedatum vor Geburtsdatum oder Tod der Eltern vor Geburt der Kinder, werden damit sehr einfach dargestellt. Die 20 EUR die dieses Programmpaket gekostet hat, sind mir den Komfort wert. Die Fehlerliste die aus dem GSP herauskommt, bearbeite ich dann. Was sofort bearbeitet werden kann, wird in Webtrees bearbeitet. Alles was nicht sofort erledigt werden kann, wird als „Forschungsaufgabe“ in Webtrees eingestellt, so das ich das später erledigen kann, oder auch andere Familienmitglieder sich um eine Bereinigung kümmern können.

Einige Personen und Ereignisse habe ich erfasst, obwohl ich mir ziemlich sicher bin, das sie nicht stimmen können. Das habe ich dann aber jeweils als Kommentar und als Forschungsaufgabe erfasst. Warum erfasse ich falsche Fakten? Nun – ich möchte mir diese notieren, um sie überprüfen zu können. Wenn ich sie mir aber irgendwo notiere, können meine anderen Familienmitglieder darauf nicht zugreifen. Aber vielleicht haben ja gerade diese die Möglichkeit, das fehlende Puzzlestück zu liefern. Ein aktuelles Beispiel hierfür ist z.B. Anton Wallinger.
Laut einem anderen Forscher soll er 1890 in die USA ausgewandert sein. Ich habe aber die Volkszählungsunterlagen und seinen Grabstein im Internet gefunden und das Geburtsdatum dort passt um 1 Jahr nicht überein. Nun ist unbedingt zu überprüfen, ob das stimmt oder nicht. Aber mit meinen vorliegenden Daten kann ich das nicht. Darum nehme ich diesen Fehler bewusst in Kauf und markiere mir das ganze einfach. Über den Sinn oder Unsinn dessen kann man streiten. Wissenschaftlich betrachtet ist es sicher nicht ganz richtig. Aber es ist insbesondere in Hinblick auf Zusammenarbeit mit anderen übers Internet sehr zweckmäßig.

Ich hoffe ich konnte mit diesem Artikel das Thema Datenqualität etwas erläutern und freue mich natürlich über Kommentare und Anregungen.

 

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.