Ontonym - passendes einfach finden

Wie Ontologien in die Welt kommen ? (3/3)

Thomas Hoppe, Donnerstag, 26. Juni 2008

So nun kommt endlich der lange versprochene dritte Teil der Trilogie. Offen war ja die Frage ob “social tagging” helfen kann eine Ontologie zu konstruieren.

Unter “social tagging” versteht man, kurz zusammengefasst, die Verschlagwortung von Benutzer generierten Inhalten durch Benutzer. Die dabei entstehenden Systeme von Schlagwortmengen werden als “folksonomy” bezeichnet.

Nun kann man ja auf die Idee kommen, diese Schlagwortmengen einfach als Input für ein automatisches Cluster-Verfahren (Sie erinnern sich doch noch an den Folge II der Trilogie ?) zu verwenden. Aber auch hierbei steht man vor dem Problem, dass sich die einzelnen Schlagwortmengen unterschiedlicher Benutzer nicht nur von der Menge her unterscheiden, sondern – und das macht es dann problematisch – sie können auch Ontonyme enthalten.

Zu abstrakt ? Na dann machen wir mal ein Beispiel: In einem Web 2.0 Online-Recruiting System  dürfen Benutzer Stellenanzeigen verschlagworten (ob sowas Sinn macht, sei jetzt mal dahingestellt). Benutzer A vergibt für eine Anzeige in seiner Schlagwortmenge den Begriff “Fertigungsleiter” und Benutzer B den Begriff “Produktionsleiter”. Bei einer anderen Anzeige vergeben beide Benutzer denselben Begriff, während Benutzer C den Begriff “Leiter Fertigung” vergibt.

Offensichtlich hängt die “Tagging-Qualität” sehr stark von der Sichtweise der Benutzer, deren Srachgebrauch und ihrer Tagesform ab. Und damit haben dann automatische Cluster Verfahren auf solchen Mengen genau dasselbe Problem wie bereits in Folge II beschrieben.

Hier hör ich dann die Vertreter der automatischen Verfahren einwenden “wenn die Datenbasis groß genug ist niveliert sich das aus statistischen Gründen weg”. Stimmt schon, nur fallen damit dann auch die Begriffe im “long tail” unter den Tisch. D. h. einige Schlagworte können nicht als Ontonyme identifiziert werden, die es Wert wären und bei einer Suchanwendung, würden nicht alle passenden Anzeigen gefunden werden.

Gut, dann lassen wir die Benutzer die Begriffe doch einfach selber anordnen und clustern ? Sowas bietet beispielsweise humanGrid an. Dort werden sogenannte click-worker engagiert, um solche Aufgaben durch kollektive Intelligenz zu erledigen und auch noch die Qualitätssicherung zu betreiben.

Ja und damit sind wir dann wieder beim manuellen Aufbau der Ontologien gelandet.

trackback RSS-Feed

Kommentar schreiben

Autor

Ihr Kommentar