Magnus Niemann, Freitag, 16. Januar 2009
Bei TowerConsult suchen sie eine Senior-Abwehrspielerin. Ich dachte zunächst an eine Scherzausschreibung, aber das scheint ernst gemeint:

Senior Abwehrspielerin
Und was ist mit dem Gleichstellungsgesetz?
Einen Kommentar schreiben »
Thomas Hoppe, Donnerstag, 8. Januar 2009
Da ist uns vor ein paar Tagen etwas interessantes klar geworden. OK, für Experten mag das ja nicht so spannend sein, aber für uns bei Ontonym, die wir uns täglich mit Wortbedeutungen beschäftigen, ist das schon interessant.
Machen wir es gleich am Beispiel: Bei einem X-beliebigen Stellenmarkt wird eine Suchanfrage wie z.B. “Immobilienkaufmann” oder “CNC-Fräser” gestellt. Das kann bedeuten, dass der Stellensuchende eine “Stelle als …” sucht, es kann aber genauso gut bedeuten, dass er damit eine Stelle sucht die “diese Qualifikationen” voraussetzt.
Im ersten Fall reicht es natürlich aus ihm die Anzeigen zu zeigen, in denen explizit nach einem “Immobilienkaufmann” oder “CNC-Fräser” gesucht wird. Im letzten Fall muss man ihm aber auch andere Stellen zeigen in denen z.B. ein “Controller mit der Qualifikation eines Immobilienkaufmanns” gesucht wird oder ein “Teamleiter für eine Arbeistgruppe die Motorenblöcke fräst”.
Klar, ein System kann allein aus der Anfrage nicht entnehmen, was der Benutzer will. Ohne weitere Informationen ist es daher sinvoll die Anfrage mit beiden Interpretationen zu beantworten.
Einen Kommentar schreiben »
Thomas Hoppe, Donnerstag, 18. Dezember 2008
… habe ich eben in einer Stellenanzeige gelesen. Ich wußte noch gar nicht, dass Torf per Kurierdienst versandt wird
Tsss… man lernt doch immer wieder dazu.
Einen Kommentar schreiben »
Magnus Niemann, Montag, 17. November 2008
Als kleines Nebenprojekt sammeln wir gerade Homonyme (oder “Teekesselchen”), die sich leicht darstellen lassen. Zum Beispiel Pflaster:

(c) 2008 Magnus Niemann. Alle Rechte vorbehalten.
Wer kennt noch schöne?
Einen Kommentar schreiben »
Thomas Hoppe, Freitag, 14. November 2008
Haben “Inhouse Lösungen” eigentlich auch was mit Einhausung zu tun? Nein, natürlich nicht. Letztere klingt zwar so, als wäre es eingedeutscht worden. Einhausung gibt es aber wirklich als Begriff (guckst du hier), allerdings mit einer anderen Bedeutung.
Einen Kommentar schreiben »
Thomas Hoppe, Freitag, 14. November 2008
Bei der Überarbeitung einer Modellierung sind wir bei Begriffen aus der SAP Welt auf Lösung oder Komponenten – wie auch immer - für People Integration
und Student Lifecycle Management
gestolpert.
Nein, da geht es nicht um eine neue Form von “Human Compute Interface” oder um “Lebensberatung”, dass sind schlichtweg Komponenten des HR-Moduls.
Einen Kommentar schreiben »
Thomas Hoppe, Dienstag, 4. November 2008
Da habe ich gerade eine Besucherin auf meinem Xing-Profil gesehen und gleich im ersten Beitrag stoße ich auf etwas Interessantes (guckst du hier). Das sieht so aus als wenn es Ansätze zur Identifikation von fachsprachlichen Begriffen gibt. Ich frag mich, wie sowas ohne Hintergrundwissen gehen soll, dass müssen wir uns jedenfalls mal näher ansehen. Am besten ich frag gleich mal nach.
Einen Kommentar schreiben »
Thomas Hoppe, Montag, 6. Oktober 2008
Vor rd. 1 1/2 Wochen war ich auf der ESTC 2008 und habe mich mit Peter Jackson unterhalten, der Lernverfahren bei Thomson-Reuters einsetzt, um Instanzmuster aus Dokumenten zu lernen. Ich hab ihn gefragt, ob er ein Argument für mich hätte, mit der ich die Annahme wiederlegen kann, dass man Taxonomien erlernen könnte. Ihm ist klar das es prinzipiell nicht gehen kann, aber er wusste auch kein Argument, seine Erwiederung wäre “ok, try to construct it yourself”
Ich hab dann übers Wochenende ein wenig in dem Buch “Ontology Learning for the Semantic Web” von Alexander Maedche gestöbert. Ich dachte ich könnte darin eine Aussage über die prinzipielle Lernbarkeit von Ontologien finden. Fehlschlag. Es wäre ja auch zu schön gewesen in einer Dissertation über das “Erlernen von Ontologien” eine Aussage gegen deren Lernbarkeit zu finden. Wer würde sich schon auf dieses Glatteis wagen.
Die Verfahren von Maedche funktionieren sicherlich. Auf jeden Fall in dem begrenzten Kontext der durch die Anwendungsbeispiele aufgespannt wird und sicher auch darüber hinaus in den von ihm untersuchten Anwendungsfällen. Ob sie aber auf jede Anwendungsdomäne übertragbar sind wage ich dennoch zu bezweifeln. Beispielsweise fiel mir auf, dass es keine Aussage über das Erlernen von Synonymen gab. Die Beispiele vermittelten auch eher das Gefühl von akademischen Beispielen.
Einen Kommentar schreiben »
Thomas Hoppe, Samstag, 9. August 2008
Seit Ende Juni ist uns beim Modellieren nix interessantes untergekommen. Erst im Urlaub hab ich wieder mal was Interessantes entdeckt. Ein Wort mit zwei Lesarten:
Rohrohrzucker
Oder sollte es
RohrOhrzucker
gelesen werden ?
Ich stelle gerade fest, das man Zucker ja auch noch anders interpretieren kann
Für uns Menschen ist klar, dass nur die erste Lesart in Betracht kommt. Mich würde mal interessieren, was linguistische Verfahren benötigen, um 1) alle Lesarten zu finden und 2) die erste Lesart als die Wahrscheinlichste zu identifizieren ? Ich vermute ein einfaches Dictionary reicht da nicht aus.
Einen Kommentar schreiben »
Thomas Hoppe, Donnerstag, 26. Juni 2008
So nun kommt endlich der lange versprochene dritte Teil der Trilogie. Offen war ja die Frage ob “social tagging” helfen kann eine Ontologie zu konstruieren.
Unter “social tagging” versteht man, kurz zusammengefasst, die Verschlagwortung von Benutzer generierten Inhalten durch Benutzer. Die dabei entstehenden Systeme von Schlagwortmengen werden als “folksonomy” bezeichnet.
Nun kann man ja auf die Idee kommen, diese Schlagwortmengen einfach als Input für ein automatisches Cluster-Verfahren (Sie erinnern sich doch noch an den Folge II der Trilogie ?) zu verwenden. Aber auch hierbei steht man vor dem Problem, dass sich die einzelnen Schlagwortmengen unterschiedlicher Benutzer nicht nur von der Menge her unterscheiden, sondern – und das macht es dann problematisch – sie können auch Ontonyme enthalten.
Zu abstrakt ? Na dann machen wir mal ein Beispiel: In einem Web 2.0 Online-Recruiting System dürfen Benutzer Stellenanzeigen verschlagworten (ob sowas Sinn macht, sei jetzt mal dahingestellt). Benutzer A vergibt für eine Anzeige in seiner Schlagwortmenge den Begriff “Fertigungsleiter” und Benutzer B den Begriff “Produktionsleiter”. Bei einer anderen Anzeige vergeben beide Benutzer denselben Begriff, während Benutzer C den Begriff “Leiter Fertigung” vergibt.
Offensichtlich hängt die “Tagging-Qualität” sehr stark von der Sichtweise der Benutzer, deren Srachgebrauch und ihrer Tagesform ab. Und damit haben dann automatische Cluster Verfahren auf solchen Mengen genau dasselbe Problem wie bereits in Folge II beschrieben.
Hier hör ich dann die Vertreter der automatischen Verfahren einwenden “wenn die Datenbasis groß genug ist niveliert sich das aus statistischen Gründen weg”. Stimmt schon, nur fallen damit dann auch die Begriffe im “long tail” unter den Tisch. D. h. einige Schlagworte können nicht als Ontonyme identifiziert werden, die es Wert wären und bei einer Suchanwendung, würden nicht alle passenden Anzeigen gefunden werden.
Gut, dann lassen wir die Benutzer die Begriffe doch einfach selber anordnen und clustern ? Sowas bietet beispielsweise humanGrid an. Dort werden sogenannte click-worker engagiert, um solche Aufgaben durch kollektive Intelligenz zu erledigen und auch noch die Qualitätssicherung zu betreiben.
Ja und damit sind wir dann wieder beim manuellen Aufbau der Ontologien gelandet.
Einen Kommentar schreiben »