Ontonym - passendes einfach finden

Komplexes Denken

Magnus Niemann, Mittwoch, 3. März 2010

Manchmal (aber nur manchmal) denken wir Anwender semantischer Technologien auch in viel zu komplizierten Bahnen. Ein wunderschönes Beispiel liefert Johannes “beetlebum” Kretzschmer in diesem Cartoon.

Einen Kommentar schreiben »

Trendreport Semantic Web

Thomas Hoppe, Montag, 9. November 2009

Über Xing bin ich heute auf den Trendreport Semantic Web von innowise aufmerksam geworden und war freudig überrascht, dass Ontonym darin sogar zitiert wird.

Es hat mich dann doch mal interessiert wie innowise auf Ontonym aufmerksam geworden ist. Und siehe da ein wenig Quellen Forschung hat diesen Blogeintrag zu Tage gefördert. Nach rund einem dreiviertel Jahr zeigt sich, dass der Vortrag doch etwas gebracht hat.

Einen Kommentar schreiben »

Im Biberpelz

Thomas Hoppe, Samstag, 3. Oktober 2009

Sie sitzt am Frühstückstisch und fängt an den Biberpelz von Gerhard Hauptmann zu lesen:

Sie: “Du, warum ist der Krüger ein Rentier?”

Er: “Wie bitte ?”

Sie: “Na hier bei den Rollen steht, dass die Rolle des Krügers ein Rentier ist!”

Er: “Zeig mal her” … “Ach so, ja klar, denk mal nach …”

Also denkt mal nach :-)

Wer die Lösung weiß erhält 10 Punkte !

Einen Kommentar schreiben »

Change Blindness - über das Nicht-Erkennen vermiedener Fehler

Thomas Hoppe, Samstag, 22. August 2009

So, da hab ich jetzt vermutlich den richtigen Begriff für das Phänomen gefunden. Welches Phänomen ? Ach so, ich meine dieses Posting.

Das Phänomen wird nicht durch die Philosophie bezeichnet, sondern durch die Psychologie beschrieben. Es heißt dort „change blindness“ oder auf Deutsch „Veränderungsblindheit“. Ein befreundeter Chemiker & Informatiker hat mich darauf aufmerksam gemacht, er interessiert sich derzeit sehr für Erkenntnisprozesse. Danke Michael.

In der Psychologie werden zur Erläuterung dieses Phänomens meist visuelle Beispiele in Form von nacheinander präsentierten Bildern oder Filmen verwendet, in denen sich einige, oft unwesentliche Bildinhalte zwischen den einzelnen Bildern / Szenen verändern. Hier findet man einige Beispiele dafür. Das Interessante daran ist, dass unser Bewusstsein diese Unterschiede in der Regel erst mitbekommt, wenn wir darauf hingewiesen werden oder die Beispiele bereits kennen. Ganz unvoreingenommen fallen uns die Unterschiede nur sehr selten auf.

Klammer auf: Im Frühjahr habe ich mal wieder ein paar alte Folge von „Mit Schirm, Charme und Melone“ mit meiner Tochter gesehen und es fiel mir bei einer Folge ein kleiner Fehler zwischen drei Szenen auf: In der ersten Szene sah man eine Schachtel Pralinen auf der Armlehne eines Sessels, in der darauf folgenden Szene war sie weg und – nach einem weiteren Schnitt – war sie in der nächsten Szene wieder da. Das ist dann ein Beispiel für „change visibleness“ :-) Klammer zu.

Wenn ich mir jetzt so mein erstes Posting über dieses Phänomen ansehe, dann haben wir es da auch mit einer Form von „change blindness“ zu tun. Unser Bewusstsein scheint Fehler die Suchmaschinen machen auch einfach auszublenden, so dass uns ihre Abwesenheit schon gar nicht mehr auffällt.

Dies bedeutet dann konkret, dass wir auf solche Fehler direkt hinweisen müssen und die Verbesserung durch unsere Technologie immer wieder explizit aufzeigen müssen. Wir können einfach nicht erwarten, dass Benutzer dies von selber erkennen. Erst dann werden Benutzer für solche Fehler eine gewisse Aufmerksamkeit entwickeln.

Ergo, fange ich dann mal an eine neue Kategorie mit „vermeidbaren Fehlern“ aufzumachen, die durch „semantische Technologien“ behoben werden können.

3 Kommentare lesen »

Theseus Symposium 29.6. & 30.6.

Thomas Hoppe, Donnerstag, 2. Juli 2009

Am 29.6. und 30.6. fand in Berlin im Bundesministerium für Wirtschaft und Technologie ein Symposium zu Theseus und seinem internationalen Umfeld statt an dem ich teilnahm.

Der erste Tag war teilweise sehr interessant. Ich fand insbesondere den Vortrag von Prof. Joao Schwarz da Silva (EU) interessant der die Ausrichtung der Forschungsförderung der EU anhand einiger eindrucksvoller Daten skizzierte. Eins ist dabei klar geworden die Menge der Daten und der IP Traffic wird mit enormen Steigerungsraten wachsen und man wird nicht mehr drum herumkommen die Daten zu aggregieren. Das dürfte auch für semantische Technologien eine interessante Aufgabenstellung werden, diese Aggregation zu unterstützen.

Auch sehr interessant aber vor allem extrem anschaulich war der Vortrag von Prof. Rudi Studer über Semantic und Corporate Semantic Web.

Während der erste Tag zwar vollgestopft (von 9:30 Uhr bis 20:00 Uhr) mit Vorträgen war, verlief der 2. Tag in - ich glaub - rund acht  parallelen Sessions, da konnte man natürlich nur punktuell dabei sein. Dummerweise wählte ich eine Session über Wertschöpfungsprozesse im “Economics 2.0″, dass war dann aber eine ausführlichere Wiederholung eines Vortrags vom Vortag und bezog sich leider bloß auf Enterprise-Anwendungen. Also bloß: wasted time :-(.

Das Beste war da noch eine Session über Ontologiedesign. Die gab einen kurzen extrem knackigen Überblick über Ontologien im Kontext Semantic Web, dass war sehr anschaulich. Dummerweise stellte sich dann bei einigen Nachfragen aus dem Auditorium zur “open world assumption” und zu “qualified number restrictions” heraus, dass die Vortragende die Folien von Kollegen hatte und die Einwände und Fragen des Auditoriums nicht richtig beantworten konnte :-o. Schade nur, dass sich diese Darstellung an OWL 2 orientierte und bei einigen Konstrukten nicht darauf hingewiesen wurde, dass nicht alle Ontologieeditoren damit umgehen können :-(. Aber vielleicht passierte das ja doch noch in der zweiten Hälfte, zu der Zeit war ich dann in der Session, die mich eigentlich interessiert hatte.

Im übrigen sollen die Vorträge auch veröffentlicht werden. Ich empfehle auf jeden Fall den Vortrag von Joao Schwarz da Silva und den über Ontologiemodellierung. Lediglich die IBM und SAP Vorträge kann man sich sparen. Erstere sind strategisch und inhaltsleer und letztere wiederholten sich häufig.

Einen Kommentar schreiben »

Wortpalindrome

Thomas Hoppe, Montag, 15. Juni 2009

Palindrome (Wörter die auch rückwärts gelesen Sinn machen) kennt man ja. Gestern bin ich mit meiner Tochter über zusammengesetzte Wörter gestolpert, die auch einen Sinn ergeben, wenn man beide Wörter vertauscht. Unklar? Gut, dann ein paar Beispiele:

  • Steinmauer / Mauerstein
  • Strandbad /Badestrand
  • Holzstuhl / Stuhlholz (hmmm, naja)
  • Motorflugzeug / Flugzeugmotor

Interessant ist die Erkenntnis:

  1. dass das nicht bei allen zusammengesetzten Wörtern klappt
    • Baumkrone / Krone(n)baum (?)
    • Schwimmbad / Badschwimmer (?)
  2. dass wenn es bei einem zusammengesetzten Wort klappt, beide Worte auch oft zueinander in einer sinnvollen Beziehung stehen
    • eine Steinmauer besteht aus Mauerstein(en)
    • jedes Motorflugzeug hat einen Flugzeugmotor
    • ein Gartenhaus steht immer in einem Hausgarten

Da ich noch nicht weiss, wie solche Worte in der Linguistik heissen, nenne ich sie mal vorläufig Compositapalindrome (oder kurz CPs).

Interessant wären jetzt natürlich Kriterien, die einem sagen, ob ein zusammengesetztes Wort ein CP ist oder nicht. Oder anders, unter welchen Bedingungen sind zusammengesetzte Worte auch CPs. Würde man solche CPs erkennen können, dann könnte man für ihre einzelnen Leserichtungen natürlich auch angeben, dass sie zueinander in einer Beziehung stehen.

Natürlich kann man da jetzt eine ganze Klassifikation von CPs aufmachen: reine CPs (beide Worte müssen syntaktisch gleich sein), allgemeine CPs (auch die Beugung eines Wortes ist zugelassen: Strandbad/Badestrand), logische CPs (die durch eine aussagenlogische Beziehung verbunden sind: Jedes Strandbad verfügt über einen Badestrand).

Interessant wird es auch, wenn man inhaltlich ähnliche CPs betrachtet.

  • Motorflugzeug / Flugzeugmotor (eindeutiges CP)
  • Motorschiff /Schiffsmotor (auch eindeutig)
  • Automotor / Motorauto (hmm, dass ist ja schon ein komischer Begriff, könnte man aber als Abgrenzung zu Tretauto noch durchgehen lassen)
  • Motorrad / Radmotor (das ist aber schon eher fragwürdig)

Ich frag mich, ob Linguisten diese Wortart schonmal beschrieben oder analysiert haben? Über entsprechende Referenzen würde ich mich freuen.

Einen Kommentar schreiben »

Grenzen der Wahrnehmbarkeit

Thomas Hoppe, Donnerstag, 14. Mai 2009

Wir hatten eine ganze Reihe anderer Dinge zu tun, deshalb war lange Funktstille. Seit einiger Zeit bewegt mich ein Problem, dass ich noch nicht richtig benennen kann. Ich probiere mal das zu charakterisieren:

Wenn man eine herkömmliche Volltextsuche verwendet, erhält man viele Treffer von denen mitunter einige/viele falsch sind. Wenn man die Suchergebnisse durchgeht, dann erkennt man relativ schnell welche Treffer falsch sind. Beispiel: Wir fragen nach “Geschäftsführer” und  es werden fälschlicherweise Stellenanzeigen für “Assistent des Geschäftsführers” gefunden. Das heißt, dass Fehler gemacht werden erkennen wir schnell.

Wenn man jetzt im Gegensatz eine neue bessere Technologie einsetzt, die die meisten Fehltreffer vermeidet, wie z.B. unsere semantische Suche, dann kann man nicht auf den ersten Blick sehen, dass Fehltreffer vermieden wurden. Beispiel (fortgesetzt): Wir fragen nach “Geschäftsführer” und  es werden nur passende Anzeigen gefunden, d.h. Stellenanzeigen für “Assistent des Geschäftsführers” werden vermieden. Da diese Fehltreffer nicht mehr angezeigt werden, ist nicht ohne weiteres erkennbar, dass Fehler vermieden werden.

Im Gegensatz zu einer Steigerung des Recalls (der gefundenen, relevanten Treffer), die relativ einfach durch eine Vergrößerung der Treffermenge gezeigt werden kann, ist eine solche Verbesserung der Precision (die Vermeidung von Fehltreffern) nicht ohne zusätzliche Mechanismen/Argumente etc. aufzeigbar.

Ich vermute, dass dies ein Beispiel für eine prinzipielle, erkenntnistheoretische Grenze ist. Dummerweise, kenne ich mich da in der Philosophie nicht genügend aus, aber eigentlich müsste es für dieses Phänomen einen Namen geben. Kennt jemand eine Bezeichnung dafür oder ein Forum in dem ich diese Frage stellen könnte ?

1 Kommentar lesen »

Recruiting treibt seltsame Blüten

Magnus Niemann, Freitag, 16. Januar 2009

Bei TowerConsult suchen sie eine Senior-Abwehrspielerin. Ich dachte zunächst an eine Scherzausschreibung, aber das scheint ernst gemeint:

Senior Abwehrspielerin

Senior Abwehrspielerin

Und was ist mit dem Gleichstellungsgesetz?

Einen Kommentar schreiben »

Benutzerintention

Thomas Hoppe, Donnerstag, 8. Januar 2009

Da ist uns vor ein paar Tagen etwas interessantes klar geworden. OK, für Experten mag das ja nicht so spannend sein, aber für uns bei Ontonym, die wir uns täglich mit Wortbedeutungen beschäftigen, ist das schon interessant.

Machen wir es gleich am Beispiel: Bei einem X-beliebigen Stellenmarkt wird eine Suchanfrage wie z.B. “Immobilienkaufmann” oder “CNC-Fräser” gestellt. Das kann bedeuten, dass der Stellensuchende eine “Stelle als …” sucht, es kann aber genauso gut bedeuten, dass er damit eine Stelle sucht die “diese Qualifikationen” voraussetzt.

Im ersten Fall reicht es natürlich aus ihm die Anzeigen zu zeigen, in denen explizit nach einem “Immobilienkaufmann” oder “CNC-Fräser” gesucht wird. Im letzten Fall muss man ihm aber auch andere Stellen zeigen in denen z.B. ein “Controller mit der Qualifikation eines Immobilienkaufmanns” gesucht wird oder ein “Teamleiter für eine Arbeistgruppe die Motorenblöcke fräst”.

Klar, ein System kann allein aus der Anfrage nicht entnehmen, was der Benutzer will. Ohne weitere Informationen ist es daher sinvoll die Anfrage mit beiden Interpretationen zu beantworten.

Einen Kommentar schreiben »

Journalismuspraktikum beim Torfkurier

Thomas Hoppe, Donnerstag, 18. Dezember 2008

… habe ich eben in einer Stellenanzeige gelesen. Ich wußte noch gar nicht, dass Torf per Kurierdienst versandt wird ;-) Tsss… man lernt doch immer wieder dazu.

Einen Kommentar schreiben »