Thomas Hoppe, Dienstag, 7. Februar 2012
Wir gucken uns gerade Unternehmensbeschreibungen an. Und was lesen wir da:
Die arvato systems group gehört zum internationalsten Medienunternehmen der Welt: Bertelsmann.
Aha, es heisst jetzt also “international”, “internationaler” und am “internationalsten”.
Und wenn man dann mal Google bemüht – wie Magnus es gerade tat – dann findet man noch ganz viele Unternehmen die am “internationalsten” sind.
Pikant an dem Fundstück ist, dass dies Unternehmen auch im Bereich der Textanalyse tätig ist
Einen Kommentar schreiben »
Thomas Hoppe, Donnerstag, 17. November 2011
Vor rd. einer Woche wurde im Schema Blog über die Unterstützung von Job Postings berichtet. Das bedeutet, dass Google, Yahoo und Microsoft ein – im Verhältnis zu HR-XML – leicht-gewichtiges Schema für Stellenanzeigen unterstützen wollen. In diesem Schema werden zwar anglo-amerikanische Klassifikationen von Berufsbezeichnungen erwähnt, für den deutsch-sprachigen Raum wird bisher nichts erwähnt. Noch nicht einmal die BKZ der Agentur für Arbeit.
Unsere e-Recruitment Ontologie umfasst zur Zeit rd. 5.040 Konzepte aus dem Recruitment-Bereich mit 7.975 unterschiedlichen, teilweise mehrsprachigen Bezeichnungen. Mit diesen können wir die Schema.org Properties: educationRequirements, employmentType, experienceRequirements, industry, occupationalCategory, qualifications, responsibilities und skills beschreiben. Sie stellt somit einen idealen Kandidaten für ein deutsch-sprachiges Klassifikationsschema dar, welches nicht nur offizielle Bezeichnungen verwendet, sondern auch die gelebte Sprache von Stellenanbietern, -suchenden und Personalberatern berücksichtigt.
Unsere Software kann daraus rd. 37.100 erkennbare Varianten (i.E. mit Abkürzungen und unterschiedlichen Schreibweisen) generieren, die durch Stammformbildung nochmals potenziert werden (das können wir gar nicht mehr zählen). Mit diesen Werkzeugen können wir relativ schnell für herkömmliche Stellenanzeigen eine schema.org konforme Beschreibung generieren, analog zu den GoodRelations-Beschreibungen des Xinnovations-Experiments.
Einen Kommentar schreiben »
Thomas Hoppe, Dienstag, 3. Mai 2011
Wir organisieren für den Xinnovations e.V. zusammen mit Semtation und der Arbeitsgruppe CSW der FU gerade ein Experiment zum Thema “Internet der Dienste” und werden in diesem Zusammenhang an einer Modellierung arbeiten. Endlich mal wieder Stoff, um darüber was zu schreiben.
Hintergrund: Im Rahmen des Experiments wird Unternehmen eine einfache Eingabeoberfläche bereitgestellt mit der sie sich und ihre Angebote: “Produkte”, “Dienstleistungen” und “Dienste” (mehr zu dieser Unterscheidung später) beschreiben können und so richtig schön Web 2.0 mäßig taggen können
. Diese Beschreibungen werden dann für weitere Zwecke in unterschiedlichen Formaten zur Verfügung gestellt (dazu ein andermal mehr).
Nach dem wir unter den Vereinsmitgliedern einen ersten Aufruf verbreitet haben, haben sich bereits 15 Mitgliedsorganisationen eingetragen, angefangen von Berliner IT-Unternehmen, über Hochschulen und ein Organisationsberatungsunternehmen bis hin zu einer Rechtsanwaltskanzlei.
Wir von Ontonym haben mit einem Teilexperiment bereits begonnen, wir modellieren anhand der Tags eine Taxonomie, die auf der “GoodRelations” Ontologie aufbaut, mit dem Ziel die “Produkte”, “Dienstleistungen” und “Dienste” zu beschreiben. Dafür gibt es nämlich bisher weder in GoodRelations noch im “Internet der Dienste” eine vernünftige Taxonomie. Es gibt zwar normative Klassifikationen, wie e-Class oder das UNSPSC, die erscheinen uns 1) nicht geeignet, um die Sprachvielfalt – die schon jetzt in den Tags zu finden ist – zu erfassen oder abbildbar zu machen, und 2) wollen wir sowohl eine deutsch- als auch eine english-sprachige Taxonomie bereitstellen.
Das erste Problem, das sich stellte war: “Wie können wir Produkte und Services unterscheiden?”
Oft wird der Begriff “Produkt” z.B. in Unternehmen oder der Produktionstheorie als umfassender Begriff auch für “Dienstleistungen” etc. verwendet. In der umgangssprachlichen Bedeutung hat man aber eigentlich immer einen Gegenstand oder ein “anfassbares” Erzeugnis im Sinn. Das wäre aber zu eng für “Software”, “Layouts” etc. Also muss man eine Definition auch auf “virtuelle” Erzeugnisse ausdehnen. Das wesentliche an Produkten aber ist, dass man das Eigentums- bzw. die Nutzungsrechte erwirbt. Das ist dann schonmal ein guter Ansatzpunkt, um eine Definition für den Begriff zu finden.
Bei den “Services” wird es schwieriger, da werden im Englischen sowohl “Dienstleistungen” als auch “Dienste” drunter verstanden. Wenn man sich Dienstleistungen vorstellt, dann hat man gleich Leistungen im Kopf wie z.B. “Haare schneiden”, “Mitarbeiter coachen”, “Werbekampagnen oder Software entwerfen”, “Dinge verkaufen”, “Unternehmen beraten”, etc. Immer aber ist eine Person oder eine Organisation involviert, die die Leistung erbringt. Davon kann man dann “Dienste” als von Dingen erbrachte Leistungen abgrenzen: “Ein Wasserhahn spendet Wasser”, “ein Auto fährt”, “Web Services liefern Ergebnisse”.
Ich denke, mit diesen Definitionen kommt man erstaunlich gut zu Rande.
2 Kommentare lesen »
Magnus Niemann, Mittwoch, 6. April 2011
… und residieren jetzt im Herzen der Stadt, genauer gesagt in Moabit:

Unsere Adresse:
Ontonym GmbH
Alt-Moabit 91d
10559 Berlin
Einen Kommentar schreiben »
Thomas Hoppe, Freitag, 25. März 2011
Wir modellieren mal wieder für einen Kunden und haben ein paar Begriffsperlen gefunden. Wir sind es ja mittlerweile gewohnt, dass Begriffe, die im Deutschen zusammengeschrieben werden, gnadenlos auch in der Bindestrich-Schreibweise geschrieben werden. Bei anderen Begriffen merkt man aber, dass deren Autoren noch weniger nachgedacht haben.
Nehmen wir uns mal die tautologischen Begriffe vor wie Einzelindividuum, Online-Webvideo oder Körperpflegemittelprodukt. Da fragt man sich, was wollen die Autoren einem mit diesen Steigerungen sagen?
Haushaltsnettoeinkommen mit Haushaltseinkommen gleich zusetzen ist ja noch verständlich, man kann es natürlich auch als Nettohaushaltseinkommen bezeichnen. Ich frag mich dann aber doch, was soll ein Nettohaushalt bloß sein?
Und dann war da noch der Begriff Userinnen. Es wäre soviel einfacher den deutschen Begriff Benutzerinnen zu verwenden als dieses Wortmonster zu erschaffen.
Demnächst vielleicht ein paar weitere Perlen …
Einen Kommentar schreiben »
Thomas Hoppe, Freitag, 8. Oktober 2010
Ich nehme gerade am KnowledgeCamp 2010 in Passau teil. Man trifft alte Bekannte, Kunden mit denen das Gespräch abbrach und knüpft neue Kontakte.
Meine beiden Sessionvorschläge “Tagging Chaos vs. Kontrollierte Sprachregelungen – Brauchen wir Terminologie Management” und “Knowledge Intelligence – Wissen, was ein Unternehmen weiß” sind auf großes Interesse gestoßen und werden heute (8.10.) um 12:15 und 15:30 durchgeführt. Klasse. Es gibt sogar einen Livestream. Meine Session dürften da aber nicht drüber laufen, da ich wohl in einem anderen Raum bin.
1 Kommentar lesen »
Thomas Hoppe, Freitag, 27. August 2010
Aus der Kategorie “Nerds dichten”:
Ich muß den Windows Schreiber treiben,
der soll den Windows Treiber schreiben.
Wozu – sagen wir mal – längliche Vorträge von Wissenschaftlern einen doch anregen können!
1 Kommentar lesen »
Thomas Hoppe, Donnerstag, 24. Juni 2010
Wir haben gerade den Artikel Gerhard Kenk Fakten, Funktionen und Visionen: Wenn Google eine Jobsuchmaschine wäre gelesen in dem einige Argumente für den Einsatz einer semantischen Suche bei Jobbörsen aufgeführt werden, die wir und sicherlich auch viele Stellensuchende sehr gut nachvollziehen können.
Wir arbeiten seit vielen Jahren im Bereich der semantischen Suchtechnologien und haben vor zwei Jahren einen Demonstrator für eine semantische Stellensuche aufgebaut. Viele der Eigenschaften einer semantischen Suche, die in dem Artikel aufgeführt werden:
- Unterschiedliche Gewichtung von Titel und Anzeige
- Berücksichtigung von synonymen (bedeutungsgleichen) Bezeichnungen
- kombinierte Relevanz und Aktualitätsbewertung
- Berücksichtigung unterschiedlicher Schreibweisen und der Begriffsnähe
haben wir in unseren Demonstrator unter www.yapadu.de eingebaut und haben diesen unterschiedlichen Stellenmärkten und Jobsuchmaschinen vorgestellt. Sicherlich, an einigen Stellen ist der Demonstrator noch nicht perfekt (z.B. fehlt eine Eigennamenerkennung, deren Nachrüstung prinzipiell kein Problem darstellt), dennoch vermeidet er die wichtigsten der mittlerweile typischen Fehler bei Stellensuchen; beispielsweise, dass
- zu “Klempner” keine Stellen als “Spengler” gefunden werden (und somit nahezu die Hälfte der Anzeigen nicht auffindbar ist),
- zu “MTA” Stellen als Informatiker ausgewiesen werden, weil diese an einer “GesaMTArchitektur” arbeiten sollen,
- “Projektleiter” keine Stellen als “Projektmanager” angezeigt bekommen, oder
- das für einen “Geschäftsführer” auch die berühmte “Assistentin des Geschäftsführers” gefunden wird.
Kommentar eines Stellenmarktes nach dem wir über längere Zeit mit diesem im Gespräch waren und anhand eines Verfahrens zum quantitativen Vergleich von Suchmaschinenergebnissen mit harten Zahlen und anschaulichen Grafiken die Qualitätssteigerung durch eine semantische Suche gegenüber seiner Volltextsuche nachweisen konnten: “Wir sind noch nicht 100%ig davon überzeugt, dass ihr Verfahren zu einer Verbesserung führt. Wir werden erstmal mit Bordmitteln einige der wesentlichen Defizite beheben”. Und was passierte? Bis heute nichts, diese Defizite existieren immer noch.
Eine Konsequenz der im Artikel zitierten großen Zahlen, ist den Betreibern der Jobbörsen wohl noch nicht klar geworden. Bedingt durch die schiere Menge der Stellenanzeigen die pro Tag neu bei einer Jobbörse veröffentlicht werden, verringert sich bei rein nach Datum sortierten Ergebnissen die “Sichtbarkeit” der Anzeigen drastisch. Rutscht eine Anzeige erstmal auf die zweite Suchergebnisseite wird die Stellenanzeige nur noch von einem geringeren Teil der Stellensuchenden gesehen, auf Seite drei sind es dann nochmal weniger und ab den folgenden Seiten ist die Anzeige so gut wie unsichtbar (siehe beispielsweise die im Artikel von Herrn Kenk zitierte Jupiterstudie). Dies aber dauert bei großen Stellenbörsen oder spezialisierten Fachkräftemärkten noch nicht einmal annähernd so lange wie die Laufzeit der Anzeige. Dass die Unternehmen die rare Spezialisten suchen, hier noch kein besseres Preis-/Leistungsverhältnis verlangt haben, wundert ein bisschen.
Eigentlich könnten Stellenmärkte die Qualität der Ergebnisse deutlich verbessern – für die notwendigen Technologien wie semantische Suche gibt es Anbieter und das dafür notwendige Hintergrundwissen kann Ontonym liefern. Trotzdem dominiert nach wie vor die veraltete Volltextsuche in der kritischen Suchfunktion.
Dass Suchende mit der Qualität der Suchergebnisse im Allgemeinen nicht zufrieden sind, lässt sich auch nicht durch den Vergleich einer Volltextstellensuche mit einer anderen Volltextstellensuche weg definieren. Sicherlich die Suchenden Zahlen bisher kein Geld für bessere Ergebnisse und lediglich ein geringer Teil würde dies auch tun; als Anzeigenschaltender – die eigentlichen Einnahmequelle – aber, würde ich darauf bestehen, dass meine Anzeige auch dann angezeigt wird, wenn nach ähnlichen und verwandten Begriffen gesucht wird, und dass sie nicht bereits nach einem Bruchteil der gekauften Anzeigendauer aus dem Sichtfeld der Suchenden verschwindet.
Wer erinnert sich noch daran, warum Google so berühmt wurde? Es war die zur damaligen Zeit ungeschlagen hohe Qualität der Treffer, die dies möglich machte. Dieses Alleinstellungsmerkmal haben Stellenmärkte und Jobsuchmaschinen scheinbar bisher noch nicht richtig erkannt. Selbst “simply hired” kommt da noch nicht ran, wenn es für “Klempner” und “Spengler” immer noch unterschiedliche Suchergebnisse liefert.
1 Kommentar lesen »
Thomas Hoppe, Samstag, 27. März 2010
Da semantische Modelle im Kontext von eBooks durchaus interessant sein könnten, sei hier mal auf den Tagesspiegelartikel zum Berliner Wettbewerb zu “Evolving Books” hingewiesen.
Mit einer expliziten Modellierung könnte man weitere Zusammenhänge eines Buches erschliessen (z.B. in welchen Bänden einer Reihe taucht eine Person oder ein Gegenstand auf), anfragbar machen (Welche Personen stehen in einer bestimmten Beziehung zu einer anderen Person?) oder ein eBook mit Zusatzinformationen über die Orte, Gegenstände, Handlung, Gedanken der Protagonisten ausstatten. Interessant könnte es auch sein die Sichtweise des Autors über die Handelnden und die Handlung über die entsprechenden Textpassagen zugänglich zu machen oder ein dynamisches Buch, das unterschiedliche Versionen einzelner Passagen umfasst und damit einen Einblick in den Entstehungsprozess gibt. So zu sagen ein “The Writing of …”.
Einen Kommentar schreiben »
Magnus Niemann, Mittwoch, 3. März 2010
Manchmal (aber nur manchmal) denken wir Anwender semantischer Technologien auch in viel zu komplizierten Bahnen. Ein wunderschönes Beispiel liefert Johannes “beetlebum” Kretzschmer in diesem Cartoon.
1 Kommentar lesen »