–de– Semantic Tag Cloud

german version / english version

Beschreibung

Im Bereich Enterprise Content Management ist die Suche seit vielen Jahren ein zentraler Bestandteil. Zwei Arten von Suchvorgängen sind seit Jahren etabliert:

  • Volltextsuche
    diese erfordert einen Indizierungs- Dienst / -Service / -Server und Rechenleistung
  • Filternavigation /Metasuche oder Suche nach Attributen genannt
    Der Content muss dabei gut attribuiert sein, so dass eine Suche über die Attribute auch Sinn macht

Bei einem Meeting bei einem namhaften Kunden zum Thema Faceted Search kam es zu einem Brainstorming:

“Wieso werden keine Dokumente angezeigt, die mit dem Dokument eine inhaltliche Beziehung haben?”

“Kann ich die Einstiegsebene des sukzessiven Filters selbst bestimmen? Oder muss der Anwender immer den ganzen „Suchbaum“ bis nach unten durchgehen?”

“Ich möchte das Ergebnis/ Ziel ausgewählter Suchanfragen bestimmen.”

Aus diesem Brainstorming mit reinen Anwendern ohne vertiefendes Technik Knowhow habe ich die drei Grundgedanken aufgegriffen und nachfolgende Funktionsbeschreibung erstellt. Mir ist klar, dass dies nur ansatzweise mit Semantik zu tun hat. Ich möchte in mehreren Schritten zu diesem Ziel kommen. Aus diesem Grund ist der Quellcode für dieses PlugIn auch auf Lesbarkeit optimiert worden.

Parallel zu diesem PlugIn entsteht eine angepasste Suche auf Grundlage von EMC‘s xPlore. Gerade xCP 2.0 bietet schon vier Sucharten (Real-Time, Historical, Full-Text und Task-List Query) an, die entsprechend erweitert werden können. Besonders interessant ist die Real-Time Query (RTQ), da bei dieser das Suchergebnis nach jeder Eingabe aktualisiert werden kann (When an input value change).

Funktionsbeschreibung

Dieses Plugin erweitert die Funktionalität einer einfachen Tag Cloud in WordPress durch drei Punkte:

  1. Schlagworte werden jedem Blogbeitrag zugeordnet
  2. Schlagworte besitzen eine “Wichtigkeit” und werden dementsprechend dargestellt
  3. Schlagworte können auf einen bestimmten Artikel zeigen und nicht auf die Tag Suche

Schlagworte sind Blogbeiträgen zugeordnet

Für jeden Blogbeitrag werden die Schlagworte separat angezeigt. Dies hat den Vorteil, dass wirklich jeder Seite unterschiedliche aber auch überschneidende Schlagwörter angezeigt werden können.

crazyapple_com_all_tags
Cloud mit allen im Blog von Mr.Crazyapple vergebenen Schlagworten.

Beispiel: Auf der Seite Auto sind die Schlagworte Audi, BMW, Mercedes und Peugeot zugeordnet. Auf der Seite Fahrrad in die Schlagworte Hercules, Gudereit. BMW und Peugeot vorhanden. Die Worte BMW und Peugeot können auf beiden Seiten kontextbezogen unterschiedlich gewichtet werden.

Dies setzt allerdings voraus, dass die Tags sinnvoll und in einer gewissen Menge vergeben werden. Als sinnvoll hat sich die Anzahl von mind. 12 bis max. 24 Tags ergeben. Bei zu wenigen Schlagworten ist die Cloud nicht ausgefüllt und/oder viele Worte gleich priorisiert. Viele Schlagworte hingegen nehmen die Übersicht und die wichtigen Beziehungen kommen nicht deutlich hervor.

Gewichtung von Schlagworten

Bei der üblichen Darstellung werden Schlagworte nach Häufigkeit gewichtet. Ein häufig vorkommendes Wort ist wichtiger als ein Wort, welches nur ein oder zweimal vorkommt. Im Prinzip stimmt das natürlich. Dieses Prinzip hat auch einige Nachteile, etwa wenn nur wenige Tags vergeben wurden und viele Schlagworte mit geringer Häufigkeit dargestellt werden. Dann sind dem Anschein nach alle Tags gleich wichtig.
Die Priorisierung von Schlagworten bietet die Möglichkeit, auch nur einfach vergebene Tags als wichtig zu klassifizieren.

prewiew_stc_picBeispiel: In einem DMS existieren viele Dokumente zum Thema Serverinstallation, Serveradministration, User Management usw.. Das Dokument mit dem Thema Computersicherheit existiert einmal und deren Tag treffen nicht auf die anderen Dokumente zu. Das Dokument „Computersicherheit“ soll aber immer als wichtig in der Tag Cloud angezeigt werden.

Permalink von Schlagworten

Bei der Demonstration vor dem Brainstorming wurde ebenfalls bemängelt, dass aus der Cloud heraus immer die Suchfunktion angesprochen wird. Ausgewählte Schlagworte sollten doch auf ein bestimmtes Dokument zeigen. Diese Idee ist interessant, obwohl diese dem Grundsatz der Suche wiederspricht. Ich habe diese Idee aufgegriffen und will dieses Feature in der Praxis testen.