STC 0.40

non Public BETA Release

Die aktuelle Version 0.40 läuft soweit stabil. In den unterschiedlichen Environments werden keine Fehler bei der Aktivierung/Deaktivierung des plugins angezeigt. So konnte ich mich auf die Entwicklung der Sidebar Properties konzentrieren. Die Darstellung der Cloud kann nun vollständig über die sidebar konfiguriert werden (Schriftgröße, Schriftfarbe und Cloud Bezeichnung).

STC sidebar properties
STC sidebar properties
version 0.40

Infolgedessen musste ich die Speicherung der Optionen nochmal überarbeiten: Zwar hatte ich vorher die Properties schon in einem Array gespeichert, nun speichere ich die Properties innerhalb der Versionsbezeichnung.

bug[0004] Der Term-Name kann Leerzeichung und Umlaute enthalten, diese können nicht als Link genutzt werden. Lösung: Angezeigt wir der Term-Name, als Link wird jedoch der Term-Slug genutzt (Leerzeichen werden durch Bindestriche ersetzt, sowie Umlaute automatisch umgewandelt).

Der Quellcode konnte durch einige Vereinfachungen gekürzt werden und ist nun inklusive aller Kommentare keine 650 Zeilen lang.

STC 0.35

non Public BETA Release

Die aktuelle Version 0.35 ist auf der Webseite crazyapple.com und auf mehreren Testinstallation erfolgreich im Probebetrieb.

Nachfolgend die Änderung zur beschriebenen Version 0.31:

  • Einige Optionen werden in der Standard wp_options Tabelle in einem ARRAY gespeichert. Dazu gehören: Fontgröße, Fontfarbe, Anzahl der importierten Daten,Anzahl der Tags, Anzahl der veröffentlichten Beiträge und der aktuelle Timestamp.
  • [bug001] das erste Feld in der Auswahl des fix_links ist immer mit dem ersten post/page des Blogs gefüllt – fixed, per default leer (Ergebnis ARRAY erhält einen leeren Eintrag, anschließend Sortierung)
  • [bug002] speichert man den Wert “Priorität” wurde immer der erste Wert in der “fix_link” Spalte mitgespeichert – fixed
  • [bug003] eine “placeholder_id” in widget.php verwies auf einen leeren Eintrag in der Posts-Tabelle, Lösung über ARRAY ref[bug001]
  • Nach jeder Speicherung eines Post/Page Beitrages wird überprüft, ob neue Tags dem Artikel hinzugefügt wurden und entsprechend die Beziehungstablle ergänzt
  • In den Optionen ist es nun möglich eine Beziehung als deaktiviert zu markieren. Damit bleibt der Eintrag in der Tabelle bestehen, wird jedoch nicht angezeigt
    STC_035_options_bar
    Deaktivierte Einträge werden in den Optionen, jedoch nicht in der Übersicht (Daahboard), welche für jeden sichtbar ist, angezeigt
  • Erweitertes ERROR Handling beim Import und bei der Änderung von deaktivierten Beziehungen

–en– Semantic Tag Cloud

english version / german version

Description

In the field of enterprise content management search is a central component for many years. Two kinds of searches are established for years:

  • Full text search: this requires an indexing service / server and computing capacity
  • Filter navigation / also called meta search or search for attributes.
    Content must be well attributed so that a search via attributes makes sense.

In a meeting with an important customer on the subject of faceted search the following questions and requirements came up:

“Why are no documents shown whose content is related to this document?”

“Can I choose the entrance level of the successive filter myself or must the user always go through the whole search tree from top to down?”

“I want to determine the result / target of certain queries.”

From this brainstorming with users without a deeper technical knowledge I took the three fundamental ideas and developed the following functional description. It is clear to me that this deals with semantic only on principle. However I want to reach the target in several steps. For this reason the source code for the plug-in has been optimized to ease reading it.

Simultaneously to this plug-in an adapted search based on EMC’s Explore is developed. Especially xCP 2.0 already offers four kinds of search (real-time, historical, full text and task-list query) which can be extended accordingly. Real-time query is especially interesting because the search result can be updated after each new input.

Functional description

This plug-in extends the functionality of a simple tag cloud in WordPress by three points:

  1. Keywords are assigned to each article in the blog
  2. Keywords have an importance and are displayed accordingly
  3. Keywords can point to a certain article and not to the tag search

Keywords are assigned to blog articles

For each article in the blog keywords are displayed separately. The advantage of this is that different but also similar keywords can be displayed on each page.

crazyapple_com_all_tags
Cloud including all available tags form Mr.Crazyapples’s blog.

E.g.: the keywords Audi, BMW, Mercedes and Peugeot are assigned to the page ‘cars’. On the page ‘bicycles’ the keywords Hercules, Gudereit, BMW and Peugeot exist. The keywords BMW and Peugeot can be prioritized differently on both pages based on the context.

All this requires that tags are assigned wisely and in a certain amount. A number of 12 to max. 24 tags has proven reasonable. Too little keywords do not complete the cloud and / or many keywords are equally prioritized. On the contrary many keywords take away clearness and the important relationships are not distinctly marked.

Prioritizing keywords

In common presentation keywords are prioritized by frequency. A frequent word is more important than a word that occurs only once or twice. On principle this is correct. However this principle has certain disadvantages for example if only a few tags are assigned and many infrequent keywords are presented. In this case all tags would seem to be equally important.

Tags relative to the specific page.
Tags relative to the specific page.

Prioritizing keywords offers the possibility to even mark tags as important that are assigned only once.

E.g.: in a DMS many documents on server installation, server administration, user management and so on exist. The document on server security exists only once and its tag is not valid for the other documents. Nevertheless the document ‘Server security’ must always be displayed as important in the tag cloud.

Permalinking keywords

In the demonstration (presentation) before the brainstorming it was criticized as well that from the cloud always the search function is called. Certain keywords should only be linked to a certain document. However this idea is interesting even though it contradicts the basic principle of search. I have seized this idea and want to test this feature in practice.

STC 0.31

non Public BETA Release

Erste Anwendung des WordPress Plugins Semantic Tag Cloud (STC) außerhalb der Entwicklungsumgebung. Diese Version läuft stabil und ist in ihrer Grundfunktionalität voll einsetzbar.

Kurzbeschreibung

Jeder Post- oder Page-Beitrag kann mit individuellen Schlüsselwörtern versehen werden. Auf jeder Seite wird eine individuelle Tag Cloud erzeugt, deren Schlüsselworte unabhängig von einander administrierbar sind. Es wird eine semantische Beziehung unter den Schlüsselworten simuliert und nachgebildet.

Funktionsbeschreibung

Bei der Aktivierung des PlugIns wird eine neue Tabelle mit der Bezeichnung “stc_terms_relation” erzeugt.

prewiew_tagsscreenshot 1Tag cloud ohne Priorisierung.

In dieser zusätzlichen Tabelle, die bei der Entfernung des PlugIns vollständig löscht wird, werden alle Pages / Posts mit den entsprechenden Tags gespeichert. Über die

Tags relative to the specific page.
Tags relative to the specific page.

Einstellungen des STC in der Administrationsseite von WordPress kann jedem Schlüsselwort individuell die Priorität und ein permanenter Link auf eine interne Seite des Blogs zugeordnet werden.
Das Plugin stellt für die Darstellung auf den Seiten ein Widget zur Verfügung. Auf jeder Seite mit Schlüsselworten wird eine Cloud erzeugt und die Schlüsselworte in zufälliger Reihenfolge angezeigt (screenhot 1und 2).

Ohne Bearbeitung der Schlüsselworte in den Einstellung des STC macht die Cloud keinen Sinn. Schlüsselworte sollten für jede Seite gezielt ausgewählt und entsprechend priorisiert werden.

STC Tabellenüberschriften
STC Tabellenüberschriften
  • num = Durchnummerierung
  • assigned page = zugeordnete Seite
  • tag Name = Schlüsselwort
  • tag prioritization = Priorisierung des Schlüsselwortes
  • page type = Seite oder Beitrag (page or post)
  • fix page link = Verlinkung auf eine vorhandene, publizierte Seite oder Beitrag
  • disable fixlink = Checkbox, wenn gesetzt, dann gespeicherten fixlink entfernen
stc settings unbearbeitet
Die Tags der Seite “Compliance Services” sind unpriorisiert

Beispiel

Auf der Seite “Comliance Services for Documentum” sind die Schlüsselwörter “Compliance, Documentum, FSR, FSS und Records Manager” vergeben. Alle Schlüsselworte haben eine Priorisierung von 3 (1 hohe bis 3 niedrige Priorität), alle Seiten sind vom Typ Post und haben keinen fixlink auf eine interne Seite (screenshot oben). Die vergebenen Schlüsselworte werden nun kontextbezogen priorisiert und das Schlüsselwort “Documentum” verweist in diesem Zusammenhang immer auf die Startseite von “Content Management Foundations”.
Das Ergebnis kann man sich hier anschauen. Als sinnvoll hat sich herausgestellt zwischen 15 und 18 Tags pro Seite zu vergeben. Dann ist die Wolke gut mit Schlüsselworten gefüllt und wichtige Inhalte stechen sehr gut hervor.

tags_prioritized
Die Tags der Seite “Compliance Services” sind priorisiert