WDF/IDF
Im Rahmen der Suchmaschinenoptimierung, speziell der Optimierung von Inhalten, gibt es das Verfahren WDF/IDF. Hinter der Bezeichnung verbirgt sich eine Berechnungsmethode, die ein Verhältnis aus der so genannten „Within-Document-Frequency“ (WDF) und der „Inverse-Document-Frequency“ (IDF) zum Ergebnis hat. Ziel dieser Berechnung ist eine wirkungsvolle „Mischung“ aus der Art und Anzahl bestimmter Suchwörter zu ermitteln. Diese Optimierung bildet einen Ersatz, eine Alternative, zur klassischen Keyworddichte, die auf der blossen Häufigkeit eines bestimmten Schlagwortes innerhalb eines Textes abzielte. Hierbei galt es einen bestimmten Wert zu erreichen, der je nach Meinung zwischen 2 und 4 Prozent schwankt.
Das WDF/IDF-Verfahren geht einen Schritt weiter und beschreibt nicht nur die Häufigkeit eines Schlüsselbegriffs innerhalb eines Dokuments, sondern auch das entsprechende Vorkommen in anderen Dokumenten, die zu diesem Keyword gefunden werden. Zur Berechnung des Wertes wird das Verfahren in zwei unterschiedliche Berechnungen aufgeteilt: WDF und IDF. Bei der WDF-Formel werden zwei Werte (das relative Vorkommen des Keywords und das relative Vorkommen aller anderen Wörter) ins Verhältnis gesetzt. Weil der Wert, wenn man die Keywordanzahl erhöht, stets steigen würde, wird das Verhältnis durch einen Logarithmus in der Formel „gedämpft“. Im zweiten Schritt wird die Inverse-Document-Frequency berechnet, die sich auf die Anzahl der Inhalte zu einem bestimmten Suchbegriff bezieht. Ähnlich wie beim WDF-Wert wird auch hier ein Logarithmus zur Berechnung herangezogen. Im letzten Schritt werden beide Werte multipliziert, was in folgender Formel zusammengefasst wird:
WDF (i) = log2(Freq(i,j) + 1) / log2 (L)
i = Keyword
j = Dokument
L = Anzahl der Wörter
Freq (i,j) = Anzahl des Keywords innerhalb des Dokuments
IDF (t) = log (1 + ND/ft)
t = term (Schlagwort)
ND = Anzahl aller Dokumente
ft = Anzahl aller Dokumente mit t
Daraus ergibt sich dann:
Vorteile und Nachteile der WDF/IDF Methode
Im Gegensatz zur reinen Keyworddichte lässt sich anhand dieser Methode eine sehr viel präzisere Optimierung von Content vornehmen, die darüber hinaus versucht der Komplexität von Suchalgorithmen gerecht zu werden. Gleichzeitig werden dem Benutzer eines entsprechenden Tools zur WDF/IDF-Analyse Schlagworte angezeigt, die in anderen Inhalten mit dem gesuchten Keyword auftauchen, was bei der Latent Semantischen Optimierung behilflich sein kann. In der Summe soll das Ziel ein gut optimierter, natürlicher und ebenso gut lesbarer Artikel sein. Nachteile können vor allem für Onlineshops entstehen, da zur Berechnung der Terme alle Webseitenelemente einbezogen werden. Das umfasst Content ebenso wie Überschriften, Kategoriebezeichnungen und Produktnamen. Das Verfahren kann an dieser Stelle keinen sauberen Wert für einen gut optimierten Text liefern. Darüber hinaus kann die Analyse dazu führen, dass Inhalte verstärkt nach den jeweiligen Begriffen optimiert werden müssen und folglich weniger lesbar sind, was an der Qualität des Contents rüttelt. Und dieser ist bekanntermassen ein Rankingkriterium für Suchmaschinen wie Google – und nicht zuletzt ein Qualitätsmerkmal für den Leser. Es sollte beachtet werden, dass weder ein WDF/IDF optimierter Text (alleine für sich) zu einem optimalen Ranking führt noch eine semantische Optimierung zu ähnlichen Ergebnissen führen kann, denn wer im thematischen Umfeld bleibt, verwendet automatisch nützliche und hilfreiche Begriffe rund um das Keyword.