Search Camp Episode 50: 7 gute Gründe gegen WDF*IDF – und wie Du es trotzdem sinnvoll einsetzen kannst

29. Mai 2018 | Von in Podcast "Search Camp", SEO

Wer Texte für Suchmaschinen optimiert, nutzt nicht mehr simple Metriken wie Keyword-Dichte. Stattdessen hat sich WDF*IDF als „inoffizieller Standard“ etabliert. Aber ist die Nutzung von WDF*IDF wirklich sinnvoll? Welche Gründe gibt es dagegen? Und wie kann man es trotzdem sinnvoll nutzen?

> Alle Episoden von Search Camp als RSS-Feed
> Search Camp bei iTunes
> Alle Folgen: www.searchcamp.de

 

Shownotes:

Hinweis auf mein Online-Seminar: Der perfekte Content

 

Transcript:

Ihr hört heute Episode Nummer 50 mit dem Thema: 7 gute Gründe gegen WDF*IDF und wie du es trotzdem sinnvoll einsetzen kannst. Gleich geht’s los!

Danke fürs Dranbleiben. Episode Nummer 50, ich habe schon gesagt, wer hätte es gedacht? Ich bestimmt nicht. Insgesamt gibt’s ein paar mehr Folgen als 50, gebe ich zu. Es gibt da noch die Monatsrückblicke, die haben keine Episodennummern, deswegen zählen die da nicht mit rein, plus ein paar Konferenz-Specials. Aber es gibt quasi 50 richtige Folgen. Danke an Euch alle fürs Zuhören, fürs Dranbleiben, fürs Abonnieren und auf weitere 50 Folgen. Ich arbeite dran. Mein Thema heute ist WDF*IDF. Viele nutzen das. Das ist in vielen Tools mittlerweile eingebaut, in einigen Onpage-Tools, in den ganzen Textbroker-Datenbanken-Tools ist das mit drin. Worum geht es dabei eigentlich? Primär geht es um das Thema Textqualität. Müssen wir ein bisschen zurückgucken. Früher gab es viele minderwertige Texte. Heute vielleicht auch noch, aber früher waren sie noch minderwertigerer, und zwar gab es früher sogenannte Content Farmen wie eHow, da waren einfach hunderttausende Texte drauf von Leuten geschrieben, die von dem Thema eigentlich überhaupt keine Ahnung hatten. Mit dem Google Panda Update, das ist auch jetzt schon echt lange her, hat Google sich dagegen gewehrt und gesagt, jetzt gucken wir uns auch die Textqualität an. Google hat versucht automatisch zu bewerten wie gut ist ein Text, um einen schlechten von einem guten Text zu unterscheiden. Eine Möglichkeit das zu machen, sind sogenannte Proof and Relevant Terms. Das heißt man guckt sich einfach einen Text an und guckt nach, welche typischen Wörter müssten eigentlich so drin vorkommen in dem Text. Ein Beispiel: Wenn ich zum Beispiel einen Text über Aspirin schreibe, dann werden mit einer gewissen Wahrscheinlichkeit auch Wörter wie Schmerzmittel, Kopfschmerzen Bayer und andere Wörter drin vorkommen. Wenn ich jetzt einen Text über Aspirin schreibe, 500 Wörter und keines dieser Wörter kommt darin vor, dann könnte das ein schlechtes Zeichen sein in Bezug auf die Textqualität. WDF*IDF versucht genau das, es versucht nämlich so eine Erwartungshaltung festzustellen, welche Proof and Relevant Terms gehören eigentlich als unterstützende Elemente in so einen Text. Früher war es nur Keyword-Dichte, das Keyword musste irgendwie mit 2 Prozent, 5 Prozent irgendwas Keyword-Dichte drin vorkommen. Jetzt gehts um mehr, um zu beweisen, dass mein Text auch wirklich hochwertig ist. WDF*IDF, grundsätzlich ist es erst mal eine interessante Sache, vor allem, wenn man guckt, wem das eigentlich hilft. Vor allem hilft es manchen Textern. Das heißt mancher Texter, früher hatten die diese Vorgabe, hier, Keyword-Dichte soundso viel und dann konnte ein Tool das testen und heute kann man den Testern eine Metrik an die Hand geben und sagen, das ist die Erwartungshaltung an deinen Text, bitte schreibe den Text so, dass dieser die Erwartungshaltung erfüllt. Ist doch erstmal eine gute Sache. WDF*IDF hat mit Sicherheit ein bisschen das Texten verändert. Jetzt sage ich, das ist eigentlich gar nicht so gut. Hm, ich habe insgesamt 7 Gründe vorgebracht, wo ich so Probleme bei dem ganzen Ding sehe.

Problem Nummer 1: Viele Tools liefern sinnlose Vorschläge. Ich habe zum Beispiel mal zwei Suchanfragen reingesteckt in wdfidf-tool.com, das ist ein kostenloses Tool, was man nutzen kann, um so eine Auswertung zu bekommen. Da stecke ich ein Wort wie „Geldanlage“ rein und ich kriege Suchvorschläge wie „Stern“, „dpa“, „Mietwagen“, „Samstag“, „Nachhilfe“. Alles Wörter, die glaube ich, nicht unbedingt in einer semantischen Beziehung zu Geldanlage stehen. Oder ich stecke rein das Wort Rimowa Koffer und ich kriege Wörter wie „Schnellansicht“, „lieferbar“, „Koffer24“, „Topseller“, „Amazon“, „Bademode“. Wenn ich jetzt komplett irre wäre und ich müsste einen Text über „Rimowa Koffer“ schreiben, dann würde ich also alle diese Wörter einbauen. Jetzt müsste ich natürlich in meinen Koffer-Onlineshop Wörter wie „Amazon“ oder „Koffer24“ einbauen, was mit Sicherheit keine Freude wäre. Diese Tools liefern einfach viele unsinnige Vorschläge deswegen, weil sie sich nur 10 Suchergebnisse angucken. Wenn man sich mal anguckt, was guckt Google sich eigentlich an? Google guckt sich nicht nur 10 Suchergebnisse an, sondern dadurch, dass sie Zugriff auf ihren Index haben, können sie sich ein viel breiteres Ergebnis angucken. Anstatt 10 Suchergebnisse können die sich mit Sicherheit 10 Milliarden Seiten angucken, was natürlich irgendwie ein bisschen besser ist. Deswegen das Hauptproblem, was ich sehe, ist, dass diese Tools einfach einen gewissen Anteil an semantisch nicht relevanten Suchbegriffen ausliefern und wer sich daran sklavisch hält, hat mit Sicherheit ein Problem.

Problem Nummer2: WDF*IDF ist nur EINE Metrik. Es gibt natürlich noch viel mehr. Das heißt, wenn ich nur auf WDF*IDF gucke, habe ich ein Problem. Was gibt‘s denn da noch so? Was macht einen guten Text aus? Ein Punkt zum Beispiel Lesbarkeit und Struktur. Habe ich Bullet Points? Verwende ich Zwischenüberschriften? Habe ich lesbare Absätze? Nutze ich Fettungen in meinem Text? All das sollte ich haben, damit er auch gut lesbar ist. Trifft meine Seite auch den Search Intent? Passt sie zu dem, was der Nutzer eigentlich wirklich erwartet? Auch das kann WDF*IDF nicht wirklich abbilden. Auch Themen wie Wortschatz oder Reading Level, also ist das jetzt auf dem sprachlichen Niveau eines Dreijährigen oder eines amerikanischen amtierenden Präsidenten oder ist das ein medizinischer Fachtext? Auch das kann wichtig sein, vor allem je nach meiner Zielgruppe. Themen wie Grammatik, Rechtschreibung werden da durch WDF*IDF auch nicht abgedeckt. Auch die Frage, kommen in meinem Text eigentlich Bilder oder Videos vor? Was natürlich vor allem dann sinnvoll ist, wenn es ein visuelles Thema ist, also wenn erwartet wird, dass Bilder oder Videos drin vorkommen. Und das große Thema in Richtung Holistic Content, sind meine Inhalte auch vollständig? Also beantwortet dieser Text vollständig das Problem, um das es eigentlich geht? Das sind alles Themen, die WDF*IDF erst mal nicht abbildet. Das heißt, wenn ich nur auf WDF*IDF gucke und sehe, ich habe da einen hohen Score, kann mein Text trotzdem kompletter Müll sein.

Angrenzend daran Problem Nummer 3: WDF*IDF kann auch sinnlose Texte hoch bewerten. Es würde mir gelingen einen komplett sinnentleerten und nicht lesbaren Text zu schreiben, der trotzdem ein gutes WDF*IDF Rating bekommt. Das ist ähnlich wie eine Keyword-Dichte. Bei Keyword-Dichte wurde auch nur geguckt, kommt das Keyword soundso oft vor und hier guckt man, kommen bestimmte Proof Keywords richtig oft vor. Das heißt es ist eigentlich keine robuste Metrik, die ich nicht irgendwie austricksen kann.

Problem Nummer 4: Das ist glaube ich bei allen semantischen Analysen so, das Problem mit Mehrdeutigkeiten. Wörter wie Java, was Programmiersprache und Insel ist oder Golf, Sportart und Auto, das kann WDF*IDF erstmal auch nicht abbilden, sondern wenn ich jetzt Golf eingebe, wird es mir sowohl Suchbegriffe aus dem einen als auch wie aus dem anderen semantischen Lager liefern. Das ist natürlich irgendwie blöd.

Problem Nummer 5: Finde ich eigentlich das das zentralste Problem, es ist nicht klar, ob Google das eigentlich so benutzt. Siehe auch die vorher genannten Punkte, vor allem das zweite Problem. Wenn sie es so nutzen, dann überhaupt nur als eine Methode unter vielen anderen. Also auch wieder, das soll niemals die einzige Metrik sein, es kann sein, dass oder es wird auch so sein, dass Google sich auch viele andere Aspekte anguckt.

Problem Nummer 6: Schere im Kopf, nenne ich das immer. Ich schule relativ viele Redakteure. Früher habe ich ganz viele Redakteure von Fachmedien geschult und schlussendlich haben die mich eigentlich immer getötet, weil dann kam man mit Themen wie Keyword-Dichte und dann hat der Redakteur immer gesagt, nein, für Google schreibe ich nicht, ich schreibe für Nutzer und das will ich alles nicht. Die gleiche Schere im Kopf erzeuge ich eigentlich heute mit WDF*IDF in ganz anderer Form auf einmal neu, wo man nicht sagt, okay, dieses Wort muss so oft vorkommen, sondern diese ganzen Wörter müssten da jetzt bitte auch noch alle eingebaut werden. Ich habe nicht immer den Eindruck, dass das zu einem besseren Ergebnis führt.

Problem Nummer 7: Das geht jetzt wieder auf die Tools. Manche Tools extrahieren nicht nur den Content, sondern auch Boilerplate-Elemente. Was heißt Boilerplate? Zum Beispiel linke, rechte Navigation oder unten der Footer. Wenn da was drinsteht, dann wird Google das oder das Tool wird das auch extrahieren. Das ist vielleicht auch ein Grund, warum zum Beispiel, wenn ich wie eben beschrieben „Geldanlage“ eintippe, dann kriege auf einmal so Wörter geliefert wie „Nachhilfe“ und Nachhilfe ist mit Sicherheit irgendwas, was unten irgendwo in einem Footer oder so stand. Das ist natürlich erst mal relativ sinnlos. Das heißt die meisten Tools können einfach auch nicht so geschickt arbeiten wie Google das könnte. Wenn man einfach nur den Text aus der ganzen Seite extrahiert, dann kriegt man auch sehr viel Müll mit.

 

Das waren die 7 Probleme. Jetzt ist natürlich die Frage: Ist WDF*IDF damit eigentlich kompletter Quatsch? Und natürlich die angehängte Frage: Sollte ich das jetzt eigentlich nutzen? Erstmal, ich glaube nicht, dass es kompletter Quatsch ist. Man muss nur die vorgenannten Probleme kennen. Ich habe aber trotzdem eine These vorab und meine These ist, guter Content ist automatisch WDF*IDF optimiert. Das heißt, wenn ich jetzt wirklich einen Profi ran setze, also Profi nicht im Sinne von, dass das jetzt ein Redakteur ist, sondern Profi in dem Sinne, dass er sich mit diesem Thema wirklich gut und umfassend auskennt, dann wird der in der Regel auch einen Text schreiben, der fast automatisch WDF*IDF optimal ist. Zumal niemand sagen kann, was wirklich jetzt das Optimum ist. Deswegen ist das ohnehin eine relativ schwierige Sache. Aber ich glaube nach wie vor, dass wenn man wirklich einen Profi dran lässt, dann kriegt dieser Text auch eine gute Bewertung, weil er einfach automatisch diese Keywords einbauen wird. Das ist keine Rocket Science, wo ich jetzt denke, oh, ich schreibe jetzt etwas über Aspirin und das Wort Schmerzmittel oder Kopfschmerzen kommt nicht drin vor. Das würde den Redakteur, der halbwegs was davon versteht, überhaupt nicht hinbekommen diese Wörter einfach mal nicht einzubauen. Das gilt natürlich nur, wenn auch ein Profi schreibt. Wenn ich über eines der Content Netzwerke gehe und Leute über irgendwas schreiben lasse, dann ist WDF*IDF vielleicht eine ganz gute Sache. Grundsätzlich, ich weiß, es ist ein heikles Thema da draußen, ich möchte immer gerne die Profis schreiben lassen, also wirklich die Leute, die sich damit auskennen. Das funktioniert natürlich nicht immer. Von daher muss man da natürlich immer entscheiden, was möchte ich eigentlich hinbekommen und so. Aber natürlich das, was man klassisch früher 3-Sterne-Content nannte, geht einfach nicht mehr, weil wenn man jetzt einfach nur sagt, schreibe einen Text zum Thema X und da schreibt jemand, der keine Ahnung davon hat, dann wird der in der Regel einen Text schreiben, der in Bezug auf WDF*IDF oder andere semantische Analysen einfach auch nichts taugt. Also die Frage: Wie kann man WDF*IDF sinnvoll einsetzen? Vor allem, indem ihr kritisch seid. Wenn ihr so eine Analyse kriegt, dann muss euch einfach klar sein, dass die oben genannten Probleme alle gelten. Ihr solltet natürlich, wenn ihr es könnt, Suchbegriffe einbauen, aber bitte im Rahmen einer Gesamtstrategie, also dass ihr wirklich erst einmal unsinnige Themen komplett rauslasst und natürlich auch, dass ihr euch auf die anderen Textbaustellen hin orientiert, also alles, was ich eben genannt hatte, wie Vollständigkeit der Inhalte oder auch Wortschatz, Search Intent, Lesbarkeit, Struktur. Im Zweifel finde ich das deutlich wichtiger als jetzt irgendwie ein gutes WDF*IDF Rating.

Ich möchte da vielleicht insgesamt nochmal auf mein Seminar hinweisen, auf mein Online-Seminar „Der perfekte Content“. Da bringe ich in insgesamt 4 Zeitstunden inklusive einer kleinen Pause, also quasi an einem halben Tag online alles bei, was meiner Meinung nach in Bezug auf gute starke Inhalte wichtig ist. Da geht es auch um Themen wie Keyword-Recherche natürlich, um Featured Snippets. Da geht es auch um WDF*IDF, da geht es aber auch um Vollständigkeit der Inhalte, Holistic Content, all diese ganzen Themen. Wenn ihr da Lust habt, geht ihr auf omcampus.de, da werdet ihr das Seminar schon finden und dann könnt ihr euch gerne dafür anmelden. Das war’s auch schon für heute, fast wieder eine relativ kurze Folge. Ich hoffe, dass ich euch ein paar Impulse liefern konnte zum Thema WDF*IDF. Ist so ein bisschen vielleicht eine Folge aus meiner virtuellen Reihe „Bleibt kritisch!“, also schluckt das nicht einfach nur, weil irgendein Tool sagt „Du musst jetzt WDF*IDF machen“ und „hier, dein Text passt nicht perfekt dazu“. Hinterfrage das Ganze bitte, gucke dir an, was liefert WDF*IDF und entscheide dich dann dafür, wie du das Ganze wirklich nutzen möchtest. Und nochmal wie gesagt am besten lasst die Profis den Content schreiben, also die, die sich richtig mit dem Thema auskennen, weil sie einfach wahrscheinlich automatisch WDF*IDF quasi eingebaut haben und solche kruden Werkzeuge vielleicht gar nicht brauchen. Das war’s für heute mit Episode 50. Wie gesagt ich hoffe, dass noch 50 Episoden folgen, gerne auch noch mehr. Wenn es euch gefallen hat, schreibt mir eine Nachricht oder hinterlasst irgendwo einen Kommentar, ich finde das schon. Das war‘s für heute. Ich wünsche euch noch eine gute Zeit und bis bald.

The following two tabs change content below.
Avatar-Foto

Markus Hövener

Markus Hövener ist Gründer und SEO Advocate der auf SEO und SEA spezialisierten Online-Marketing-Agentur Bloofusion. Als geschäftsführender Gesellschafter von Bloofusion Germany ist er verantwortlich für alle Aktivitäten in Deutschland, Österreich und der Schweiz. Markus Hövener ist Buchautor, Podcaster und Autor vieler Artikel und Studien rund um SEO.

Markus hat vier Kinder, spielt in seiner Freizeit gerne Klavier (vor allem Jazz) und genießt das Leben.

Kommentieren