A TF-IDF az angol term frequency-inverse document frequency kifejezés rövidítése, magyarra fordítva a kifejezés gyakoriság – fordított dokumentum gyakoriságot jelenti. Ez a szakszó egy olyan keresőoptimalizálási technológiát takar, amikor más szövegek elemzésével ismerjük meg azokat a kifejezéseket, melyeket nekünk is használnunk kell a saját tartalmainkban.
A TF-IDF mögötti folyamatok
A TF-IDF fontosságát a keresőoptimalizálás evolúciója adja, hiszen napjainkban már nem elég csupán néhány kulcsszót beleírni a szövegbe, a Google szoftverei ennél sokkal fejlettebbek. Az amerikai cég mesterséges intelligenciával és gépi tanulással elemzi az interneten található szövegeket, melyekből folyamatosan tanul. Az egyik legfontosabb ismeret, amit egyre inkább magáévá tesz, hogy a szavak milyen más szavak környezetében találhatók meg.
Például tudja, hogy ha valaki a MOZ cégről ír, akkor a szövegben nagy valószínűséggel szerepel majd a SEO szó. Emellett arról is vannak adatai, hogy az adott kifejezés milyen gyakorisággal tűnik fel, illetve pontosan mely más szavak mellett.
Ezt az egész tudásanyagot a Google lefordítja a matematika nyelvére, így végül a tartalmak elemzése után hatalmas számhalmazokat tárol el. Ezekkel hasonlítja össze a mi tartalmunkat a feltérképezése után, és így határozza meg, mennyire releváns a témához.
A TF-IDF felhasználása
A TF-IDF-ből a TF azt mutatja meg, hogy egy kifejezés milyen gyakran szerepel a szövegben. Az IDF pedig azt, hogy ez mennyire fontos, így kiszűrhetőek az olyan gyakori, de nem releváns szavak, mint például az „és”, a „vagy”, illetve más töltelékszavak.
A TF-IDF elemzést általában szoftverek végzik, melyek megmutatják, hogy az interneten az adott kulcsszóra jól szereplő oldalak milyen kifejezéseket tartalmaznak. Megjelenítik ezek gyakoriságát, és javaslatokat tesznek arra, hogy mivel javítsuk még a saját cikkünket. Ez lehet a hiányzó szavak pótlása, de egy-egy szó többször vagy kevesebbszer történő használata is.
A végeredményben olyan tartalmat kapunk, mely nagy valószínűséggel tartalmazza a Google által szükségesnek ítélt kifejezéseket, ezért jobban teljesít majd a találati listák összeállításakor. Természetesen a Google nem hozza nyilvánosságra az általa feldolgozott adatok összefüggéseit vagy a kulcsszavak közötti kapcsolatot, de a TF-IDF segítségével nagyon jól el lehet találni, mi kell még egy szövegbe.
Nem csak a kulcsszavak fontosak
A TF-IDF során érdekes összefüggésekre deríthetünk fényt. Ez az elemzés ugyanis nem azt mondja el, hogy milyen szavak hasonlítanak az általunk választott kulcsszóhoz, hanem, hogy melyeket használják vele együtt. Emiatt sokszor egészen képtelen találatokat kaphatunk, viszont a tévedés kizárva, mert a TF-IDF a jól teljesítő tartalmakból számolja ki ezeket az adatokat.
A tapasztalatok szerint az elemzés elvégzésével és a javaslatok megfogadásával sokszor hatalmas javulás látható a találati listákon elfoglalt helyezésekben.