Technická SEO analýza přestala být záležitostí výhradně klasického vyhledávání. Generativní AI systémy čtou weby stejnými cestami jako Googlebot, a technické překážky je odradí stejně spolehlivě. Web s chybovými stavovými kódy, nekomprimovanými soubory nebo nesprávnými přesměrováními nedostane šanci stát se citovaným zdrojem v AI odpovědi, bez ohledu na to, jak hodnotný obsah obsahuje. Tento článek vysvětluje, kde technické SEO a GEO optimalizace sdílí společný základ.

Jak AI vyhledávače získávají obsah webů

Generativní AI systémy nepracují s weby v reálném čase tak, jak si je mnoho lidí představuje. Jejich znalostní báze vzniká z předtrénování na velkých objemech dat a průběžně se doplňuje crawlováním webu, které se v principu příliš neliší od klasického crawlování Googlebotu.

Crawler musí stránku najít, správně načíst a zpracovat její obsah. Technické překážky v tomto procesu fungují jako filtry. Web, který crawler nedokáže spolehlivě přečíst, jednoduše do znalostní báze AI systému nevstoupí. A web, který do znalostní báze nevstoupí, nemůže být citován v odpovědích, které AI generuje.

Proč GEO začíná technickým auditem

GEO, neboli optimalizace pro generativní vyhledávače, se v odborné komunitě nejčastěji diskutuje jako obsahová disciplína. Jak psát autoritativně, jak strukturovat odpovědi na otázky, jak budovat citovatelnost. Technická vrstva se přitom občas opomíjí. Přesto praxe ukazuje, že weby s technickými problémy se do AI odpovědí nedostávají ani tehdy, když jejich obsah kvalitou převyšuje konkurenci.

HTTP status kódy a co prozradí o zdraví webu

HTTP status kód je první věc, kterou crawler při návštěvě URL zjistí. Kód 200 znamená, že stránka existuje a je dostupná. Kódy 4xx signalizují chybu na straně požadavku, kódy 5xx chybu na straně serveru.

Stránka vracející status 404 se z indexu klasického vyhledávače postupně vytratí. Pro AI systémy platí totéž: URL, která vrátí chybu, se do znalostní báze nedostane. Problém nastává u stránek, které vrátí status 200, ovšem místo obsahu zobrazí chybovou hlášku nebo prázdnou šablonu. Tyto tzv. soft 404 crawler technicky projde, ale obsah nezpracuje smysluplně.

Pravidelná kontrola HTTP statusů napříč webem odhalí stránky, které existují v interních odkazech nebo sitemapě, ovšem uživatelům ani crawlerům neslouží. Všeobecný přehled HTTP stavových kódů najdete zde.

Přesměrování, kdy pomáhají a kdy ne

Přesměrování 301 slouží k trvalému přesunu obsahu z jedné URL na druhou. Správně použité přesměrování přenese hodnocení stránky i crawlery na novou adresu bez ztráty viditelnosti. Problém nastane ve chvíli, kdy se přesměrování řetězí.

Řetězec přesměrování vzniká tehdy, když URL A přesměruje na URL B, která přesměruje na URL C, jež přesměruje na URL D. Každý skok v řetězci stojí čas a část přeneseného hodnocení. AI crawlery mají podobně jako Googlebot limit na počet přesměrování, která jsou ochotné sledovat. Dlouhý řetězec tedy reálně znamená, že crawler zastaví dřív, než dosáhne cílového obsahu.

Migrované weby a e-shopy po redesignu trpí přesměrovacími řetězci nejčastěji. Každá migrace přidá vrstvu přesměrování na tu předchozí a výsledkem jsou po několika letech řetězce o pěti sedmi skocích.

Komprese a HTTP/2 – technické detaily s měřitelným dopadem

GZIP a Brotli komprese zmenšují velikost přenášených souborů. Nekomprimovaná stránka posílá prohlížeči i crawleru surová data plné velikosti. Stránka s aktivní kompresí posílá zlomek tohoto objemu. Pro crawlery, které procházejí miliony stránek denně, je rychlost načtení každé z nich signálem efektivity.

HTTP/2 oproti staršímu protokolu HTTP/1.1 umožňuje paralelní přenos více souborů v rámci jednoho spojení. Weby běžící na HTTP/1.1 přenášejí soubory postupně, jeden za druhým. Při stránce s desítkami externích zdrojů je rozdíl v době načtení měřitelný.

Obě technologie jsou dnes dostupné na většině moderních hostingů bez příplatku. Přesto audit pravidelně odhaluje weby, kde komprese ani HTTP/2 aktivní nejsou, protože nikdo po spuštění hosting nekonfiguroval.

Flash obsah aneb technická fosílie

Adobe Flash přestal být podporován ke konci roku 2020. Prohlížeče ho odmítají spustit, mobilní zařízení ho nikdy nepodporovala a crawlery jeho obsah nikdy nečetly. Přesto se Flash obsah na webech stále vyskytuje, zejména na starších firemních webech a e-shopech, které prošly kosmetickými úpravami, ovšem nikdo nesáhl na strukturu šablony.

Stránka s Flash obsahem nepřijde o indexaci kvůli Flashi samotnému. Problém je jiný, Flash zpravidla nahrazoval důležitý obsah, typicky produktové prezentace, interaktivní prvky nebo navigaci. Pokud tento obsah existuje pouze ve Flashi, crawler ho nevidí a AI systém ho nikdy nezpracuje.

Jak technický stav webu rychle zkontrolovat

Pro první orientaci bez přístupu ke kódu nebo serverové konfiguraci poslouží automatizovaný nástroj. Technická SEO analýza prověří HTTP status stránky, přesměrování, aktivitu GZIP a Brotli komprese, podporu HTTP/2, velikost HTML dokumentu a přítomnost Flash obsahu. Výsledek dostanete bez registrace pro libovolnou veřejně dostupnou URL.

Technické SEO a GEO nejsou dvě disciplíny

Otázka, zda optimalizovat pro klasické vyhledávání, nebo pro AI systémy, přehlíží jeden podstatný fakt: obojí stojí na stejném technickém základě. Web, který crawler nedokáže přečíst, nebude viditelný nikde. Technická čistota webu proto není volitelná součást SEO strategie pro pokročilé, ale vstupní podmínka pro jakoukoli jinou optimalizaci, ať míří na Google, Perplexity, nebo cokoliv, co přijde po nich.

Stanislava Malínková