Jak získat více návštěvníků z vyhledávačů skrze strukturovaná data

Metadata

Pravděpodobně jste si již někdy ve výsledcích vyhledávání na Googlu všimli rozšířených/strukturovaných úryvků. V nich mohou být uvedeny například nadcházející události (školení, kurzy apod.), hodnocení produktů, jejich cena a dostupnost. V předkládaném článku si objasníme, kde Google tato data bere, a jak si je lze nastavit pro váš vlastní web.

Co jsou strukturovaná data

Vyhledávače neumí standardně pochopit, o čem je daný text na webové stránce. Nevědí, že Martin Šimko je jméno a příjmení osoby. Nemají dostatek informací a zdroj dat k tomu, aby mohly data interpretovat.

Nyní přicházejí do hry právě strukturovaná data. Ta explicitně strojům (v našem případě vyhledávačům) popisují strukturu dat. Díky tomu můžeme vyjádřit, že zmíněná část textu je například nadpis článku, další zase podnadpis, samotný text článku nebo právě jméno a příjmení osoby.

Strukturovaná data prošla za dobu svojí existence velkým vývojem, a proto je dnes lze používat pro mnoho případů. Nejčastější typy obsahu se strukturovanými daty, které umí Google zobrazit ve výsledcích vyhledávání, jsou:

  • recenze produktů,
  • osoby,
  • produkty,
  • firmy a organizace,
  • recepty,
  • události,
  • hudba,
  • video obsah

Proč se strukturovaným datům věnovat

Teď se možná ptáte, proč byste měli nasazovat strukturovaná data na vašem webu. Je to přece práce navíc, je nutné zapojit i programátory, kteří mají určitě na první pohled důležitější práci.

Největší benefit z nasazení strukturovaných dat je v tom, že se ve výsledcích vyhledávání odlišíte od konkurence. Z odlišení zase plyne, že více upoutáte pozornost hledajícího uživatele.

Strukturovaná data uživatelům dají více informací přímo ve vyhledávači. Například u produktu v e-shopu hned zjistí jeho dostupnost, cenu nebo jak jej hodnotí další zákazníci. Vypadat to může následovně.

Strukturovaná data.

Na první pohled vás určitě upoutají oranžové hvězdičky – hodnocení produktu a další strukturované informace o produktu. A nejste sami. Podle průzkumů mají výsledky se strukturovanými daty až o 30 % vyšší míru prokliku.

Produktové výsledky vyhledávání jsou ale jen začátek. Podívejte se na další typy strukturovaných dat ve vyhledávači Google.

Nadcházející události. Strukturovaná data.

Nadcházející události

Recepty. Strukturovaná data.

Recepty

V souvislosti s výše uvedenými obrázky si možná vybavíte Google Authorship, kdy Google uměl zobrazovat fotografii a jméno autora dané stránky/článku. Authorship byl však během léta 2014 postupně zcela zrušen.

Český Seznam zatím se strukturovanými daty nepracuje takovým způsobem jako Google. První náznaky zde ale jsou – umí například zobrazit strukturovaně drobečkovou navigaci dané stránky nebo tzv. osnovy – odkazy/kotvy v rámci dané stránky.

Osnovy na Seznamu. Strukturovaná data.

Osnovy na Seznamu

Drobečková navigace na Seznamu. Strukturovaná data.

Drobečková navigace na Seznamu

Jsou strukturovaná data hodnotící faktor pro vyhledávače?

Neexistuje oficiální vyjádření vyhledávačů, že by strukturovaná data byla jeden z faktorů pro řazení výsledků vyhledávání. Matt Cutts (vedoucí web spam týmů v Googlu) v jednom ze svých videí říká, že nasazení strukturovaných dat automaticky neznamená, že web je lepší a bude se zobrazovat na vyšších pozicích. To stejné tvrdí oficiální dokumentace Googlu.

Ani z mých zkušeností, kdy jsem nasazoval strukturovaná data na několik desítek webů nevyplývá, že nasazení vám zlepší pozice. Je to spíše další krok v tom mít autoritativní web. Strukturovaná data nemohou být na webu sama o sobě. Nejdříve potřebujete obsah (data), který označujete. V souvislosti se zvýšením míry prokliku se tedy vyplatí věnovat jim pozornost.

Je důležité upozornit i na to, že vyhledávače nemusí strukturovaná data použít a zobrazovat je ve výsledcích vyhledávání. Je to pouze doporučení, které vyhledávače mohou zohlednit. Ostatně obdobně to je i s dalšími řídícími sekvencemi, jako je například rel=canonical pro práci s duplicitním obsahem apod.

Co je ale důležité – když se rozhodnete strukturovaná data na svém webu používat, implementujte je na co nejvíce místech to jde.

Díky tomu bude větší pravděpodobnost, že Google a další vyhledávače začnou zobrazovat strukturovaná data i ve výsledcích vyhledávání. Když mluvím o co nejvíce místech, mám na mysli například drobečkovou navigaci, stránku s kontakty, logo firmy, interní vyhledávání apod.

Naopak si dejte pozor na to, abyste nezneužívali strukturovaných dat. Zejména jde o to označovat pouze data, která na webu opravdu zobrazujete i návštěvníkům. Pokud budete strukturovaná data podstrkávat jen vyhledávačům, tak se v lepším případě stane, že je bude vyhledávač naprosto ignorovat (s tím jsem se setkal osobně už několikrát), nebo dokonce dostanete penalizaci.

Entitní SEO

Se strukturovanými daty se pojí také entitní SEO. Jde o proces, kdy se osoba, firma, produkt apod. snaží, aby je Google pochopil jako entity/objekty. Objekty v tomto smyslu mají vlastnosti a vztahy s dalšími entitami. Například osoba jako entita má jméno a příjmení. Její vlastnosti jsou například pracovní pozice, vzdělání, výška, váha apod.

Strukturovaná data jsou jedním ze způsobů, jak v entitním SEO uspět. Pokud se chcete krok za krokem dozvědět, jak se jako osoba stát entitou, podívejte se na moji  prezentaci o entitním SEO z konference SEO restart..

Možnosti označení strukturovaných dat

Obecně existují tři způsoby, jak označit strukturovaná data na webu.

  • Mikrodata,
  • mikroformáty,
  • RDFa.

Jde o tři rozdílné formáty označení dat, které lze na webu použít. Google ve své dokumentaci doporučuje používat mikrodata. Protože je začíná postupně podporovat i český Seznam, bude se tento článek věnovat převážně mikrodatům. Pokud vás zajímá, jaký je mezi mikrodaty, mikroformáty a RDF(a) rozdíl doporučuji toto stručné shrnutí (anglicky).

Mikrodata jsou specifikována v jazyku XHTML. Jejich hlavním cílem je vyjádřit sémantiku na webu. Existuje několik specifikací, přičemž se v posledních několika letech vyselektovala ta, která je udržovaná na webu www.schema.org.

Na této specifikaci se dohodly vyhledávače jako je Google, Yahoo, Bing nebo Yandex. Je to v podstatě slovník, kterým můžete popsat entity – osoby, místa, restaurace, filmy apod. na vašich stránkách.

Postup při implementaci mikrodat

Implementaci mikrodat na webu lze rozdělit do několika fází:

  • Zmapování šablon webu,
  • výběr vhodných schémat,
  • spárování schémat se šablonami webu,
  • příprava zadání pro programátory,
  • samotné nasazení kódů,
  • validace implementace.

Protože se ale web i standard Schema.org neustále vyvíjí, jde o iterativní proces. Na webu vám například vznikne nová sekce s vašimi zaměstnanci a kolegy. Po prostudování Schema.org ale víte, že existuje speciální typ i pro osoby.

Jednotlivé body projdeme ještě detailněji i s příklady. Jako modelový web jsem vybral e-shop, na kterém si vše představíme.

Zmapování šablon webu

Bod nula. Pokud nevíte, jaké šablony a stránky na webu máte, nevíte ani jaká mikrodata lze nasadit.  Mluvím zde o šablonách, tedy typových stránkách, které vypadají graficky stejně, ale mají jiný obsah.

Můžete použít dokumentaci, kterou máte z doby tvorby webu. V ní jsou popsány šablony. Pokud nic takového neexistuje, bude nutné web a jeho šablony zmapovat – tj.  projít typové stránky a uložit si je třeba do tabulky.

Pokud náhodou na nějakou šablonu v první fázi zapomenete, nic hrozného se neděje. Mikrodata na ni nasadíte v druhé iteraci.

V případě našeho modelového e-shopu se nejčastěji jedná o následující šablony a obsahové bloky:

  • Produktová stránka,
  • stránka s kontaktními údaji,
  • homepage – zde se označuje logo, název firmy případně interní vyhledávání,
  • drobečková navigace,
  • stránka se zástupci firmy.

Výběr vhodných schémat

V tomto kroku doporučuji projít celou hierarchii typů na schema.org. Jednak se seznámíte s celou dokumentací, ale také zjistíte, jaká schémata standard nabízí.

Tento bod je velice zásadní a je nutná dobrá znalost Schema.org hierarchie. Pokud jste mikrodata nikdy dříve neimplementovali, může to pro vás být zezačátku složitější než pochopíte, jakým způsobem se pustit do celé věci.

Nejdříve se doporučuji podívat na několik příkladů přímo na Schema.org. Každé ze schémat má své vlastnosti. Například produktová stránka (schéma http://schema.org/Product) může obsahovat následující typy ze Schema.org:

Novinkou je zavedení mikrodat pro interní vyhledávání. Pokud vše nasadíte správně, bude se ve výsledcích vyhledávání na dotazy spojené s vaší značkou zobrazovat pole pro vyhledávání.

Jen si dejte pozor, abyste měli interní vyhledávání správně nasazeno. Strukturovaná data.

Jen si dejte pozor, abyste měli interní vyhledávání správně nasazeno.

Po tomto bodu máme vybrané šablony a k nim schémata. Víme tedy, co a kam se bude nasazovat. Dalším krokem je definice, jak implementaci provést.

Příprava zadání pro programátory

Nasazení mikrodat se může jevit jako jednoduchá záležitost. Málokdy jsem se však setkal s tím, že by programátoři vše nasadili správně na první pokus. Postupem času jsem si tedy vypracoval strukturu zadání tak, aby bylo pochopitelné a snadno uchopitelné programátory.

Součástí zadání vždy musí být i konkrétní ukázky kódů. Nejlepší je uvádět příklady na konkrétních datech daného e-shopu. Tj. v případě e-shopu si vzít jeden produkt, kde vše jasně popíšete a vysvětlíte.

U každé definice schématu vždy uvádím i odkaz na web Schema.org. Zde jsou často přímé ukázky kódu pro implementaci, kde si mohou programátoři dostudovat vše potřebné. Na tyto ukázky je vždy ještě explicitně upozorňuji.

V kódu záměrně vynechávám atributy HTML tagů nebo i celé tagy, které nemají přímou souvislost s mikrodaty. Cílem je prezentovat kód přehledně a zaměřit se jen na to důležité.

Abych nemluvil příliš obecně, tak konkrétní zadání pro programátora u produktové stránky vypadá následovně.

<!-- cely nasledujici kod byl zvalidovan pomoci 
http://www.google.com/webmasters/tools/richsnippets
-->

<!-- ukázka mikrodat pro produkt
http://example.cz/produkt-abc
-->

<!-- popis celé webové stránky http://schema.org/WebPage -->
<body itemscope itemtype="http://schema.org/WebPage">

         <!-- drobečková navigace http://schema.org/WebPage -->
        <div itemprop="breadcrumb">
                       <a href="#">Úvodní strana</a>
                       <a href="#">Kategorie 1</a>
                       <a href="#">Kategorie 2</a>
                       <a href="#">Kategorie 3</a>
                       Název produktu
        </div>

        <!-- produkt http://schema.org/Product -->  
        <div itemscope itemtype="http://schema.org/Product">

                         <!-- obrázek produktu -->
                        <img itemprop="image" src="obrazek-produktu.jpg" />

            <!-- název produktu -->
                        <span itemprop="name">Název produktu</span>  

           
           <!-- cena a dostupnost produktu -->
           <div itemprop="offers" itemscope itemtype="http://schema.org/Offer">
            Cena (včetně DPH) <span itemprop="price">590 Kč</span>

             <!-- dostupnost produktu http://schema.org/ItemAvailability -->
            Stav skladu: <link itemprop="availability" href="http://schema.org/InStock" />Skladem
            Číslo <span itemprop="sku">12345-67</span>
           </div>

           <!-- popis produktu -->
           Popis
           <div itemprop="description">
                                       Popisek produktu, který může být klidně jednu stranu dlouhý.
                       </div>

                       <!-- Výrobce http://schema.org/Organization -->
                       <div itemprop="manufacturer" itemscope itemtype="http://schema.org/Organization">
                                       Výrobce: <span itemprop="name">ABC</span>
                       </div>

                       <!-- Váha http://schema.org/weight -->
                       <div itemprop="weight" itemscope itemtype="http://schema.org/QuantitativeValue">
                                       Váha: <meta itemprop="value" content="10" /> <meta itemprop="unitCode" content="GRM"> 10 g
                       </div>
        </div>
</body>

Pokud přemýšlíte, kolik hodin daná implementace mikrodat programátorům zabere, není to tak jednoduché určit. V případě e-shopů jsem se setkal s velice rozdílnými odhady. Jednou mi programátoři poslali odhad 20 hodin, jindy zase pouze 5 hodin. V jednom případě si mikrodata nasadil sám majitel e-shopu podle jeho slov za 2 hodiny.

Nejde to generalizovat, protože každý e-shop je svým způsobem specifický (pokud se nejedná o krabicové řešení e-shopu). Po mých zkušenostech je ale každý odhad nad 10 hodin podezřelý. Ptejte se svých programátorů, co jim zabere tolik času.

Zažil jsem i extrémní případ, kdy na první pokus programátoři odhadli náročnost na 20 hodin a po mých dotazech ji překvapivě snížili na 6.

Validace implementace

Vždy, když dostanete informaci od programátorů, že jsou kódy nasazeny, zkontrolujte to. Určitě nechci shazovat práci programátorů, ale často se setkávám s tím, že se mikrodata na první pokud nasadí špatně. Svou roli hraje i to, že nejde o zcela primitivní věc, ale někdy o nevhodně formulované zadání.

Ideálním pomocníkem pro validaci je nástroj přímo od Googlu, který najdete na adrese http://www.google.com/webmasters/tools/richsnippets. Validovat lze buď konkrétní URL adresy nebo vkládat HTML kód pro validaci.

Odkaz na tento validátor určitě pošlete i programátorům. Je lepší, když si sami po sobě mohou práci zkontrolovat.

Dalším skvělým pomocníkem je Google Webmaster Tools (GWT). Zde vidíte, která mikrodata Google rozpoznal, ale i případné problémy. Ty můžete ihned reportovat programátorům.

Tento report naleznete pod Vzhled vyhledávání -> Strukturovaná data.

Tento report naleznete pod Vzhled vyhledávání -> Strukturovaná data.

Nevýhodou je, že data ve Webmaster Tools se zobrazí až ve chvíli, kdy Google přeindexuje váš web. A to může trvat i několik týdnů. Proto doporučuji v první fázi použít výše zmíněný validátor a v GWT pravidelně strukturovaná data kontrolovat.

Pravidelné kontroly a další rozvoj strukturovaných dat

Každá úprava na webu je potenciální riziko, že se něco pokazí. To platí i pro strukturovaná data. Proto je důležité pravidelně kontrolovat, zda v nasazení mikrodat nevznikají chyby. K tomu je ideální GWT, jak bylo popsáno výše.

Jak jsem již zmiňoval, standard Schema.org se v poslední době poměrně rozvíjí. Nedávno byly přidány například akce. Jde o další schémata, která je možné na svůj web přidat.

Pokud cítíte, že ve Schema.org něco zásadního chybí, lze se podílet i na rozvoji tohoto standardu. Stačí se zapojit do komunity, popsat váš návrh a možná se právě ten dostane do oficiální specifikace.

Co si z článku odnést

  • Strukturovaná data pomáhají vyhledávačům lépe pochopit obsah, který na svém webu máte. Díky tomu mohou zobrazovat detailnější informace ve výsledcích vyhledávání.
  • Nasazením strukturovaných dat na váš web lze zvýšit míru prokliku z výsledků vyhledávání až o desítky procent.
  • Pokud budete podstrkávat strukturovaná data jen vyhledávačům a nezobrazovat je uživatelům, riskujete penalizaci.
  • Důležitým krokem je zmapování šablon na webu a výběr správných schémat.
  • Po implementaci nezapomeňte po programátorech práci zkontrolovat.
  • Pravidelně sledujte, zda nedošlo u strukturovaných dat k problému pomocí GWT.
  • Sledujte blog.schema.org s novinkami a pravidelně je nasazujte na svůj web.

Diskuze k článku

  • Jeny Taylor

    super vec, kdybych mel zajem, delate to i na zakazku?

  • Jeny Taylor

    jo jeste…. muj mail je autominuto@seznam.cz , diky za zpravu

  • Jeny Taylor

    jo jeste…. muj mail je autominuto@seznam.cz , diky za zpravu

  • Natália Vieira

    Moc pěkně zpracované Martine. Všemi kroky jsme si nedávno prošli a mám několik poznámek /otázek z praxe ke schema.org verus data-vocabulary.org. V doporučeních najdeš vždy novější verzi, tedy schema.org. Nám se bohužel otagovaná data pomocí schema.org, ne a ne zobrazit v SERPu, ikdyž v Google Webmaster Tools bylo vše OK, na slovenském webu se dokonce zobrazovali. Proto jsme si udělali průzkum u webů (nutno říci v našem oboru), které v SERPu rich snippets měli a zjistili jsme, že 99% z nich používají starší verzi tedy data-vocabulary.org. Tak jsme to testli a zafungovalo to. Máš s tímto také zkušenosti? Novou verzi tagování máme ready, ale zatím používám starší, protože to prostě aktuálně funguje. Děkuji

    • Martin Šimko

      Ahoj, co jsem viděl, tak funguje jak schema.org, tak data-vocabulary.org, jak píšeš. Nezjistil jsem v tom ale žádný systém. Je běžné, že na stejný dotaz se zobrazuje jak Schema, tak Data-vocabulary. Už jsem viděl, že trvalo docela dlouho, než Google prošel celý web a zaregistroval strukturovaná data (u větších webů klidně měsíc a více). Až potom je začal zobrazovat. To lze sledovat v GWT. Měli jste už vše znovu přeindexované?

      Osobně jsem ale netestoval vyměnit Schema za Data-vocabulary a sledovat, co to udělá. Díky za tip.

      • Natália Vieira

        Děkuji za odpověď. Přesně jak píšeš, sledovala jsem stav i ve WMT, kde
        máš v sekci Search Apearance přes „source“ označený jaký markup
        používáš. Schema.org jsme měli 2,5 měsíce u produktu, nabídky, modelu,
        local business a článku. Ve WMT tools bylo vše správně, ale v SERPu se
        rich snippets zobrazovali jenom u článků. Takže jsem udělali průzkum u
        konkurence, která rich snippets měla a produkt a nabídku jsme změnili na
        data-vocabulary.org. Za dva týdny se to začalo zobrazovat i v SERPU.
        Jak moc vypovídajíci to je, toť otázka :). Pokud by se Ti to povedlo
        testnout, dej prosím echo. Ať se daří! -N

        • Martin Šimko

          Super, díky za sdílení. Kdybych něco podobného zkoušel, dám vědět.

  • .Jan Rybařík

    Souhlasím s autorem. Cokoliv nad 10 hodin je podezřelé. Pokud implementuji strukturovaná data do našich vlastních řešení, pak se pohybuji někde kolem 2 až 3 hodin.

  • David Řezáč

    Perfektně sepsáno! Článek sdílím dále v seznamu českých článků o SEO a linkbuildingu ke čtení :-)
    http://www.affilo.cz/clanek/zobrazit/23/