1 UNIVERZITA PARDUBICE ÚSTAV ELEKTROTECHNIKY A INFORMATIKY NÁVRH OPTIMALIZACE INTERNETOVÝCH PREZENTACÍ Z HLEDISKA JEJICH VYHLEDATELNOSTI BAKALÁŘSKÁ PR...
UNIVERZITA PARDUBICE ÚSTAV ELEKTROTECHNIKY A INFORMATIKY
NÁVRH OPTIMALIZACE INTERNETOVÝCH PREZENTACÍ Z HLEDISKA JEJICH VYHLEDATELNOSTI BAKALÁŘSKÁ PRÁCE
2007
Aleš Mikulec 1
UNIVERZITA PARDUBICE ÚSTAV ELEKTROTECHNIKY A INFORMATIKY
NÁVRH OPTIMALIZACE INTERNETOVÝCH PREZENTACÍ Z HLEDISKA JEJICH VYHLEDATELNOSTI BAKALÁŘSKÁ PRÁCE
AUTOR PRÁCE: Aleš Mikulec VEDOUCÍ PRÁCE: Ing. Jana Holá, Ph.D.
2007 2
UNIVERSITY OF PARDUBICE INSTITUTE OF ELECTRICAL ENGINEERING AND INFORMATICS
THE PROPOSAL OF THE INTERNET PRESENTATION OPTIMALIZATION WITHIN THE SEARCHING PROCESS BACHELOR WORK
AUTOR PRÁCE: Aleš Mikulec VEDOUCÍ PRÁCE: Ing. Jana Holá, Ph.D.
2007 3
Prohlašuji: Tuto práci jsem vypracoval samostatně. Veškeré literární prameny a informace, které jsem v práci využil, jsou uvedeny v seznamu použité literatury. Byl jsem seznámen s tím, že se na moji práci vztahují práva a povinnosti vyplývající ze zákona č. 121/2000 Sb., autorský zákon, zejména se skutečností, že Univerzita Pardubice má právo na uzavření licenční smlouvy
o
užití
této
práce
jako
školního
díla
podle
§ 60 odst. 1 autorského zákona, a s tím, že pokud dojde k užití této práce mnou nebo bude poskytnuta licence o užití jinému subjektu, je Univerzita Pardubice oprávněna ode mne požadovat přiměřený příspěvek na úhradu nákladů, které na vytvoření díla vynaložila, a to podle okolností až do jejich skutečné výše. Souhlasím s
prezenčním zpřístupněním své práce v
Univerzitní
knihovně Univerzity Pardubice.
V Pardubicích dne 02. 04. 2007 Aleš Mikulec
4
ABSTRAKT Tato práce se zabývá procesem optimalizace stránek pro internetové vyhledávače a jeho přínosem pro uživatele a majitele stránek. V práci jsou popsány metody, které vedou k vyšší návštěvnosti stránek, k lepší orientaci a uživatelské přívětivosti, tedy k vyššímu komfortu pro návštěvníky. V teoretické části je vysvětlen způsob optimalizace a předpoklady nezbytně nutné k jejímu provedení. V implementační části je ukázka procesu optimalizace na vlastních vytvořených internetových stránkách.
Historie vyhledávačů a katalogů........................................................9 2.1. Katalogy a vyhledávače ..............................................................9 2.1.1.
Zahraniční trh ....................................................................11
2.2.2.
Český trh............................................................................13
Základní faktory ovlivňující optimalizaci stránek...........................15 3.1. JavaScript ..................................................................................16 3.2. Flash..........................................................................................17 3.3. Rámce .......................................................................................17 3.4. Validita kódu.............................................................................18 3.5. Změny v adresách .....................................................................19 3.6. Dynamické stránky ...................................................................19
4.
Metody SEO ....................................................................................20 4.1. On-page faktory ........................................................................21 4.1.1.
Klíčová slova .....................................................................21
4.1.2.
Vhodná klíčová slova ........................................................22
4.1.3.
Nástroje pro výběr klíčových slov.....................................23
4.1.4.
Konkurence klíčových slov ...............................................24
4.1.5.
Optimální počet klíčových slov.........................................25
4.1.6.
Klíčová slova v URL adrese ..............................................25
Nástroje pro analýzu výsledků optimalizace ...................................33 5.1. Position Report..........................................................................34 5.2. Index Report..............................................................................35 5.3. Link Report ...............................................................................36 5.4. Google Analytics ......................................................................37
6.
Optimalizace internetové prezentace AllForWeb............................38 6.1. Tématika stránek a cíl optimalizace..........................................39 6.2. Nástroje použité při optimalizaci ..............................................40 6.3. Výběr klíčových slov ................................................................41 6.3.1.
Tagy v hlavičce stránky.....................................................43
6.4. Přepisování URL.......................................................................45 6.5. Registrace do katalogů a vyhledávačů ......................................46 6.6. Analýza výsledků......................................................................50
7.
6.6.1.
Google Analytics ...............................................................50
1. Úvod Ve své bakalářské práci se zabývám problematikou optimalizace internetových prezentací z hlediska jejich vyhledatelnosti. Smyslem optimalizace je zajištění a upevnění pozice ve vyhledávačích a katalozích s cílem zasáhnout touto formou komunikace co nejvíce potenciálních zákazníků. V procesu optimalizace je hlavním nástrojem SEO 1 . Svou práci jsem zaměřil na využívání a charakteristiku systému SEO, což je neplacená část služby Search Engine Marketingu. S pomocí SEO lze dosáhnout lepších výsledků v pozicích vyhledávačů a katalogů. SEO pomáhá výrazně přilákat návštěvníky na internetové stránky a přispívá tedy k vyšší návštěvnosti. Pomocí optimalizace lze také zajistit vyšší konverzi návštěvníků na zákazníky, tedy zabezpečit firmě vyšší tržby. První část práce se zaměřuje na teoretickou charakteristiku procesu optimalizace. Objasňuje funkce a fungování vyhledávačů a katalogů. V další části jsou uvedeny předpoklady a metody pro optimalizaci. Ty se dělí na takzvané on-page faktory a off-page faktory. Ty jsou v práci detailně popsány. V teoretické části jsou dále popsány vybrané nástroje, které se používají při optimalizaci internetových prezentací a praktiky, které by neměly být v procesu optimalizace používány. Druhá část, implementační, je zaměřena na praktickou formu optimalizace, tedy na optimalizaci konkrétních stránek. Příklad optimalizace je v práci demonstrován na internetové prezentaci vlastní tvorby.
1
SEO - Search Engine Optimization - metodologie vytváření a upravování webových
stránek takovým způsobem, aby byly ve výsledcích hledání v internetových vyhledávačích zobrazeny na nejlepších místech.
8
2. Historie vyhledávačů a katalogů 2.1. Katalogy a vyhledávače Webové prezentace se optimalizují především pro vyhledávání ve vyhledávačích a katalozích. Pro objasnění problému jsou níže popsány principy fungování katalogů a vyhledávačů.
2.1.1.
Katalogy
Katalog je webový portál, který obsahuje odkazy na internetové stránky seřazené do jednotlivých kategorií řazených podle tématiky a obsahu webu. Za nejznámější české katalogy se považují portály Seznam, Centrum, Atlas, mezi nejvýznamnější zahraniční katalogy se řadí Google, Yahoo, ODP (Open Directory Project) a AltaVista, která je již v současné době koupena společností Yahoo. Záznam do katalogů je podmíněn registrací do příslušné sekce. Tuzemské katalogy jako Seznam, Centrum, Atlas podmiňují zápis do katalogů tím, že uživatel, který o zápis žádá, musí mít přiděleno IČO. Po zkontrolování údajů editorem dané sekce, je záznam přidán do katalogu. Doba zařazení odkazu do katalogů se pohybuje řádově v několika dnech, ale i několik týdnů. Hledání v katalogu se realizuje systémem procházení jednotlivých kategorií či pomocí lokálního vyhledávání. Při lokálním vyhledávání v katalogu porovnává vyhledávací stroj dotaz s URL 2 , nadpisy a popisy stránek. Tyto části vyhledávání jsou v katalogu registrovány a zařazeny do příslušné sekce.
2
URL je zkratka anglického výrazu Uniform Resource Locator. Je to řetězec znaků
s definovanou strukturou a slouží k přesné specifikaci umístění zdrojů informací na Internetu.
9
Pro katalogy tedy není relevantní obsah stránek, proto se tato optimalizace zaměřuje na titulek stránky, doménové jméno a popis dané prezentace. Popis by měl co nejlépe vystihovat podstatu webu a měl by obsahovat klíčová slova, stejně tak jako by je měl obsahovat i nadpis. Klíčová slova jsou rozebrána v kapitole č. 4.1 zabývající se on-page faktory. Nejčastějším prohřeškem, kterého se v tomto kontextu dopouštějí tvůrci a editoři je, že při celkové optimalizaci zapomínají právě na klíčová slova v titulku stránky. Chybějící klíčová slova tak posouvají výsledný web na spodní hranici vyhledávačů a katalogů a stává se nevyhledatelným.
2.1.2. Fulltextové vyhledávače Vyhledávač oproti katalogu neřadí odkazy dle kategorií, ale pouze při dotazu prohledává své databáze a řadí dotazy dle algoritmu. Způsob jakým vyhledávač rozšiřuje své databáze je hledání a stahování stránek. Následně se tyto stránky indexují, čili zpracovávají a ukládají do databáze. Nejznámější zahraniční vyhledávač je Google, mezi české patří Morfeo a Jyxo. Vyhledávače se skládají ze dvou částí. Hlavní část vyhledávače je tvořena robotem (crawler, spider, bot, atp.), ten prochází stránky a indexuje je. Roboti procházejí stránky v náhodných intervalech, nejde je ovlivňovat a záleží pouze na nich, jak často stránky navštěvují a upravují své databáze. Druhá část vyhledávačů tvoří webové rozhraní, které umožňuje uživatelům vkládat své dotazy na příslušný vyhledávač. Registrace do těchto vyhledávačů je zbytečná, protože sami vyhledávací roboti jsou schopni stránky objevit a indexovat, pokud na dané stránky existuje hypertextový odkaz z již indexovaných stránek. Pokud tomu tak není, registrací může být upozorněno na to, že daná stránka existuje.
10
Po zadání dotazu do vyhledávače je prohledána databáze a podle relevance jsou zobrazeny jednotlivé výsledky hledání. Jakým způsobem jsou však data řazena, nelze zjistit, algoritmus je tajemstvím, které znají jen programátoři vyhledávačů. Je jisté jen to, že se stránkám přisuzuje hodnocení (PageRank, S-Rank, Jyxo Rank, atd.). PageRank jako bodové hodnocení stránek je popsán v kapitole 4.2 zabývající se off-page faktory.
2.2.Tržní podíly vyhledávačů K tomu, abychom mohli stránky kvalitně optimalizovat, je nutné zjistit, jaké vyhledávače a katalogy používá právě ta cílová skupina, kterou chceme oslovit a přetvořit ji tak na zákazníky. Z toho důvodů je třeba sledovat využití jednotlivých vyhledávačů.
2.2.1. Zahraniční trh Situace, která dokumentuje vývoj a trend v použití vyhledávačů je převzata od comScore Media Metrix Search Engine Ratings (viz obr. 1.1). Je za období července roku 2006. Ze studie je jasně vidět, že Google upevňuje svou pozici na trhu.(1)
Obrázek 1.1 Tržní podíl vyhledávačů v anglicky mluvících zemích (2)
11
Jeho pozice se již několik let upevňuje a nevypadá to, že by jej některý z jeho konkurentů připravoval o část trhu. Spíše naopak (viz obr. 1.2).
Obrázek 1.2 Tržní podíl vyhledávačů v anglicky mluvících zemích (3)
Jestliže budeme zkoumat důvod tohoto úspěchu, dojdeme k prostému závěru. Vyhledávací technologie vytvořená společností Google je opravdu natolik kvalitní a úspěšná, že internetové portály k prohledávání obsahu vlastních katalogů využívají právě technologie Googlu. Zatímco v roce 2005 byl podíl mezi Yahoo a Googlem skoro vyrovnaný, v současnosti již dominuje Google viz obr. 1.3. Červené čáry vyjadřují, že katalogy či vyhledávače dostávají primárně výsledky na dotazy od daného vyhledávače a žluté čáry následně, že si vyhledávač nechá za službu platit.
12
Obrázek 1.3 Použití vyhledávacích technologií v anglicky mluvících zemích (4)
2.2.2. Český trh Situace na českém trhu s vyhledávači byla oproti zahraniční situaci dost odlišná. Zatímco v zahraničí směle fungovaly vyhledávače jako Yahoo, teprve v roce 1997 se firma Seznam pokusila vytvořit svůj vlastní vyhledávací systém. Robota pro vyhledávání pojmenovala Kompas a službu úspěšně provozovala do roku 2001. Služba byla nahrazena vyhledáváním pomocí Googlu a úpravou technologie Jyxo, kterou Seznam koupil.
13
V dnešní době Seznam vyhledává primárně ve fulltextu před vlastním katalogem, a to právě pomocí Googlu a svým vlastním vyhledávacím robotem nazvaným Seznam Fulltext. Propojení jednotlivých katalogů s vyhledávači je vyobrazeno na obrázku 1.4.
Obrázek 1.4 Použití vyhledávačů českými katalogy (5)
Centrum, druhý největší vyhledávací server a katalog v Čechách, také nezůstal pozadu a roku 1999 spustil svůj vlastní systém pro vyhledávání, zpočátku však pouze na vlastních stránkách. V roce 2002 byl spuštěn na vlastní doméně pod názvem Centrum Webfast. V roce 2003 byla technologie zásadně přeměna. Byla do ní implementována specializace na češtinu jako ohýbání slov, synonyma atd. Zároveň s touto změnou se upravil i obchodní název vyhledávače na Morfeo, pod kterým figuruje dodnes.
Posledním z významnějších hráčů na trhu českých vyhledávačů je Jyxo. Tento vyhledávač se profiluje jako vyhledávací systém bez katalogu. Byl spuštěn roku 2002 a od počátku jej využívá portál Atlas a O2 Active (dříve Quick). Podobně jako Morfeo pracuje s češtinou, to znamená, že dokáže ohýbat slova, vyhledávat synonyma atd. 14
Následující obrázek 1.5 vypovídá o dominantním postavení Seznamu jako nástroje pro vyhledávání ať už v katalogu, či fulltextovém vyhledávaní. Graf je z března roku 2006.
Obrázek 1.5 Tržní podíl vyhledávačů v České republice (6)
3. Základní faktory ovlivňující optimalizaci stránek Pokud uvažujeme o optimalizaci stránek, musíme se zamyslet také nad tím, jestli stránky splňují kritéria, za kterých mohou být stránky zoptimalizovány. V dnešní době jsou téměř veškeré stránky tvořeny dynamicky s použitím různých technologií. Každá z těchto technologií přináší zajisté své výhody, ale také nevýhody. Vyhledávací roboti se totiž ve většině případů chovají naprosto stejně jako lidé. Tak například ne každý vyhledávací robot zvládne projít vyskakovací menu napsané v JavaScriptu, čímž prezentace přichází o velkou část stránek, které nebudou zaindexovány, a tím ztrácí internetové stránky možnost na lepší pozici ve výsledku vyhledávaní. Každý vyhledávací robot je prostě jiný, a pokud má být tedy optimalizace co nejefektivnější, je třeba se držet určitých pravidel. Pravidla jsou dále rozebrána a popsána.
15
3.1. JavaScript JavaScript se stal jednou z mnoha technologií zajišťující dynamičnost webových stránek. Je to jazyk založený na technologii, která zpracovává data prohlížeče na straně klienta. To přináší jisté výhody, ale také nevýhody. Mezi přednosti určitě patří, že data nejsou pro odpověď posílána na server, ale jsou kontrolována místně přímo u uživatele. To s sebou přináší úsporu na zatížení linky pro přenos dat. Avšak příliš mnoho uživatelů a programátorů jej nemá v oblibě. Do jisté míry tomu napomáhá právě ta skutečnost, že se v různých prohlížečích může chovat odlišně. Jak se ale zdá, rozhodně to není technologie, která by měla zaniknout. O její další rozšiřování se stará tzv. AJAX (Asynchronous JavaScript And XML 3 ). AJAX není ničím novým, je to jen využití funkcionality jazyka pro vetší přizpůsobení internetových stránek uživatelům. Jak se tedy vyhnout tomu, aby vyhledávače vytvořené stránky neignorovaly? V první řadě je lepší se vyvarovat implementace veškerých prvků, které nesou informace o odkazech na další stránky formou JavaScriptu. Hrozí totiž, že stránky, na které je odkazováno právě pomocí takového menu, nebudou indexovány. Další problém může nastat, pokud JavaScript není skryt v souboru, ale je implementován přímo v těle dokumentu. Pokud se jedná například o jednu funkci, není v tom problém. Jakmile však tělo dokumentu obsahuje větší množství kódu, vyhledávače opět nemusí stránku zaindexovat a pokud se jedná o hlavní stránku, nejsou vesměs zaindexovány žádné stránky.
3
eXtensible Markup Language - obecný značkovací jazyk, který byl vyvinut
a standardizován konsorciem W3C.
16
3.2. Flash Flash je grafický vektorový program, vyvíjený původně firmou Macromedia. Tato technologie je využívaná především jako náhrada obrázků ve formátu GIF, které vytvářely určitou interaktivnost na stránkách. Tvorba animací či reklam je pomocí Flashe velmi efektivní, kvalitní a datově méně náročná v porovnání se stejným prvkem tvořeným v GIFu. (7) Pro svoji kreativnost je tato technologie využívána i pro tvorbu webových prezentací. Prezentace je tvořena jakoby plátnem, na kterém se odehrávají veškeré akce v podobě animací, a tím pádem není vytvářen žádný HTML kód, který by vyhledávače měly možnost projít a zjistit obsah webu. To má za následek, že stránky nejsou indexovány. V současné době se k Flash prezentacím uchylují především známé firmy ve světě, jejichž jméno je natolik známé, že mít indexován celý web je pro tuto firmu naprosto nedůležité. Takovou prezentaci má například v současné době O2.
3.3. Rámce Rámce neboli framy umožňují podobně jako CSS styly (kaskádové styly sloužící k úpravě vizuálního stylu stránky) či tabulky rozvrhnout stránku na jednotlivé oddíly, které nám tvoří takzvaný layout stránky. Oproti oběma metodám jako jediné vkládají stránky do stránky. To znamená, že po kliknutí na odkaz, se prohlížeč nepřesune na jinou stránku, ale pouze se nová stránka načte do požadovaného rámce. Hlavní problém s rámci nastává u vyhledávacích robotů. Některé z nich rámce úplně ignorují nebo dokonce odmítají indexovat. Pokud přesto dojde k indexování stránek, je zaindexován obsah v jednotlivých rámcích, což má za následek špatné zobrazování uživateli. Nabídnut je pouze odkaz na stránku rámce, který nenese ostatní informace, jako 17
například menu a další podstatné informace. Pro méně zdatné uživatele Internetu to může představovat velký problém, což má za následek opuštění stránek a ztrátu potenciálního zákazníka.
V nových normách konsorcia W3C 4 se od verze XHTML 5 1.1 již vlastně s rámci ani nepočítá. Rámce v současné době plní svou funkci například ve webových chatech. I tam již však existuje náhrada, ať již formou chatů pomocí Flash technologie nebo poslední dobou velmi populárním AJAXem.
3.4. Validita kódu Tak jako člověk potřebuje ke své komunikaci jazyk, stejně tak i ve světě Internetu je potřeba jazyk. Validita kódu je správnost zápisu daného jazyka dle dané normy. V současnosti je konsorciem W3C, které se stará o vytváření těchto norem, doporučovaná norma jazyka XHTML 1.1. Jestliže se však podíváme na Internet, zjistíme, že málokterá stránka projde validací. Jak je tedy možné, že stránky fungují, aniž by byly v pořádku? Naštěstí prohlížeče dovedou zobrazit i špatně fungující stránky. Avšak pro vyhledávače již nesprávnost validace představuje mírný problém. Například pokud neukončíme značku identifikující hypertextový odkaz na jinou stránku či na jinou část textu daného webu, vznikne pro vyhledávač odkaz, který nedává žádný smysl. Nedokáže totiž daný hypertextový odkaz sám ukončit, a tím pádem nezaindexuje zbytek stránek, které se odkazují právě z takto špatně vytvořené webové prezentace.
4
World Wide Web Consortium - mezinárodní konsorcium jehož členové společně
s veřejností vyvíjejí webové standardy pro World Wide Web. 5
extensible hypertext markup language - značkovací jazyk pro tvorbu hypertextových
dokumentů v prostředí WWW vyvinutý konsorciem W3C.
18
3.5. Změny v adresách Změna adresy není ani tak problémem pro vyhledávač, jako spíše pro uživatele. Pokud jsou stránky přesunuty, vyhledávače obsah opět zaindexují, nicméně již z databáze nevyřadí obsah, který byl na původní adrese. A to se nemusí jednat o změnu celé domény. Stačí pouze upravit odkaz na některou stránku. To má za následek, že při dotazu na databázi vyhledávače je uživateli poskytnut výsledek, kde adresa není upravena. Uživatel v domnění, že se jedná o relevantní odkaz, jej použije a zjistí, že daná stránka již neexistuje. Jestliže nějakým způsobem nezajistíme přesměrování, či stránku, která nás pomocí odkazu navede na fungující stránky, ve většině případů ztrácíme návštěvníky, tedy potencionální zákazníky. Pokud již odkazy měníme, měli bychom zajistit, že odkazy, které měníme, budou fungovat nadále nebo alespoň po tu dobu než změny zaregistrují vyhledávače a staré stránky vyřadí. Tento problém se řeší za pomocí HTTP 6 hlaviček. Následující řešení problému je pomocí jazyka PHP:
?>
header(“HTTP 1.1 301 Moved Permanently”); header(“Location: www.novastranka.cz”); header(“Connection: close ”);
Tento kousek kódu zajistí, že serveru je odeslána hlavička o verzi HTTP protokolu a kódu, který říká, že stránka byla trvale přesunuta. Druhý příkaz sděluje novou adresu stránky a poslední příkaz uzavírá stávající komunikaci se serverem.
3.6. Dynamické stránky V konferencích zaměřených na optimalizaci internetových prezentací je hojně diskutováno téma dynamicky generovaných stránek. Podstatou problému je, zda budou stránky zaindexovány, i pokud prostřednictvím
6
Hyper Text Transfer Protocol - je internetový protokol určený původně pro výměnu
hypertextových dokumentů ve formátu HTML.
19
URL adresy budeme předávat parametry prezentace, které slouží jako proměnné pro chod a funkci dané prezentace. Tento problém je typický pro vytváření stránek v jazycích jako Java, PHP 7 , ASP 8 . Internetové vyhledávače založené na technologii Googlu či Yahoo donedávna odmítaly indexovat stránky, v jejichž adrese byl použit identifikátor id, který tvůrci stránek s oblibou používají k identifikaci prvků (např. výrobků). V současné době již Google takové stránky neodmítá a zařazuje je do svých databází.
Pokud však chceme mít
jistotu, že všechny stránky budou zaindexovány, je lepší zvolit jiné pojmenování pro proměnné nebo zařídit přepisování adres, což je také daleko efektivnější. Způsob, jak toho dosáhnout, vede přes modul internetového serveru Apache s názvem mod_rewrite. Tento modul však musí být nainstalován na straně serveru a musíme mít možnost jej konfigurovat, což bývá dost často problém. Takové adresy však mají nejen tu výhodu, že je indexují vyhledávače, ale jsou i daleko lépe zapamatovatelné pro uživatele. Adresy jsou tedy user friendly a SEO friendly, což je velmi důležité. Jak vytvořit konfigurační soubor pro přepisování adres je popsáno v ukázce implementace.
4. Metody SEO Optimalizace pro vyhledávače patří k moderním trendům, bez nichž se žádný současný web neobejde. Úkolem optimalizace je s co nejmenšími náklady získat vysokou a přitom dobře cílenou internetovou prezentaci. Optimalizace pro vyhledávače dnes patří mezi hlavní způsoby, jak zajistit webu dostatečnou vyhledatelnost.
7
Hypertext Preprocessor - je skriptovací programovací jazyk, určený především pro
programování dynamických internetových stránek. 8
Active Server Pages - je technologie nezávislá na programovacím jazyce
20
Optimalizace pro vyhledávače je efektivním marketingovým nástrojem, kterým zvýšíme hodnotu internetové prezentace. Optimalizace pro vyhledávače totiž umožňuje rovnou zacílit prezentaci na ty návštěvníky, kteří mají sami o nabízené produkty či služby zájem (a proto je ve vyhledávači hledají). Při optimalizaci internetových prezentací je nutné optimalizovat on-page a off-page faktory. Jak toho dosáhnout je popsáno níže.
4.1. On-page faktory On-page faktory jsou takové faktory, které ovlivňují vyhledatelnost a vyskytují se přímo na stránce. Nemusí se však jednat jen o viditelné prvky, podstatný je například kód a jeho sémantika. Mezi nejpodstatnější prvky on-page faktorů patří bezesporu klíčová slova. Ta mají za úkol zajistit
dostatečný
přísun
návštěvníků
na
konkrétní
prezentaci.
Optimalizace musí zajistit, aby každá stránka byla unikátní, protože vyhledávače hodnotí každou stránku samostatně.
4.1.1. Klíčová slova Klíčová slova neboli key words jsou jednotlivá slova nebo fráze, pod kterými chceme, aby naše stránky byly nalezeny pomocí vyhledávačů na konkrétní dotaz uživatele. Jsou to vlastně taková vodítka na naše internetové stránky. Bez nich nelze zajistit dostatečnou návštěvnost webové prezentace. Pokud je internetová prezentace rozsáhlá, musí být klíčová slova na každé stránce a musí popisovat danou stránku či výrobek, a to zejména z toho důvodu, že každá stránka je identifikována samostatně.
21
Již při vytváření internetové prezentace je nutné klíčová slova zakomponovat do internetových stránek. Jejich zakomponování do nově vytvářené stránky bývá daleko jednodušší než pozdější pracné vkládání a předělávání stránek. Většinou se totiž nejedná jen o samotnou úpravu textu na stránce, ale i o úpravu tagů (HTML značek), které mívají určitý význam pro vyhledávače. Pokud optimalizujeme stránky pro zahraniční vyhledávače, musíme vzít v potaz i to, že nejsou z 90 % schopny poradit si s češtinou. Problém s češtinou není ve smyslu kódování dané prezentace, ale v tom, že tyto vyhledávače neumí skloňovat ani časovat. Jinak je tomu u českých vyhledávačů Jyxo a Morfeo. (8)
4.1.2. Vhodná klíčová slova O tom, že klíčová slova by měla co nejlépe vystihovat zaměření dané prezentace, není pochyb. Ale jak zajistit taková klíčová slova, která přivedou nejvíce návštěvníků? V prvé řadě se musíme zaměřit na to, jak danou prezentaci budou vyhledávat sami uživatelé. Pro tuto činnost je dobré oslovit několik uživatelů tzv. testerů, posadit je před počítač a nechat je, aby se snažili nalézt stránku sami. Postup, jakým stránky vyhledávají si zaznamenat a zapsat si také klíčová slova, která použijí k samotnému nalezení stránek. Klíčová slova na dané stránce musí být také relevantní vzhledem k obsahu prezentace. Těžko si lze představit, že budeme chtít prodat například židle a uživatele na naše stránky dostaneme na jiná klíčová slova netýkající se tematicky dané stránky, např. automobily. Nejen, že návštěvník se nestane našim zákazníkem, ale také si většinou stránku zapamatuje a na náš odkaz již zřejmě neklikne. V horším případě upozorní své přátele. Způsob, jak zjistit klíčová slova, je prozkoumávání zdrojových kódů konkurenčních webů. Z konkurenčních stránek můžeme zjistit, jaká klíčová slova jsou použita ve významných prvcích stránky, jako jsou například elementy h1,h2,h3,title, strong, atd. Lepší je samozřejmě 22
prozkoumat internetové stránky konkurentů, kteří jsou na předních pozicích ve vyhledávačích. U těchto stránek je optimalizace provedena dobře.
4.1.3. Nástroje pro výběr klíčových slov Některá klíčová slova jsou na první pohled vcelku jasná. Pokud se například zaměřujeme na výrobu nábytku, těžko budeme do stránky vkládat slova, která na tuto skutečnost upozorní. Spíše nás ihned napadnou taková klíčovou slova, která přímo popisují produkci firmy, jako například stoly, skříně, atd. Někdy je však problém zjistit veškerá klíčová slova, která by mohla potenciálně přivést uživatele.
Naštěstí však existují nástroje, které mohou doporučit vývojáři klíčová slova, na které by například sám provozovatel nepřišel. Některé z nich jsou popsány v následujících odstavcích. Google AdWords I když AdWords není primárně nástroj na vyhledávání klíčových slov, ale slouží pro tvorbu internetové reklamy typu PPC 9 na Google, jeho využití právě pro vyhledávání klíčových slov je naprosto perfektní. Nejen, že dokáže vyhledat podobná příbuzná slova i se synonymy, ale jako jediný nástroj ukazuje i počet vyhledávání v Google na dané klíčové slovo za uplynulý měsíc a také konkurenci inzerátů na dané klíčové slovo. Velkou výhodou je také to, že nástroj je psán přímo programátory Googlu a jeho výsledky tedy lze brát za relevantní. Pokud ještě vezmeme do úvahy, že Google má největší podíl na trhu, je jasné, že nástroj je opravdu více než vhodný pro optimalizaci. Jeho výhodou je také ten fakt, že se není potřeba proklikat několika stránkami, než dojdeme k samotnému nástroji pro vyhledávání klíčových slov.
9
PPC – Pay Per Click (platba za klik) spočívá v tom, že inzerent za reklamu platí až ve
chvíli, kdy zaúčinkovala, tedy ve chvíli, kdy si na ní potenciální klient klikl.
23
Wordtracker Wordtracker je nástroj, který slouží primárně k vyhledávání klíčových slov, avšak jeho služby jsou placené. Systém nabídne pouze několik prvních slov zdarma. Výsledky však nejsou moc přesvědčivé a zvláště pro stránky s českým obsahem je tento nástroj naprosto nevhodný. Je tedy pouze doplňkovým nástrojem k výše zmiňovanému AdWords. Existují i další vyhledávací systémy sloužící k nalezení klíčových slov, ale jejich výsledky nejsou přesvědčivé. Navíc jsou tyto služby součástí tvorby PPC reklamy a většina z nich umožní vyhledávat klíčová slova po zaregistrování, popřípadě dlouhému procházení předchozích stránek.
Další možností, která existuje, je například nechat si vypsat synonyma ve Wordu nebo využít některou ze statistik vyhledávačů a určit pozici, na které se nachází dané klíčové slovo. Čím vyšší však pozice je, tím vyšší je také jeho konkurence.
4.1.4. Konkurence klíčových slov Pokud optimalizujeme internetové stránky na daná klíčová slova, musíme vzít v potaz také konkurenci a četnost ve výskytu daného klíčového slova. Zjištění těchto faktorů daného klíčového slova není úplně jednoduché. Pokud jej chceme zjistit, zadáme do vyhledávače dané klíčové slovo a na konkrétní dotaz uvidíme počet stránek, které obsahují hledané klíčové slovo. Počet stránek však nemá vždy vypovídací hodnotu. Lépe se nám mohou optimalizovat stránky, které budou mít milión výsledků, než například ty, které
mají
jen
50 000
výsledků.
Pokud
tedy
chceme
zjistit
konkurenceschopnost a četnost daného klíčového slova, nezbývá nám nic jiného, než stránky z výsledku vyhledávání prozkoumat. Tato metoda je náročná z hlediska vědomostního i časového.
24
4.1.5. Optimální počet klíčových slov Vyhledávače stránky nehodnotí podle četnosti klíčových slov na stránkách, ale podle jejich hustoty. Hustota vyjadřuje podíl četnosti klíčového slova (počtu výskytů) k celkovému počtu slov celého textu. Většinou se uvádí, že počet klíčových slov by se měl pohybovat v rozmezí 2 až 10 %. Vyhledávače, které stránky hodnotí, upřednostňují také jiná kritéria k hodnocení stránky a pokud hustota bude příliš velká, můžeme z textu snadno udělat text nečitelný připomínající telegram, kde každé desáté slovo bude stop.
4.1.6. Klíčová slova v URL adrese Téma klíčových slov v URL adrese je hojně diskutováno. Dříve bylo klíčové slovo v URL hodnoceno velmi vysoko, dnes však většina vyhledávačů pomalu snižuje hodnotu klíčových slov v URL adrese a hodnotí opravdu jen obsah stránek. Má to i svůj smysl. Pokud jako uživatel něco hledám, nehledám to jen v URL daného webu, ale chci to hlavně najít na dané stránce. Lepší než zaměřit se na klíčová slova v URL je upravit adresy, aby byly lépe zapamatovatelné pro uživatele, tedy tzv. SEO friendly.
4.1.7. Tagy Tagy jsou prvky jazyka HTML, které vytvářejí zdrojový kód internetové stránky. Každý tag nese určitou hodnotu, kterou webový prohlížeč musí umět rozpoznat. Stejně jako prohlížeč rozpoznává tagy, rozpoznává je i vyhledávač. Při vytváření stránek je nutné dodržovat normy a správnou sémantiku kódu. Pak vyhledávače nemají problém se zjištěním obsahu stránky a následně jejím zaindexováním do své databáze. Pro vyhledávače však hrají určitou roli i hodnoty tagů.
25
Title Title, titulek, je hlavním tagem stránky. Je vložen mezi párové tagy head, které tvoří hlavičku stránky, a jeho hodnota je zobrazována v prohlížeči v horní liště. Jako jediný má větší význam pro vyhledávače. Každá stránka by měla tento tag obsahovat a obsahem párové značky by mělo v lepším případě být klíčové slovo, jméno firmy nebo alespoň popisek stránky. Pokud je stránka vyvářená pomocí rámců, i každý rámec by měl tuto značku obsahovat.
Zdá se to jako samozřejmost, ale stránek, které tento tag nemají nebo je tam tvůrce stránek neumístil, je obrovské množství. Pokud do Googlu zadáte dotaz „Untitled page“ výsledek počtu stránek bez názvu je velký. Přesně 48 miliónů stránek. Meta tagy Jedná se o nepárové značky jazyka HTML, které se stejně jako tag title umisťují do záhlaví stránek, tedy části head. Většina těchto tagů nemá pro vyhledávače žádný smysl, určují totiž částečně chování serveru a říkají, jaké kódování stránky používají. Jediné prvky, které mají pro vyhledávače smysl, jsou description a keyword. Pokud je vyhledávače berou v úvahu, přiřazují jim jen malou váhu. Tag description popisuje, čeho se týká obsah webu, tag keywod jako hodnotu obsahuje klíčová slova pro internetovou prezentaci. Zatímco do keyword se zapisují spíše slova nebo fráze, do tagu description se píší souvislé věty, které konkrétně popisují daný web. Tento tag se zobrazuje ve vyhledávačích pod hlavním nadpisem internetové prezentace, a každý uživatel si tak může stručně přečíst, čeho se stránky týkají.
26
Tagy typu H1, H2, H3 Tagy typu H jsou párovými značkami jazyka HTML, které se umisťují do těla HTML dokumentu. Tyto tagy jsou jedny z nejdůležitějších značek na internetové stránce. Jelikož se jedná o nadpisy, mají větší váhu než klasický text. Největší váhu má tag H1, jež se smí na stránce vyskytovat pouze jednou. Každý další prvek H má nižší hodnotu. Existují samozřejmě i další tagy, které by se daly popsat, ale jejich význam z hlediska optimalizace je diskutabilní. Příkladem může být tučné písmo nebo kurzíva. Google například takové tagy vůbec nezajímají a nepřisuzuje jim žádnou hodnotu. Například vyhledávač Yahoo jim hodnotu přiřazuje, ale pouze velmi malou.
4.2. Off-page faktory Off-page faktory jsou takové faktory, které ovlivňují vyhledatelnost, avšak nejsou přímou součástí stránky, tzn. nenalézají se v obsahu samotných stránek, ale ani ve zdrojovém kódu. Mezi tyto faktory se řadí především tzv. zpětné odkazy a hodnota stránek tzv. rank, podle nichž vyhledávače hodnotí dané internetové stránky. Tyto faktory lze považovat za nejdůležitější při samotné optimalizaci, protože počet zpětných odkazů určuje velikost ranku a ten zase ovlivňuje pozici ve vyhledávači. Klíčovým faktorem toho, jak vysoko bude internetová prezentace ve vyhledávači umístěna, tvoří rank, tedy hodnota toho, jak prohlížeče hodnotí vaše stránky. Každý vyhledávač svůj systém hodnocení stránek nazývá jinak. Google pojmenovává hodnotu internetových stránek jako PageRank, Seznam S-Rank, Jyxo jako Jyxo-rank atd.
27
Podstatné však není pojmenování jako spíše to, jakým způsobem se tato hodnota stránkám přiděluje a jakou váhu hraje při vyhodnocování výsledků vyhledávání daným vyhledávačem. Dále bude popsán pouze princip fungování PageRanku, pro ostatní vyhledávače je systém hodnocení stránek téměř totožný.
4.2.1. PageRank – hodnota stránek PageRank je algoritmus vyvinutý společností Google, který přisuzuje každé internetové stránce s vlastní URL adresou ohodnocení, které vypovídá o její kvalitě v rámci struktury ostatních okolních stránek, které na sebe odkazují tzv. odkazové sítě. Každá stránka konkrétní prezentace je hodnocena samostatně, nepřisuzuje se tedy PageRank doméně jako celku. Google používá PageRank při rozhodování o tom, jak bude daná stránka umístěna vysoko ve vyhledávači. PageRank vychází z předpokladu, že o stránce vypovídá počet zpětných odkazů, viz kapitola 4.2.2. Předpokladem vysokého PageRanku je právě kvalita zpětných odkazů. Stránky získávají PageRank jako součet příchozího PageRanku z odkazujících stránek. Každá nová stránka dostane při zaindexování počáteční hodnotu PageRanku a jeho zbytek je dopočítán. Vždy, když robot navštíví stránku, přepočítá její PageRank, na základě počáteční hodnoty a hodnoty PageRanku odkazujících stránek. Modelová situace jak rozdělovaní PageRanku funguje, viz obr. 4.1.
28
Obr. 4.1 Distribuce PageRanku (9)
Hodnotu PageRanku je však nemožné přesně zjistit, protože algoritmus, který
je
používán
k jeho
výpočtu,
je
obchodním
tajemstvím
provozovatele vyhledávače, v tomto případě Googlu. V literatuře se objevují vzorce na výpočet PageRanku, nicméně jsou pouze odhadem matematické funkce pro jeho výpočet, který však nemusí odpovídat jeho skutečné hodnotě. Reálné hodnoty a systém hodnocení internetových stránek zná pouze Google. Každá firma si totiž algoritmus, který slouží pro hodnocení stránek, chrání a tento algoritmus zná jen malé množství lidí v dané firmě. Interní PageRank Jestliže stránka dosáhla část svého PageRanku za pomocí zpětných odkazů, potom se tento PageRank dále přenáší na ostatní stránky celého webu. Tato hodnota PageRanku tvoří tzv. interní PageRank. Pokud stránky obsahují velké množství interních stránek, které pro návštěvníka nemají velkou vypovídací hodnotu, je dobré zajistit, aby PageRank směřující právě na tyto stránky nebyl přerozdělován. Pokud docílíme toho, aby nebyl přerozdělován, můžeme upozornit návštěvníky jen na ty stránky, které opravdu zamýšlíme. Způsob jakým toho docílit je popsán v implementační části. 29
Nulový PageRank Pokud má některá stránka nulový PageRank, může se jednat o stránku, která byla penalizována ze strany Googlu. Pokud byla stránka penalizována na základě neetického procesu SEO nebo na základě upozornění, stránka se stane téměř nevyhledatelnou a penalizace může postihnout i stránky, na které odkazuje. Pokud se tak stane, mluvíme o BadRanku. Ten vzniká jen v případě, jestliže stránky jsou navzájem propojeny, to znamená, že stránky odkazují jedna na druhou a naopak. Nulový PageRank však nemusí vždy znamenat, že stránka byla penalizována. Nejčastějším důvodem pro nulový PageRank je, že stránka je nová, tedy její majitel upozornil vyhledávač na fakt, že stránka existuje a robot danou stránku ještě nenavštívil. Google Toolbar PageRank K odhadu PageRanku vydal Google v roce 2002 pomocný nástroj nazvaný jako Google Toolbar PageRank dále jen GTPR. Byl vytvořen jako plug-in prvek pro prohlížeč Internet Explorer a měl pomoci při odhadu PageRanku stránek a být tak pomocníkem pro tvůrce a editory při optimalizaci stránek.
GTPR používá pro zobrazování PageRanku stupnici od 0 do 10, avšak hodnoty skutečného PageRanku jsou zřejmě vyšší kvůli větší rozlišovací schopnosti. Detailní hodnoty, které jsou však jen odhadem, jsou uvedeny na obr. 4.2.
30
Hodnota PageRanku
Hodnota GTPR
0,00000001 – 5
1
6 – 25
2
26 – 125
3
126 – 625
4
626 – 3125
5
3126 – 15625
6
15626 – 78125
7
78126 – 390625
8
390626 – 1953125
9
1953126 ‐ ∞
10
Obr. 4.2 Odhadované hodnoty PageRanku v závislosti na GTPR (22)
Význam GTPR však pomalu slábne právě kvůli horší rozlišovací schopnosti a díky faktu, že existuje jen pro Internet Explorer.
4.2.2. Zpětné odkazy Jak bylo popsáno v kapitole 4.2.1, zpětné odkazy slouží k přenášení PageRanku a ke zviditelnění internetových stránek. Samotná existence stránek nepřivede totiž žádné návštěvníky, tedy potenciální zákazníky. Stránky musí být vidět a lidé o nich musí vědět nebo musí být schopni nalézt je přes internetové vyhledávače či katalogy. Získáváním zpětných odkazů se zabývá tzv. link building, tedy budování zpětných odkazů. V případě získávání zpětných odkazů nejde o kvantitu, ale o kvalitu, tedy hodnotu jakou nám mohou přinést. Nejlepší volbou je odkazovat na své internetové stránky z takových prezentací, které mají vysoký PageRank. Vysoký PageRank zajistí, že se část z něj přenese i na požadované stránky.
31
Dalším faktorem, který ovlivňuje, jak velká část PageRanku se přenese, je tematická podobnost internetové prezentace, ze které vede odkaz na naše stránky. Tedy pokud je prezentace tematicky podobná, přináší nám zpětný odkaz vyšší PageRank. Tento jev se nazývá tematický PageRank. Nejjednodušším způsobem, jakým dosáhnout zpětných odkazů, je registrace do katalogů a vyhledávačů. Jako samozřejmost se bere registrace do nejznámějších vyhledávačů a katalogů. Existují však i malé katalogy a vyhledávače, které se zaměřují tematicky na dané odvětví, např. tvorbu internetových stránek. Při výběru místa pro umístění zpětného odkazu je potřeba dát si pozor na tzv. link farmy. Link farmy jsou weby složené z desítek či stovek internetových stránek, které jsou navzájem propojeny zpětnými odkazy a přenáší na sebe vlastní PageRank, čímž se umisťují vysoko ve výsledcích vyhledávání. Protože link farmy se snaží obelstít vyhledávače, registrování do nich se nedoporučuje z důvodů penalizace vyhledávači, které hrozí za jejich odhalení.
4.3. Nevhodné praktiky SEO I v optimalizaci můžeme narazit na praktiky, které by neměly být používány, neboť prezentaci v konečném důsledku poškodí, a to na její vyhledatelnosti a důvěryhodnosti. Vyhledávače stránky, kde se takové prvky vyskytují, ohodnotí minimálním rankem, a možnost, že by se stránky dostaly zpět na první místa ve vyhledávačích, je naprosto mizivá. Proto se doporučuje vyhnout se takovým metodám. Některé nevhodné metody jsou popsány dále.
4.3.1. Skrývání textu Ve snaze dosáhnout velké hustoty klíčových slov se na stránky přidává skrytý text. Návštěvník si takového textu na stránce nevšimne, protože má např. stejnou barvu jako pozadí, avšak robot prochází zdrojový kód, 32
který indexuje, a tudíž takovýto text může odhalit. Jelikož společnosti, které tvoří roboty vyhledávače, implementovaly algoritmus, který dokáže takovýto podvod zjistit, stránky jsou snadno postižitelné. V reakci na tento fakt tvůrci a editoři přišli na další způsob skrývání textu, a to zmenšit text na nečitelnou úroveň a posunout ho na spodní hranici stránek. Avšak i tyto stránky jsou penalizovány. Penalizace takových stránek
spočívá
v
přiřazení
minimálního
ranku,
a
tudíž
v nevyhledatelnosti dané prezentace.
4.3.2. Podvrhování obsahu Dalším podvodným lákáním návštěvníků je například použití slůvka sex. Jelikož se jedná o jedno z nejčastěji vyhledávaných slov, spousta prezentací na to reagovala tak, že toto slovo zařadilo mezi svá klíčová a čekala, že jim to přinese větší návštěvnost. Málokdo ovšem při vyhledávání onoho slova chce objevit prezentaci např. na prodej hraček. Vyhledávače však používají v drtivé většině filtry, které stránky nezabývající se touto tématikou buď úplně vyřadí z jejich databáze, či ohodnotí minimálním rankem.
4.3.3. Podvrhování stránek Tato technika, kdy se prohlížeči podsouvá jiná stránka než uživateli, se říká cloaking. Stránka, která se podsouvá vyhledávači, je samozřejmě dobře optimalizována na daná klíčová slova, pod kterými chceme, aby nás návštěvníci našli. Pokud však daný odkaz uživatel zvolí, stránka je přesměrována na zcela jinou a uživatel dostává zcela jiný obsah stránek.
5. Nástroje pro analýzu výsledků optimalizace Abychom mohli vyhodnotit, jak byla optimalizace úspěšná či neúspěšná, musíme provést zpětnou analýzu. U SEO musíme vzít v úvahu ten fakt, že se výsledky optimalizace nedostavují ihned, ale data se mění v průběhu týdnů či spíše měsíců, záleží na daném vyhledávači. 33
Celkově celý proces SEO je nekonečný, a pokud chceme internetové stránky mít trvale v popředí, musíme neustále analyzovat, upravovat stránky a sledovat konkurenci. Pro analýzu SEO existuje několik užitečných
nástrojů,
které
pomáhají
právě
při
vyhodnocování
optimalizace.
5.1. Position Report Prvním z nástrojů, které jsou velmi užitečné, je Position Report, který je volně k dispozici a je provozován společností i-Asap. Jak již název napovídá, jedná se o nástroj pro vyhodnocování pozic naší prezentace na dané klíčové slovo. Po zadání domény a klíčového slova se provádí měření ve vyhledávačích, zda na dané klíčové slovo je nalezen výsledek do prvních 100 umístění, viz obr. 5.1.
Obr. 5.1 – výsledky vyhledávání přes Position Report (10)
Z těchto výsledků je patrné, že daná prezentace je špatně optimalizována na dané klíčové slovo nebo obsah není ještě zcela zaindexován.
34
5.2. Index Report Jedná se o nástroj od stejnojmenné společnosti, tedy i-Asap. Tento nástroj slouží k ověření počtu zaindexovanách stránek v nejběžnějších vyhledávačích viz obr. 5.2.
Obr. 5.2 Zjištění počtu zaindexovaných stránek (12)
Bohužel byl již z výsledků vyřazen Seznam, který má na českém trhu vyhledávačů velký význam. Jeho absence tak dává výsledkům programu menší váhu. Existuje však způsob, jakým lze tato data získat i ze Seznamu. Pokud do daného vyhledávače (Seznam, Google, atd.) napíšeme do vyhledávacího pole frázi site:www.allforweb.cz allforweb, jako výsledek dostaneme počet stránek zaindexovaných v daném vyhledávači, viz obr 5.3.
35
Obr. 5.3 – Počet zaindexovaných stránek (12)
Čím větší je počet zaindexovaných stránek, tím větší šance na umístění v první desítce výsledků vyhledávání daná stránka má. Samozřejmě pod podmínkou, že jsou splněny další faktory pro dobře optimalizovaný web.
5.3. Link Report Link Report je internetový nástroj, který slouží pro kontrolu zpětných odkazů daných stránek. V tomto případě se jedná o kontrolu zpětných odkazů jak interních, tak externích. Číslo, které nástroj poskytuje, je jejich součet, viz obr. 5.4.
36
Obr. 5.4 – Počet zpětných odkazů (13)
Pokud budeme chtít zjistit pouze externí odkazy, což bývá přínosnější, zadáme do vyhledávače frázi link:www.allforweb.cz. Vyhledávač nám zjistí skutečný počet pouze externích odkazů.
5.4. Google Analytics Jak již název napovídá, jedná se o nástroj vytvořený společností Google. Je k dispozici zcela zdarma, pro využívání je nutné se pouze zaregistrovat. Tento nástroj poskytuje kompletní analýzu stránek, vhodnou nejen pro SEO, ale i pro podporu SEM, elektronického obchodování atd. Pro analýzu SEO je podstatná hlavně část, zabývající se přístupy návštěvníků na stránky, jejich konverze na zákazníky, odkud na naše stránky přišli a jaká klíčová slova použili, pokud přišli z vyhledávačů. Na obr. 5.5 je úvodní část programu po přihlášení, na které jsou údaje o přístupech za vybraný týden. Sleduje počet nových návštěvníků vůči vracejícím se. Uvádí zdroj, odkud se na naše stránky dostali, a zeměpisné umístění, odkud k nám návštěvníci přišli. V implementační části jsou popsány další možnosti programu využitelných pro SEO analýzu. 37
Obr. 5.5 – Úvodní obrazovka Google Analytics (14)
Nástrojů na analýzu optimalizace je celá řada. Výběr nástrojů se řídí konkrétní potřebou majitele či editora stránek. Z uvedených nástrojů má nejširší využití Google Analytics. Jeho nevýhodou je pouze dlouhé prvotní načítání výsledků.
6. Optimalizace internetové prezentace AllForWeb Tato část popisuje optimalizaci pro internetovou prezentaci AllForWeb, viz obr. 6. Implementace optimalizace byla jednodušší z toho důvodu, že se jednalo o nově vznikající stránky, a tudíž veškeré faktory rozhodující o kvalitě optimalizace mohly být dobře promyšleny a snadněji implementovány.
38
Obr. 6 – Prezentace AllForWeb (15)
6.1. Tématika stránek a cíl optimalizace Daná prezentace byla založena za účelem podnikání. Jedná se o nabídku internetových služeb v oblasti webdesignu, tvorby webových aplikací, atd. Smyslem optimalizace je co nejefektivnější oslovení a získání (konverze) nových zákazníků, tedy maximální zviditelnění prezentace v základních českých vyhledávačích, jelikož prezentace není v současné době vytvořena v jiném než českém jazyce.
39
6.2. Nástroje použité při tvorbě a optimalizaci webové prezentace Prezentace je vytvořena za pomocí jazyka XHTML 1.1 a jazyka PHP ve verzi 5.1. Tato verze jazyka již podporuje plně objekty, lze tedy využívat objektově orientované programování. Obsah je ukládán v databázi MySQL, která je poskytována zdarma a je nejčastěji zastoupena na serverech poskytujících webový prostor. Jelikož v prezentaci je zajištěno
přepisování adres, byl vybrán
webhosting od společnosti Pipni, který umožňuje využívat modul mod_rewrite. Daný modul je součásti webového serveru Apache. K editaci PHP a XHTML kódu byl využit produkt společnosti Zend, konkrétně Zend Studio ve verzi 5.5 viz obr. 6.1. Ten poskytuje vysoký komfort při psaní zdrojových kódů a díky vestavěnému FTP klientu umožňuje pracovat se soubory přímo na webovém serveru. Jako jeden z mála produktů obsahuje také vestavěný debugger pro kompilaci PHP skriptů. To umožňuje ladit PHP skripty přímo na pevném disku a nahrávat na server již odladěné skripty.
Obr. 6.1 – Aplikace Zend Studio
40
Pro správu databáze MySQL je použit nástroj phpMyAdmin. Jeho používání urychlí vytváření databázových tabulek a správu jejich obsahu. Je jedním z nejrozšířenějších programů pro správu MySQL databáze a obsluhuje se pomocí webového rozhraní, viz obr. 6.2.
Obr. 6.2 – Rozhraní aplikace phpMyAdmin (16)
6.3. Výběr klíčových slov Klíčová slova jsou základním prvkem optimalizace. Proto je jejich výběr a správná kompozice v prezentaci důležitá. Obsahem prezentace je nabídka služeb z oblasti webdesignu, tvorby webových stránek, redakčních systémů, tedy zaměření na vytváření webových aplikací. K výběru klíčových slov byl využit nástroj Google AdWords, viz kapitola 4.1.3. Při výběru klíčových slov bylo vycházeno z hlavní nabídky - tematiku webu, do nástroje byla tedy postupně zadána jednotlivá témata odrážející hlavní charakteristiku a zaměření prezentace. Seznam klíčových slov vybraných tematicky je na obr. 6.3.
41
1 2 3 4 5
webdesign tvorba stránek Reklama tvorba bannerů tvorba corporate design
Obr. 6.3 Tematicky navržená klíčová slova
Na obr. 6.4 je samotný nástroj na vyhledávání klíčových slov. Do něj byla postupně zadána slova popisující nabídku služeb prezentace a nástroj vyhledá slova podobná, zobrazí počet četností vyhledávání za poslední měsíc a konkurenci daného slova na ostatních webových prezentacích.
Obr 6. 4. – Nástroj Google AdWords (17)
Seznam klíčových slov, viz obr. 6.3, je krátký, je tedy nutné jej rozšířit o klíčová slova, která byla doporučena nástrojem Google AdWords. Jejich seznam je na obr. 6.5.
42
1 2 3 4 5 6 7 8 9 10 11 12 13
webdesign tvorba stránek Reklama tvorba bannerů tvorba corporate design tvorba webových stránek tvorba internetových stránek web tvorba vytvoření stránek webdesign cz web design www reklama web reklama
Obr. 6.5 – Navržená klíčová slova
I když se může zdát, že seznam klíčových slov není o moc větší, jejich počet plně dostačuje vzhledem k velikosti prezentace, co do počtu stránek. Pokud bychom ovšem optimalizovali např. internetový obchod, počet klíčových slov by dosahoval desítek či stovek klíčových slov. Nástrojem vybraná klíčová slova jsou taková, že jejich intenzita vyhledávání byla střední, což dostačuje, vzhledem k faktu, že výskyt vybraných slov na konkurenčních webech byl minimální. Pokud již známe vybraná klíčová slova, zbývá je pouze zakomponovat do stránek. Způsobů, jak toho dosáhnout, je více, ať už dynamicky pomocí databáze nebo staticky zakomponovat přímo do stránky. Protože celá prezentace nepřesahuje několik stránek, byla klíčová slova implementována staticky, tedy přímo zakomponována. Následně jsou popsány on-page prvky, do kterých byla implementována klíčová slova.
6.3.1. Tagy v hlavičce stránky V kapitole 4.1 byly popsány důvody, proč umístit klíčové slovo do titulku stránky. Zde však bylo do titulku stránky umístěno nejen klíčové slovo, ale i název firmy, což má význam zejména pro návštěvníky. Klíčové slovo je tedy umístěno hned za názvem společnosti. 43
Seznam klíčových slov je uveden také v meta tagu keywords, který slouží pro umístění klíčových slov do záhlaví stránky, ale jak již bylo popsáno, vyhledávače tomuto tagu přisuzují pouze malý význam. Na následujícím výpisu, je ukázka HTML kódu, ve kterém jsou implementovány klíčová slova do tagů v hlavičce stránky, tedy title a keyword. Za povšimnutí stojí také tag description, který popisuje danou stránku.
<meta http‐equiv="content‐type" content="text/html; charset=UTF‐8" /> <meta name="description" content="AllforWeb ‐ Vytváříme internetové stránky, které Vám pomohou zviditelnit se na internetu. Díky našim produktům zvýšíte svůj zisk a přilákáte další zákazníky. Mezi služby patří webdesign, tvorba stránek, internetové obchody, redakční systémy, zpracování elektronických obchodů, katalogů a další."/> <meta name="keywords" content="webdesign, eshop,tvorba webových stránek, tvorba stránek, tvorba stránek Šumperk, tvorba stránek Jičín, internetové stránky, os commerce, MYSQL, PHP, internet solutions, redakční systémy, grafické návrhy, internetový obchod, stránky, html stránky, internetové stránky, www stránky, webové stránky, web page, vizitky, vytvořit logo, logo firmy, nové logo, logo design, logo creator, os‐commerce, obchod internetový, tvorba stránek, tvorba html stránek, tvorba internetových stránek, tvorba webových stránek, tvorba www stránek, tvorba web stránek, webdesign studio, web design, webdesign šumperk, www stránky, návrh stránek, reklama, tvorba corporate design, web tvorba, vytvoření stránek, www reklama, " />
<script src="/js/all.js" type="text/javascript"> AllForWeb ‐ tvorba webových stránek, reklamních bannerů, webdesign tvorba
44
Vybraná klíčová slova jsou dále zakomponována do obsahu stránek a také do hypertextových odkazů (tzv. anchor text). Jak je provedená implementace klíčových slov úspěšná, se projeví ve výsledcích, které jsou však u optimalizace spíše v řádech týdnů.
6.4. Přepisování URL Pro zajištění unikátnosti stránek musíme vyhledávače přesvědčit, že každá stránka má vlastní URL adresu, a ta by měla být zapamatovatelná pro uživatele. Tento problém lze vyřešit přes modul Apache serveru mod_rewrite. Ten se ovládá přes soubor htaccess. Jeho výpis pro danou prezentaci je uveden na obr. 6.6.
Obr. 6.6 – Výpis souboru htaccess
První příkaz v souboru říká webovému serveru, že má spustit přepisování adres. Další dva příkazy zajišťují, že přístupná je pouze adresa http://www.allforweb.cz, to znamená, že pokud uživatel zadá adresu http://allforweb.cz, je mu podsunuta stránka s http://www.allforweb.cz. Toto pravidlo je vloženo kvůli vyhledávačům, kvůli lepší indexaci stránek, ty mohou vyhledávače brát jako dvě rozdílné prezentace, což je nežádoucí. Následující pravidla již slouží pro přepisování adres. V případě, že uživatel zadá do prohlížeče adresu http://www.allforweb.cz/nejaka-sekce, musí modul adresu vyhodnotit a předat serveru dále na zpracování jako http://www.allforweb.cz/index.php?sekce=nejaka-sekce. Tato adresa je dále zpracovávána skriptem PHP, který je na obr. 6.7.
45
Obr. 6.7 – Zpracování adresy pomocí PHP
Tento jednoduchý kód zajistí, že při zadání adresy se zjistí, zda v adresáři existuje soubor s daným jménem, pokud ano, je jeho obsah dále načten v prohlížeči, pokud ne, je zobrazena chybová stránka. Výsledek skriptu je vidět na obrázku 6.8, kde je v internetovém prohlížeči zobrazena adresa upravená.
Obr. 6.8 – Přepsaná adresa v prohlížeči (15)
6.5. Registrace do katalogů a vyhledávačů Registrace do katalogů a vyhledávačů zajišťuje, že na naše stránky povedou zpětné odkazy. Samozřejmostí je registrace do všech velkých českých katalogů a registrace do vyhledávače Google.
46
Registrace do katalogu společnosti Seznam je důležitá z toho důvodu, že na
prezentaci
upoutáme
vyhledávač
Seznamu.
Seznam
je
nejpoužívanějším vyhledávacím portálem v ČR, a proto je žádoucí v něm zviditelnit prezentaci. První věcí, kterou je potřeba udělat, je nalezení příslušné sekce, do které chceme stránky zařadit, viz obr. 6.9.
Obr. 6.9 – Sekce katalogu Seznam (18)
V sekci, která odpovídá tematicky stránkám, nalezneme odkaz na úpravu či přidání odkazu do katalogu viz obr 6.10.
Obr. 6.10 – Odkazy pro zaregistrování stránek do Seznamu (18)
47
Pro zařazení prezentace do katalogu, je nezbytné vyplnit několik formulářů s údaji o prezentaci, která má být zařazena do katalogu, viz obr. 6.11. Jako titulek stránky byl zvolen název firmy a klíčové slovo tak, jak bylo popsáno v odstavci 6.3.
Obr. 6.11 – Registrace webové prezentace do katalogu Seznam (19)
Po vyplnění údajů následuje kontrola údajů s uložením, pokud proběhne registrace v pořádku, do 14 dnů proběhne přidání odkazu do katalogu. Po zařazení prezentace do katalogu Seznamu jsou provedeny ostatní registrace zbylých hlavních českých katalogů (Centrum, Atlas, O2, atd.). Registrace do nich probíhá opět podobným způsobem.
48
Existují však i méně známé katalogy, které však mohou být přímo tematicky zaměřené. Jejich seznam je na adrese http://katalogy.iglu.cz, viz obr. 6.12.
Obr. 6.12 – Rozcestník katalogů (20)
Stránka rozděluje katalogy tematicky a vypisuje u nich PageRank, kterých katalog dosahuje. Významné je to z důvodu kvality zpětného odkazu z takového vyhledávače.
Podobný rozcestník lze nalézt i na
adrese http://www.katalog-odkazu.sukvos.com. Každým přidáním stránek do katalogu zajišťujeme stránkám zpětný odkaz. Důležitý je i ten fakt, že se část PageRanku ze stránek katalogu přenese na prezentaci samotnou, a tím prezentace zvyšuje svůj PageRank. Dostatečně vysoký PageRank zajišťuje výhodnou pozici ve vyhledávači.
49
6.6. Analýza výsledků Analýzu výsledků optimalizace je nutné provádět vždy v určitých časových intervalech. Vyhledávače nemusí mít ještě zaindexovaný veškerý obsah stránek a také zařazení do katalogů nemusí být provedeno. Můžeme se však přesvědčit, jestli byla optimalizace provedena správným způsobem, alespoň při porovnání dočasných výsledků. Jedním z faktorů, které by tento fakt naznačovaly, je nárůst PageRanku na vyšší hodnotu než 0. Také by na stránku měl být traffic, tedy měla by narůstat hodnota příchozích návštěvníků na stránky. Analýzou získáváme data o průběhu optimalizace a o tom, jakým způsobem byla provedena. Zpětná vazba je při optimalizaci velmi důležitá, v případě nedostatků je potřeba na ně reagovat a odstranit je. Dále jsou popsány nástroje, které pomáhají při analýze výsledků.
6.6.1. Google Analytics Nástroj Google Analytics byl již popsán v kapitole 5.4. V této části je však podrobněji popsána část, která je přínosná pro SEO. Důležitým prvkem je počet návštěvníků vstupujících na stránky a počet stránek, které si prohlíží. Tato statistika je přístupná ihned po spuštění nástroje. Po spuštění prezentace se na stránky podívalo skoro 300 návštěvníků za měsíc a prohlédli si 3071 stránek, viz obr. 6.13. To znamená, že průměrně si každý návštěvník prohlédl 10,59 stránky. Vzhledem k faktu, že indexace nebyla dokončena, je to velmi slušné číslo.
50
Obr. 6.13 – Počet návštěvníků za měsíc leden (14)
Dalším faktorem, který je dobré sledovat, je poměr mezi novými a vracejícími se návštěvníky. Tento poměr nám pomůže zjistit, zda se návštěvníci vracejí na stránky nebo se jedná pouze o náhodné příchody, viz obr. 6.14.
Obr. 6.14 – Poměr mezi novými a vracejícími se návštěvníky (14)
Z grafu lze vyčíst, že poměr se pohybuje zhruba okolo 50 %, což znamená, že návštěvníci sledují změny na stránkách a zajímají se, co je na nich nového. Dalším sledovaným prvkem může být, odkud naši návštěvníci přichází, viz obr. 6.15. Tento graf nám pomůže lépe se zacílit na určitou skupinu návštěvníků, kterou chceme oslovit, ať už v katalogu či vyhledávači. Může nám také pomoci při stanovení, do kterého katalogu či vyhledávače umístíme např. placenou reklamu pro další podporu firmy. 51
Obr. 6. 15 – Procentuální podíl přístupů na stránky podle zdroje (14)
Zajímavým je taktéž graf, který sleduje, na které stránce uživatelé prezentaci opouštějí, viz obr. 6.16. Pokud se jedná o náhodné návštěvníky, prezentaci opouštějí na první stránce.
Obr. 6.16 – Odchod návštěvníků z prezentace (14)
52
Z grafu lze vyčíst, že 38 % návštěvníků se dostalo na prezentaci pouze náhodně. Z tohoto pohledu je nutné ještě zapracovat na zacílení konkrétních uživatelů. Možností je úprava klíčových slov. Analýza je však zatím pouze dočasná, správné závěry je možné dělat nejdříve po čtvrt roce od procesu optimalizace.
6.6.2. Webmaster Eyes Dalším nástrojem sloužící k analýze je Webmaster Eyes. Ten je určen k měření PageRanku na jednotlivých serverech společnosti Google. Po zadání požadované adresy jsou data zpracována a výsledky jsou přehledně vypsány na stránku, viz obr. 6.17.
Obr. 6.17 – Naměřená data na serverech Googlu (21)
Z obrázku lze vyčíst, že průměrný PageRank na jednotlivých data centrech má průměrnou hodnotu 3 a počet měřených data center bylo 50. Z dosavadních výsledků vyplývá, že optimalizace by mohla být úspěšná.
6.6.3. Position Report Position Report byl rozebrán v kapitole 5.4. Jedná se o nástroj na zjišťování pozic prezentace na vybrané klíčové slovo, viz obr. 6.18. Dosavadní výsledky testu však nelze brát ještě zcela vážně, protože není zaindexován obsah ve všech vyhledávačích. I tak se dá říci, že umístění prezentace na slovní spojení „tvorba stránek“ se zdá být úspěšné.
53
Obr. 6.18 Výsledky měření nástroje Position Report (10)
7. Závěr Optimalizace prezentace byla provedena na základě předem daného zadání. Cílem bylo optimalizovat prezentaci, zabývající se prodejem webových aplikací. Optimalizace měla zajistit lepší pozice ve vyhledávačích a katalozích, přivést vyšší počet návštěvníků a zvýšit firmě jak image, tak zisky. Na základě dlouhodobějšího pozorování lze určit, jak bude optimalizace úspěšná, nicméně z předběžných výsledků lze odhadnout, že se odvíjí dle požadavků. Vytvořená prezentace zvyšuje neustále svůj PageRank, zvyšuje se také počet zpětných odkazů a zaindexovaných stránek ve vyhledávačích. K úspěšné optimalizaci je však nutné provádět neustále analýzu optimalizace, aby výsledky byly uspokojivé a odrážely měnící se situaci. Pro zajištění dalšího rozvoje internetové prezentace je však vhodné použít i dalších nástrojů (např. systémy PPC, bannerů, kontextové reklamy, apod.), které ve spolupráci s popsanou optimalizací zajistí dynamický nárůst počtu návštěvníků na stránkách a úspěch webové prezentace. Pokud optimalizaci nepodpoříme výše zmíněnými prvky, výsledky optimalizace se projeví v dlouhodobějším časovém horizontu, v horším případě vůbec. 54
Zdroje: (1) Danny Sullivan. comScore Media Metrix Search Engine Ratings, 2006, přístup z internetu: http://searchenginewatch.com/showPage.html?page=2156431 (2) Danny Sullivan. Share Of Searches: July 2006, 2006, přístup z internetu: http://searchenginewatch.com/img/comscore-us.gif (3) Danny Sullivan. Share Of Searches Trend, 2006, přístup z internetu: http://searchenginewatch.com/img/comscore-trend.gif (4) Bruce Clay Inc., přístup z internetu: http://www.bruceclay.com/searchenginerelationshipchart.htm (5) R. Smyčka. Optimalizace pro vyhledávače – SEO, Třebíč, Akcent, 2004, ISBN 80-239-2961-5 (6) Ondřej Bach. Tržní podíly vyhledávačů, 2006, přístup z internetu: http://www.evalor.cz/img/trzni-podily-vyhledavacu-v-cr.gif (7) Flash, přístup z internetu: http://cs.wikipedia.org/wiki/Flash (8) Linda Skolková, Kouzla s Googlem: pokročilé vyhledávání krok za krokem, 2006, přístup z internetu: http://technet.idnes.cz/tiskni.asp?r=sw_internet&c=A061025_1237 11_sw_internet_NYV (9) PageRank, přístup z internetu: http://cs.wikipedia.org/wiki/Soubor:Pagerank1.png (10) i-Asap, Position Repost, přístup z internetu: http://www.i-asap.net/nastroje-positionreport.php (11) i-Asap, Index Repost, přístup z internetu: http://www.i-asap.net/nastroje-indexreport.php
55
(12) Seznam, přístup z internetu: http://search.seznam.cz/searchScreen?w=site%3Awww.allforweb .cz+allforweb&mod=f (13) i-Asap, Link Repost, přístup z internetu: http://www.i-asap.net/nastroje-linkreport.php (14) Google Analytics, přístup z internetu: http://www.google.com/analytics/ (15) AllForWeb, přístup z internetu: http://www.allforweb.cz (16) MySQL AllForWeb, přístup z internetu:http://mysql.allforweb.cz/ (17) Google AdWords, Keyword Tool, přístup z internetu: https://adwords.google.com/select/KeywordToolExternal (18) Seznam, přístup z internetu: http://odkazy.seznam.cz/Veda-atechnika/Pocitace/Internet-a-WWW/Tvorba-WWW/ (19) Seznam, přístup z internetu: http://odkazy.seznam.cz/link.php?state=DETAIL (20) Katalogy odkazů, přístup z internetu: http://katalogy.iglu.cz (21) Webmaster Eyes, přístup z internetu: http://www.webmastereyes.com/ (22) Chris Ridings, Mike Shishigin. PageRank Uncovered, 1999, přístup z internetu: http://dbpubs.stanford.edu/pub/showDoc.Fulltext?lang=en&doc=19 99-66&format=pdf&compression=&name=1999-66.pdf
56
ÚDAJE PRO KNIHOVNICKOU DATABÁZI Název práce
Návrh optimalizace internetových prezentací z hlediska vyhledatelnosti.
Autor práce
Aleš Mikulec
Obor
Informační technologie
Rok obhajoby
2007
Vedoucí práce
Ing. Jana Holá, Ph.D.
Anotace
Tato práce se zabývá procesem optimalizace stránek pro internetové vyhledávače a jeho přínosem pro uživatele a majitele stránek. V práci jsou popsány metody, které vedou k vyšší návštěvnosti stránek, k lepší orientaci a uživatelské přívětivosti, tedy k vyššímu komfortu pro návštěvníky. V teoretické části je vysvětlen způsob optimalizace a předpoklady nezbytně nutné k jejímu provedení. V implementační části je ukázka procesu optimalizace na vlastních vytvořených internetových stránkách
Klíčová slova
Optimalizace stránek, SEO, optimalizace pro vyhledávače a katalogy,