Základní účel vyhledávačů je poskytování výsledků vyhledávání co nejvíce odpovídajících hledanému dotazu – to co se chtěl člověk dozvědět. V raných dobách bylo nutné při vyhledávání znát sadu logických operátorů a jejich kombinace. Ruku v ruce s masovým rozšiřováním internetu mezi „běžné uživatele“ jsou vyhledávače nuceny lépe indexovat a prohledávat obsah. Současný uživatel se již naučil vyhledávat dle klíčových slov, přesto používá k vyhledávání věty. Proto jsou vyhledávací algoritmy vyhledávačů neustále vyvíjeny a upravovány. Ruku v ruce s tímto se objevují i různé specifikace sémantického označování obsahu (mikroformáty, mikrodata, RDFa), které každý tvůrce webového obsahu může použít a pomoci tak vyhledávačům v rozpoznání určitých informací na stránce (blíže v minulém článku o sémantice).
Člověk není stroj – vyhledávání ve změti informací
Lidé stále více zadávají do vyhledávačů fráze jako „how old is einstein“ (příklad) a na prvních příčkách výsledků očekávají informaci o jeho stáří . Pro člověka je tato komunikace přirozená, ale o to větší problém pak nastává při jejím strojovém zpracování. Zpracování přirozeného jazyka je komplikovaná oblast, kterou se zabývají různé výzkumné týmy po celém světě. Google již některé tyto fráze zapracoval do vyhledávání a na tuto otázku zodpoví „Best guess for Einstein age is 132 years (March 14, 1879)“ což je pokrok. Bohužel vývojáři zapomněli na eventualitu, že daná osoba už mohla zemřít, proto je stále nutné tyto výsledky brát s rezervou. Podobným způsobem lze vyhledávací políčko využít jako kalkulačku (příklad), převodník měn (příklad), rychlé informace o počasí (příklad) nebo k vysvětlení pojmu (příklad).
Dalším příkladem je snaha o vyjádření poměrového hodnocení (dobré vs. špatné), např. restaurací. Podle reakcí uživatelů k restauraci se Google snaží odhadnout jak moc je oblíbená. Analyzuje lidmi dopisované reakce a podle počtu kladných a záporných klíčových slov vypočítává procentuální oblíbenost. Neporadí si ale s větami typu „Ale to jste na omylu, nejlepší obsluhu mají v…“. Tato věta zvedne kladné hodnocení, protože obsahuje slovo „nejlepší“, ačkoli významově to pochvala není.
Sémantika – vyhledávání ve strukturách
Informace je možné řadit do souvislostí na základě trojic slov: předmět–predikát–objekt. Názorným příkladem může být: Steiner–přednáška–Brno. Predikátem je slovo, které logicky spojuje zbylá dvě. Tímto jednoduchým prostředkem se dají popisovat souvislosti, ty dále řetězit a zejména se tyto souvislosti dobře strojově zpracovávají (RDFa).
Jiným pokusem o strukturování informací ze stránek je projekt Google Squared, který poskytuje velmi přehledný tabulkový výpis informací o vyhledaném slovu. Je možné editovat kritéria i „naučit“ takto třídit slova, která nejsou momentálně zanesena v databázi. Projekt se ale stále ve vývoji a nemusí proto poskytovat zcela korektní informace. Zdrojem dat jsou ale pouze velké stránky jako třeba Wikipedie.
Jak se dají využít mikroformáty?
Na internetových stránkách kamenných prodejen je běžné nalézt otevírací dobu nebo GPS souřadnice. Je velmi praktické se tyto informace dozvědět už na stránce s výsledky vyhledávání (náhled). Kromě tohoto přímého přínostu uživatelům by to například dovolovalo automaticky umisťovat tyto prodejny do map.
Mikroformáty se dají využít i při vaření, kupříkladu palačinek (náhled). Vyhledáme si slovo pancake a omezíme výsledky zatrhnutím surovin, které máme doma k dispozici či kalorickou hodnotu výsledného pokrmu.
Shrnutí
Thomas Steiner věří ve velký potenciál mikroformátů. Z velkých vyhledávačů je podporuje v této době pouze Google. Otázkou blízké budoucnosti je využití síly sémantického označování i mezi dalšími velkými hráči na poli vyhledávání, protože konkurenční tlak stále sílí. Běžní uživatelé mohou výhod mikroformátů a jim podobných systémů využívat i prostřednictvím doplňků do prohlížečů, které tyto metainformace umí zpracovat a nabídnout relevantní akce (uložení pozvánky na akci do kalendáře, vložení kontaktu do adresáře apod.).
Nasazování základních mikroformátů jsou pro společnost WDT samozřejmostí a vnitrofiremním standartem. Vývoj této technologie průběžně sledujeme a rozšiřujeme tak možnosti redakčního systému m@gnetpro. Přínos pro naše klienty spočívá zejména v lepších pozicích ve vyhledávačích a atraktivnější práci se stránkou.