Wednesday, March 25, 2009

Web 3.0

Úvod


Když se každý zamyslí, co vůbec je a co přináší výše zmiňovaná další verze webu jako takového, většina bude tušit úzkou spojitost se sémantickým webem a ta další zbývající skupina si nebude moci pod tímto pojmem představit skoro nic. V prvním případě nebudou ti „šťastlivci“ tak dalek od pravdy. Další, dalo by se říct, verze, je úzce spojená s, relativně novou, technologii (alespoň v Evropě) a to se sémantickým webem. Ačkoliv se o pojmu sémantika a příchod nového stylu tvorby webových prezentací mluví už od poloviny roku 2005, nenastartovalo to takové týmy vývojářů, aby tuto kreativní myšlenku naplno rozjeli, jak tomu bylo u přechodu na technologie webu 2.0. Pravdou je, že když byla tato myšlenka zpracovávána World Wide Web Consorciem s vedoucím panem Tim Berners-Lee's, považovala ji většina developerů za zbytečnou. O co v ní vůbec šlo? Nejzajímavějším tématem byla změna způsobu vývoje webu, ať už se jedná o blogy nebo informační systémy, cestou, která by měla sloužit návštěvníkovi jako univerzální medium pro data, informace a o stránky výzkumu. Od toho vedly cesty ke vzniku sémantických webů, které měly být průkopníky této myšlence. Pojem „sémantický web“ je natolik svým významem obsáhlý, že jsem mu věnoval celou kapitoly s názvem „Sémantický web – obecně“.


Jelikož jsem zde zmínil jméno Tim Berners-Lee, člověka, který se zasloužil o zrození kvant technik (nebo jim dal podmět), bylo by na škodu, kdybych neuvedl jeho slova, na která jsem při svém hledání materiálů narazil.

S obsahem by se dalo říci, že přesně vystihují nynější situaci kolem webu 3.0 a sémantiky obecně.

„I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web – the content, links, and transactions between people and computers. A ‘Semantic Web’, which should make this possible, has yet to emerge, but when it does, the day-to-day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines. The ‘intelligent agents’ people have touted for ages will finally materialize“.


Tim Berners-Lee, 1999


Jak mi jistě uznáte za pravdu, výroky pana Tima Berners-Lee, teda alespoň většina, byla nadčasová a díky váze jeho jména se většinou webové praktiky ubíhaly v jeho směru. Zda ovšem tomu tak bude i nadále, odpoví až čas.


Kolem této problematiky však nepanuje jen jediné jméno, ale jsou zde i jiná jména, jiná skupina vývojářů – seniorů, kteří se do jisté míry o webové trendy zajímají a své názory publikují na blogech. Na několik takových jsem na své cestě za zdroji narazil a uvedl bych zde jen ty nejzajímavější názory, které, co se týká kvality kontextu, mají něco do sebe. Jako první z příkladů bych uvedl článek s názvem: „Web 2.0: Making Friends / Web 3.0: Making Money“Hanka Williamse. V něm se kupříkladu zmiňuje o nástrojYahoo Query Language (YQL), který jako mnoha dalších, pokrývají nedostatky specifikace W3C o Webu 3.0, respektive o sémantických webech. Dále uvádí, že nástup sémantiky muže mýt za následek novým dispozičním finančním prostředkům a rozdíl, jak tomu může být zapříčiněno, popisuje v překladu níže.


Je to jednoduché. Když správně setřídíte data, můžete extrahovat použitelné informace, které vedou k profitabilním nebo produktivním rozhodnutím. Takováto data mají dvě hlavní hodnoty: přímou hodnotu a nepřímou hodnotu.

Přímá hodnota je hodnota, kterou získáte z vědomosti. Tedy že existuje vztah mezi dvěma objekty, který by lidská mysl nebyla schopna vytvořit. Například, představte si, že obdržíte email od potencionálního zákazníka, a máte aplikaci schopnou vám říct, že tuto osobu už jste potkali minulý rok (podle záznamu v kalendáři) a že máte několik společných přátel. Tento malý kus informace může být dostatečný na to, aby jste prodali váš produkt nebo službu.

Nepřímá hodnota je hodnota, která může být získána z analýzy spojení dat mezi objekty ve vašem datovém vesmíru, většinou získána díky machine learning (kdy se počítač sám učí). Například, představte si společné třídění, nejenom nákupu při výběru vašich knih a filmů, ale napříč celým vaším životem. Pro představu, takový systém by mohl být schopen vám doporučit, že na základě toho, že jste přečetli mnoho knih o Austrálii, by vás mohly zajímat současné ceny letenek do Austrálie. Toto je možné pouze ve světě Web 3.0, kde jsou data dostupná napříč aplikacemi a ne uzamčena jenom do jednoho systému.

Z jeho slov usuzuji, že je jasné, že v čase nástupu Webu 3.0 budeme sledovat změnu této platformy zkombinované s otevřeným datovým rozhraním (API).

Další blog, na který jsem narazil a který na mě zase něčím novým zapůsobil, byl od Jonase Bolindera s názvem: „Web 3.0 - The Semantic, Implicit, Mobile or Distributed Web[5]“. Obsahem to spíš vypadalo, jako sbírka nejlépe vyslovených vysvětlení k Webu 3.0, až jsem si připadal jako v soutěži, který výrok na vás udělá takový dojem, že mu dáte svůj hlas. Narazil jsem zde ovšem na zajímavou myšlenku psanou Alexem Iskoidem[6] týkající se kvant webových aplikací, které nejsou nijak programově vybavené natolik, aby dokázali splňovat podmínky sémantiky a poskytování kvalitního zdroje obecně. Jak poté z nich můžeme dostávat plnohodnotná data? Proto začala W3C jít s touto otázkou do popředí a připravila si pro tuto situaci dva nástroje, které budou fungovat na principu „označování sekcí kontextu zdroje“ strojově čitelnou. Mluvím zde o nástrojích jako RDF (Resource Description Framework) and OWL (Web Ontology Languages).

Resource Description Framework - je založen na myšlence přiřazení výrazu ve tvaru podmět-vlastnost-předmět k jednotlivým zdrojům. Těmto výrazům se v RDF terminologii říká trojice. Předmět určuje, o jaký zdroj jde, vlastnost určuje charakter zdroje a vyjadřuje vztah mezi předmětem a objektem. Například jeden způsob reprezentace výroku: „Obloha má modrou barvu“ v RDF je trojice řetězců: předmět je „obloha“, vlastnost je „má barvu“ a objekt je „modrá“[7].

Web Ontology Languages [8]- je značkovací jazyk navržený pro tvorbu ontologií[9]. Rozšiřuje slovník RDF a RDF schéma o další elementy vztahující se k třídám a vlastnostem.

O těchto nástrojích si řekneme ještě dále. Ostatní blogy, kterých je více než dosti, mi nenabízely další nové informace, či zajímavé názory. Víceméně je to jen opakování stále o sémantickém webu a technikách zápisu v jiném slovním podání a spíše z nich budu čerpat konkrétní informace.

Jak samy vidíte, téma Web 3.0 nám o sobě dosti nabídne a v následujících kapitolách se budu snažit popsat ty nejdůležitější nástroje, které zaručeně z webu Web 3.0 dělají.



[1] Zdroj: http://en.wikipedia.org/wiki/Semantic_Web

[2] Mám sen o webu [ v každém počítači ] schopném analyzovat celá data na webu – obsah, odkazy a transakce mezi lidmi a počítači. Sémantický web, který by měl tohle dělat možné se má ještě objevit, ale když to udělá, každodenní mechanism obchodu, byrokracie a naše každodenní životy budou ovládány mluvením se stroji. Inteligentní agenti – lidmy vyvolávány věky, se nakonec zhmotní.

Zdroj: http://whydoeseverythingsuck.com/2008/09/web-20-making-friends-web-30-making.html

[4] jedná se o dotazovací jazyk s SQL syntaxí, který můžete využít ve vašich webových aplikacích. Můžete se v něm dotazovat např. na obsah HTML(XML) dat.

[5] Zdroj: http://impl.emented.com/2008/04/20/web-30-the-semantic-implicit-mobile-or-distributed-web/

[6] Zdroj: http://www.readwriteweb.com/archives/semantic_web_road.php

[7] Zdroj: http://cs.wikipedia.org/wiki/RDF

[8] Více na: http://en.wikipedia.org/wiki/Web_Ontology_Language

[9] Podle definice „duchovního otce" ontologií T. Grubera je ontologie explicitní specifikace konceptualizace. Konceptualizací rozumíme systém pojmů modelující (popisující) určitou část světa. Musí být definován explicitně, to znamená jasně vyjádřen „na papíře". Ontologie je určitým systémem zachycení reality, který je přenosný a je možné ho sdílet. Základním předpokladem její použitelnosti je její formální vyjádřitelnost a možnost jejího sdělení.

Web 4.0

Obecná charakteristika

Nedávno jsme slyšeli o počátcích technologií Webu 3.0, které se naplnily jen z částí předpokládaných možností. Mluvím zde hlavně o sémantických webech a o mikroformátech, které se stávají na své popularitě stále do popředí. Každopádně „in progress“ chce být každý kreativní vývojář webů a designu samotnému.

Chce to značné úsilí sledovat stále nové technologické trendy vývoje, které se postupně přidávají do kolekcí verzí, skrytými pod názvy Web x.0. Ta samotná proměnná veličina „x“ se postupně inkrementuje a je jen otázkou času, kdy k nám přijdou takové technologie, které by překvapily svou hlavní existencí každého, který se s ní dostane do styku. Každopádně, jak už tomu bývá zvykem, každou započatou verzí a stanovení jasných kritérií nebo standardů, chcete-li, se najdou takoví lidé, kteří začnou předvídat další, technicky zlepšenou, nástupní verzi. Obvykle to bývají natolik nadčasové věci, že se v některých případech můžeme hovořit o science fiction jako vystřižených z příběhů Julese Verna, co vše počítačová technologie dokáže. Na druhou stranu to do jisté míry dokáže motivovat takové vývojáře, kteří skloubí myšlenkou s užitečným a směr vývoje se dá jiným, v mnohém zajímavějším, směrem.

Podobná situace se děje i na otázku ohledně Webu 4.0, neboli dalšího nástupce ještě stále se rozjíždějícího předchůdce Webu 3.0. Mluví se o takovém technologickém pokroku, který by demonstroval samostatný chod operačního systému jako webu. Jak cítíte sami, nedá se intuitivně nebo logicky uhádnout následující kroky, směřující k tak závratnému způsobu chovaní a práce s internetovým obsahem. Zkrátka se s určitostí nedá definovat, jaké technologie a způsob komunikace nebo ovládání bude interpretovat.

A jak hodnotí nástup nové generace internetového obsahu ostatní? Ve svém pátrání jsem narazil na několik blogů, které svým kontextem vypovídají o kvalitním obsahu a není to jen snůška domněnek, k ničemu nevedoucí informace, nebo jen svou teorií, upozorňování na nejvíce neuskutečněnou budoucnost. Patří mezi ně článek s názvem „Where are we going? Let’s talk about Web 3.0 and Web 4.0 “ od autora Andrewa Olivera, ve kterém se píše o přibližném datu nástupu Webu 4.0 (Nova Spivack’s timeline ) a to na začátek roku 2020.

Dle mého názoru je tento odhad dost skeptický a spíše vyplývá z lineárního vývoje technologií. Z praxe ale víme, že tuto linearitu nemůžeme korektně převést do světa inovací v IT odvětví. Nadšení v příchod nové generace sdílím s autorem článku, který se zmiňuje s příchodem nových inteligentních osobních agentů, kteří slouží převážně s nabídkou služeb práce s webem jako takovým. Z částí to vyplývá z vize sémantického webu, ale ta nepramení pouze jen ze strojově čitelném obsahu, ale i možnosti vstupních periferií zařízení počítače. Neboli jednodušší řízení (ovládání) práce mezi uživatelem a strojem. Jako příklad bych zde mohl uvést obrazové snímací zařízení (až už se jedná, v dnešní době, o kvalitní, cenově dostupné, webové kamery), které detekují změny v závislosti na uživatelském pohybu těla (obličeje, horních končetin,…). Vstupní informace pak systém vyhodnotí podle předem nastavených kritérií (například: funkce tabulátor může být definován pouhým mávnutím prstu pravé ruky). Podobnou názornou ukázku si může každý vyzkoušet na internetových stránkách společnosti Ecomagination . Dále mne zaujal výrok Susan Smith Nash ze samého článku, na který se autor odkazuje s nesoucím názvem: „Web 3.0, Web 4.0 and Personal Agents: Will They Open or Restrict Choice?“:

„Web 4.0 will, in theory, include an array of sensors that will gather information from one’s environment and use them to create a deep profile of your behaviours and activities.“

Jak samy vidíte, vize dostat se k co nejkvalitnějšímu a nejhlubšímu materiálu je v každém z nás a budou-li se vyvíjet nástroje k tomuto účelu, bude, podle mého názoru, jen dobře.

Proč si vůbec zaslouží nová generace standardů takový ohlas? Dle mého názoru vše pramení v myšlence propojení veškerých zařízení, které denně používáme. Mluvím zde o takových typech jako mobilní zařízení (pda, smartPhone,…), počítače, automobil (řídící jednotky), bezpečnostní systémy, aj. Příklad takového komunikace můžu uvést z článku neznámého autora pod názvem „Web 4.0.1 “, ve kterém se píše o příkladné možné komunikaci mezi automobilem, lednicí a uživatelem.

Případ je takový, že lednice posílá informace řídící jednotce automobilu a ta za pomocí zahrnutých komponent, vizuálně vysílá příchozí podměty uživateli. V našem případě se jednalo o počet chybějících položek (potravin) v lednici.

Jednoduchá demonstrace toho, jak by se taková technologie mohla uplatnit v provozu.

Tato doba je nám ještě stále natolik vzdálená, že, jak už jsem se zmiňoval na začátku, není možné s určitostí říci, s jak moc vyspělou dobou přijdeme do styku a jaké inovační technologie nám přinese. Ať již bude kolekce technologií svou vyspělostí jakákoliv, můžeme jen doufat, že vše povede jen k dobrému využití možností uživatelem.

Monday, March 23, 2009

Technologie sémantického webu

Technologie sémantického webu

Jazyk XML

Extensible Markup Language (XML) je textový formát odvozený z metajazyka Standard Generalized Markup Language (SGML) . Vyvinut a standardizován byl konsorciem W3C a jeho první verze byla uvolněna v roce 1998. Aktuální verze XML je 1.1. Strukturován je pomocí značek (tagů), které definují význam dat mezi počáteční a koncovou značkou. Do¬kumenty v XML jsou informačně bohaté, na rozdíl od binárních formátů čitelné člověkem (neboli human-readable) a velmi flexibilní co do použití. K tomu přispívá také výchozí zna¬ková sada Unicode, která umožňuje v jednom dokumentu kombinovat znaky z různých jazyků.
I když má společné kořeny s populárním HTML, nezaměřuje se na prezentační, ale na významovou složku informace. Jednoduchý XML dokument znázorňující podpis autora může vypadat třeba takto:

<?xml version="l.0" encoding="UTF-8"?>
<signature>
<author>
<name>Jakub Talaš</name>
<job>System engineer</job>
<address>Jundrovská 33, Brno</address> </author>
</signature>


Aplikace, která výše uvedené XML umí zpracovat, zná sémantiku jednotlivých údajů. Po jednoduché extrakci hodnot je může použít např. při vyhledávání zpráv od lidí ze stejné firmy nebo se stejnou funkcí. Samotné formátování tohoto XML se provádí takzvanou trans¬formací podle XSL šablon. V HTML by podpis mohl vypadat asi takto:

<html>
<!— nějaký obsah... —>
<p class="signature">
Jakub Talaš - Systém engineer Jundrovská 33, Brno
</p>
</body>
</html>

V tomto případě webový prohlížeč nebo e-mailový klient nemusí vůbec tušit, že jde o pod¬pis, nepozná, co je jméno, co je adresa. Pouze rozezná, že se jedná o odstavec, který má podle definovaného kaskádového stylu naformátovat. Z dat uložených v HTML a dalších texto¬vých ne-XML formátech se významy jednotlivých částí textu získávají právě jejich anotací. Význam dat je možné uložit mimo původní soubor nebo přímo do něj. Po anotaci se dají rozpoznané informace o sémantice aplikovat na celý dokument nebo skupinu dokumentů.
Dle mého názoru je vhodné zmínit ještě jednu variantu mezi těmito dvěma. Tou jsou takzvané mikroformáty, které se dostávají do středu pozornosti. Mikroformáty jsou obecně známé třídy kaskádových stylů, které udávají často používané informace. Například formátování třídou street-address udává poštovní adresu. Obecně k mikroformátům se váže kapitola níže, kde budou rozebrány.
XML se používá typicky pro perzistentní ukládání strukturovaných informací a pro komunikaci mezi aplikacemi. V současné době je masivně rozšířeno s velkou podporou od technologických leaderů na trhu informačních technologií (Sun Microsystems, Oracle, Microsoft, IBM a další). Mezi nejvýznamnější aplikace XML patří:
• XHTML - nástupce jazyka HTML pro tvorbu webových stránek
• SVG - slouží k popisu vektorové 2D grafiky
• OpenDocument - formát pro výměnu kancelářských dokumentů
• Jabber - instant messaging protokol
• RDF - Resource Description Framework určený pro popis metadat

Právě RDF má největší význam pro sémantické zpracování textu a prochází celou touto prací.



Jazyk RDF


Resource Description Framework
je datový model standardizovaný W3C sloužící pro reprezentaci a výměnu metadat. Vychází z XML a postupně více a více proniká do běžného používání na webu. Jako datový model je velmi jednoduchý. Založen je pouze na třech entitách: subjekt, predikát, objekt.

Tyto entity společně tvoří v RDF datech trojice (triplets). Pomocí těchto trojic se pak tvoří tvrzení (statements). V každém tvrzení predikát znázorňuje vztah mezi subjektem a objektem, popisuje vlastnosti subjektu. Zdroj, který je v jednom tvrzení na místě subjektu, se může v jiném tvrzení vyskytovat jako objekt. Tak se vytváří celé grafy spolu souvisejících infor¬mací.
Jak je vidět na následujícím schématu, jsme schopni rozložit větu tak, že je možné ji dále strojově zpracovávat. Příklad obsahuje subjekt pojmenovaný Tráva s vlastností mít barvu. Hodnota této vlastnosti je zdroj pojmenovaný Zelená vyjadřující barvu. Poté je možné ho použít v dalších tvrzeních a hledat např. všechny objekty mající zelenou barvu.
Jednotlivé zdroje identifikujeme pomocí globálně unikátních URI (Uniform Resource Identifier). URI se skládá z prefixu (base address) a popisku zdroje. V adrese jsou odděleny znakem #. Následující příklad ukazuje, jak se identifikuje zdroj (resource) pojmenovaný Děkan v ontologii znázorňující uspořádání např. fakulty nebo univerzity.



http://fi.muni.cz/fakulta#Dekan

Subjekt je zdroj buď pojmenovaný pomocí URI, nebo anonymní (tzv. blank node označovaný _:n, kde n je přirozené číslo). Anonymně se označují strukturované údaje, na které se pravděpodobně nebude odkazovat. Predikát je také zdroj, reprezentuje vztah mezi subjektem a objektem (tedy binární relaci). Objekt může být buď také zdrojem, anebo může být literálem kódovaným v Unicode. URI reprezentující zdroj nemusí být skutečně přístupné přes HTTP ani jinak síťově, i když je ve tvaru obyčejné webové adresy. Pomocí standardních jmenných prostorů XML je možné vytvářet a kombinovat více jmenných prostorů v jedné deklaraci.


Uvedená ukázka RDF kódu říká, že v nějaké ontologii s názvem fakulta existuje entita Univerzita mající svůj název a nějaký seznam svých fakult. Tyto atributy doplňují ještě další: rdfs:label a rdf:about z jiného jmenného prostoru. Byly vytvořeny při designu ontologie po¬mocí editoru Protégé.

Soubor znalostí vytvořených jednotlivými RDF trojicemi lze vyjádřit jako orientovaný graf s ohodnocenými hranami i vrcholy.



RDF bylo vytvořeno především pro World Wide Web, ale jeho principy se v současnosti začínají aplikovat i mimo něj. Projekt sémantického desktopu Nepomuk pro prostředí KDE využívá principů sémantického webu přímo na desktopu uživatele pro sdílení a výměnu informací.




Zdroj: http://is.muni.cz/th/173016/fi_b/bc.pdf

Sémantický web

Sémantický web – obecná charakteristika

Na [1] otázku co je to vlastně sémantický web odpověděl Tim Berners-Lee, zakladatel Word wide web v roce 1989 v CERN, evropské fyzikální laboratoři v Ženevě, ve smyslu propojení dat, až už datových souborů, nebo zkrátka událostí s takovými systémy, které by dokázaly takovou strukturu uchovat a synchronizovat s uživatelskými počítači. Uvedl takový příklad, kdy navštíví-li uživatel webovou stránku, na které má zobrazeny události vázány k určitému datu v kalendáři, je nutné pro její synchronizaci, například s uživatelovým počítačem, neustálý manuální zásah pro editaci. Vize sémantického webu vyplývá s předpokladu, že stroj bude umět sám pracovat s provázanými daty bez nutnosti zásahu uživatele. Tedy zkrátka, bude nejenom vědět, kam pro údaje „šáhnout“, ale do jisté míry jim i rozumět. Pro to ale, aby se tak stalo, je nutné vytvořit takové kolekce základních pravidel pro komunikaci, aby byly stroje schopny rozumět si navzájem ať už pro databázi, aplikace nebo webové stránky.

Znamená to, že sémantický web je nástupní vizí webu 3.0? Proto, abychom to mohli posoudit, je nutné říct si něco o jeho předchůdci, čili o webu 2.0. O tom, jaké jsou rozdíly mezi verzemi 2.0 a 3.0 nám opět Tim Berners-Lee odpověděl, že web 2.0 je čistou souborovou hierarchií, tedy dává jasný popis, jak budou soubory, používající web, pracovat. Tedy jak si uživatelé mohou uploadovat soubory, loggovat do webové sítě, generovat obsah stránek založených na tagových pravidlech, prostě obecný náhled je takový, že vše co se pohybuje okolo základních společenských webových sití patří do této skupiny. Až web 3.0 nám dává širší pole pozornosti. Některými je nazýván jako přicházející budoucí architektura, založená na nových webových technologiích. Problém, který se týká webu 2.0 je takový, že nenajdou-li se hledaná data na webových stránkách, jsou pravděpodobně ukryta v databázi. Tedy uživatel, který k ní nemá přístup, je nemůže a ani neumí znova použít. V příkladu to pak může vypadat tak, že máme-li svoji fotogalerii v počítači a na jedné webové stránce se zobrazí fotografie mého přítele, ve 3.0 architektuře se nám stáhne jeho fotografie a přidá do již vytvořené kolekce. Takže všechny snímky budeme mít hezky pohromadě. Narážím tedy na možnost, že při použití této architektury, nám budou stačit nainstalované aplikace pro práci s daty, například Microsoft Money, pro výpočet a platbu daní. V praxi to pak vypadá tak, že uživatel si pouze „natáhne“ soubor do aplikace, zpracuje je a odešle. Není třeba někde hodiny trávit se studií, jak vše korektně vyplnit, systém nám poskytne veškeré potřebné informace. Nyní zde stojí otázka, jak to bude s takovým přístupem ohledně uživatelských práv? I zde si pan Berners-Lee nedovolil opomenout, že na spoustu věcí chybí v dnešní době řádné zabezpečení. Ohledně přístupu je jasné, že soubory se budou dělit do skupin, podle možného přístupu, tedy ve smyslu osobní, firemní, veřejné … Je jasné, že mnoho lidí bude mít zájem na tom, aby nějakým způsobem narušovali práci „slušných“ uživatelů, ale již v dnešní době existují společnosti, které se touto problematikou zabývají. Za zmínku stoji moderovací společnost MIT.



[1] The future of the Web as seen by its creator <http://www.itworld.com/Tech/4535/070709future/pfindex.html>

Wednesday, October 8, 2008

Sémantický web - obecně

Sémantický web – obecná charakteristika

Na otázku co je to vlastně sémantický web odpověděl Tim Berners-Lee, zakladatel Word wide web v roce 1989 v CERN, evropské fyzikální laboratoři v Ženevě, ve smyslu propojení dat, až už datových souborů, nebo zkrátka událostí s takovými systémy, které by dokázaly takovou strukturu uchovat a synchronizovat s uživatelskými počítači. Uvedl takový příklad, kdy navštíví-li uživatel webovou stránku, na které má zobrazeny události vázány k určitému datu v kalendáři, je nutné pro její synchronizaci, například s uživatelovým počítačem, neustálý manuální zásah pro editaci. Vize sémantického webu vyplývá s předpokladu, že stroj bude umět sám pracovat s provázanými daty bez nutnosti zásahu uživatele. Tedy zkrátka, bude nejenom vědět, kam pro údaje „šáhnout“, ale do jisté míry jim i rozumět. Pro to ale, aby se tak stalo, je nutné vytvořit takové kolekce základních pravidel pro komunikaci, aby byly stroje schopny rozumět si navzájem ať už pro databázi, aplikace nebo webové stránky.

Znamená to, že sémantický web je nástupní vizí webu 3.0? Proto, abychom to mohli posoudit, je nutné říct si něco o jeho předchůdci, čili o webu 2.0. O tom, jaké jsou rozdíly mezi verzemi 2.0 a 3.0 nám opět Tim Berners-Lee odpověděl, že web 2.0 je čistou souborovou hierarchií, tedy dává jasný popis, jak budou soubory, používající web, pracovat. Tedy jak si uživatelé mohou uploadovat soubory, loggovat do webové sítě, generovat obsah stránek založených na tagových pravidlech, prostě obecný náhled je takový, že vše co se pohybuje okolo základních společenských webových sití patří do této skupiny. Až web 3.0 nám dává širší pole pozornosti. Některými je nazýván jako přicházející budoucí architektura, založená na nových webových technologiích. Problém, který se týká webu 2.0 je takový, že nenajdou-li se hledaná data na webových stránkách, jsou pravděpodobně ukryta v databázi. Tedy uživatel, který k ní nemá přístup, je nemůže a ani neumí znova použít. V příkladu to pak může vypadat tak, že máme-li svoji fotogalerii v počítači a na jedné webové stránce se zobrazí fotografie mého přítele, ve 3.0 architektuře se nám stáhne jeho fotografie a přidá do již vytvořené kolekce. Takže všechny snímky budeme mít hezky pohromadě. Narážím tedy na možnost, že při použití této architektury, nám budou stačit nainstalované aplikace pro práci s daty, například Microsoft Money, pro výpočet a platbu daní. V praxi to pak vypadá tak, že uživatel si pouze „natáhne“ soubor do aplikace, zpracuje je a odešle. Není třeba někde hodiny trávit se studií, jak vše korektně vyplnit, systém nám poskytne veškeré potřebné informace. Nyní zde stojí otázka, jak to bude s takovým přístupem ohledně uživatelských práv? I zde si pan Berners-Lee nedovolil opomenout, že na spoustu věcí chybí v dnešní době řádné zabezpečení. Ohledně přístupu je jasné, že soubory se budou dělit do skupin, podle možného přístupu, tedy ve smyslu osobní, firemní, veřejné … Je jasné, že mnoho lidí bude mít zájem na tom, aby nějakým způsobem narušovali práci „slušných“ uživatelů, ale již v dnešní době existují společnosti, které se touto problematikou zabývají. Za zmínku stoji moderovací společnost MIT.

Zdroj:

http://www.itworld.com/Tech/4535/070709future/pfindex.html

Název článku: The future of the Web as seen by its creator, 07/09/2007

Mikroformáty

Mikroformáty

Na začátek bychom si mohli položit otázku, co to vlastně ty mikroformáty jsou. Představte si situaci, kdy surfujete po internetu a narazíte na zajímavou stránku, ze které si budete chtít uložit datum a místo například rockového koncertu do kalendáře vašeho mobilního telefonu. Za normálních okolností by postup následoval manuálním „vyťukáváním“ data, místa, snad i upomínky a času. Což se za určitých okolností nemusí zdát jako pracná aktivita, ale představte si, že byste měli takových akcí na každý den tři. Časová složitost manuálního procesu ukládání do mobilu se dramaticky zvýší. Abychom si takovou činnost mohli ulehčit, můžeme využít technologii mikroformátů, která nám nalezena data, v našem případě události v kalendáři, zpracuje sama na základě několika kliknutí myší.

Abych nepředbíhal. Obecné vysvětlení, co jsou vlastně mikroformáty za technologii, je následující: jsou to takové „kusy“ kódu, které dávají jasnou strojovou čitelnost o jejím obsahu. Neboli, máme-li svoji webovou stránku a na ní udáváme svoji adresu v html kódu zapsanou například jako:

<p class="itAddrLine">
Durychova 101/66,
Praha-Lhotka, Praha 4
</p>

Pro uživatele, který vidí tuto adresu ve svém prohlížeči, tato informace řekne vše. Naopak, pro stroj je tento zápis adresy zcela nesrozumitelný. Nepozná, co v řetězci charakterizuje ulici, město, či číslo popisné.

Mikroformáty nabízí pro zápis adresy (resp. obecně jakéhokoliv kontaktu včetně telefonu nebo e-mailu) mikroformát hCard. Podívejme se, jak by mohla být adresa Internet Info zapsána s jeho pomocí:

<div class="vcard">
<div class="fn org">Internet Info</div>
<div class="adr">
<div class="street-address">Durychova 101/66</div>
<span class="locality">Praha 4</span>
<span class="country-name">Czech Republic</span> </div> </div>

Adresa byla vygenerována pomocí nástroje hCard creator[1] a je vložena do značky s class="vcard" signalizující použití mikroformátu hCard. Přitom každá část adresy je vložena do značek, které jednoznačně charakterizují jejich význam. Adresa zapsaná v tomto formátu je jasně strojově čitelná.

Za zmínku stoji i fakt, že použití mikroformátů není nijak omezující, co se týká úpravy již vytvořených webový aplikací. Stačí pouze přidat příslušné třídy, někde možná přidat novu značku a mikroformát je hotov.

Pro příklad si uveďme další mikroformáty, které můžete dnes již běžně používat. Jsou to například hCalendar – používaný pro označování událostí, hResume – pro psaní životopisu, nebo již hodně používaný rel=nofollow. Počet nových mikroformátů neustále roste[2].



Využití mikroformátů

Podle Tim Berners-Lee je to základním kamenem sémantického Webu 3.0, které značně ovlivní nejen dosavadní chování prohlížečů, ale hlavně vývoj vyhledávacích robotů. Co se tím myslí? Představa, kdy budeme moci vyhledávat zboží ve všech e-shopech nejefektivněji, tedy zadáním do vyhledávače ceny a druhu výrobku, je natolik pro uživatele lákavá, že jistě stojí zato. Ano, máme k dispozici takové systémy, které nám dokážou cenu výrobku srovnat mezi různými internetovými obchody, ale počet takových obchodů je do jisté míry omezený. Tedy, že nedokážeme vyhledávat opravdu tu nejnižší cenu výrobku na trhu.

Další „vychytanou“ vlastností může být možnost vlastního naservírování dat v prohlížeči. Neboli když máme zpracovaná data ve formě mikroformátu – tedy ve strojově čitelném formátu, můžeme si sami určit, jak budou zobrazena v našem prohlížeči. Tak například, budeme-li mít webovou stránku, která bude popisovat husitské hnutí v historii a jednotlivé datové úseky zpracované pomocí mikroformátu, prohlížeč sám může nabídnout uživateli nějakou formu grafického výstupu, například časovou osu, na které vše přehledně seřadí.

V této souvislosti se objevil termín instant mashup nebo také end user mashup, kdy na rozdíl od dnešních marhupů(zpravidla míchajících aplikaci z jednoho zdroje s daty z jiných zdrojů) si uživatel namíchá v prohlížeči svou aplikaci ze zdrojů na internetu sám.

Proto, abyste vůbec mohli využívat mikroformáty, musíte mít pro ně podporu ve svých prohlížečích. Dnes podporuje mikroformáty Safari. Na spadnutí je jejich podpora ve Firefoxu 3.0 a Bill Gates naznačuje, že budou podpořeny i v Internet Exploreru 8. Pokud máte Firefox, nainstalujete si do něj rozšíření Operator[3] a vydejte se třeba na Last.fm. Takovým největším zdrojem informací, kde můžete hravě používat mikroformáty, především pro adresy, je například google maps[4].