Definice Gridu
Výpočetní grid je hardwarová a softwarová infrastruktura, která poskytuje spolehlivý, standardizovaný, všudypřítomný a levný přístup ke špičkovým výpočetním službám.
(I. Foster, C. Kesselman. - The Grid: Blueprint for a New Computing Infrastructure, 1999)
V technickém slova smyslu je to rozsáhlý distribuovaný systém organizačně samostatných elementů, kterými mohou být individuální počítače (paměti, CPU, pevné disky) a informační systémy vzájemně propojeny počítačovou sítí.
Výpočetní grid je popisován analogií s elektrickou rozvodnou sítí - kolem roku 1910 měla každá elektrifikovaná budova vlastní generátor elektřiny, ale ty nebyly navzájem propojeny. Nebylo možné použít víc než byla kapacita generátoru, celková kapacita všech generátorů nebyla efektivně využita, zavedení elektřiny bylo drahé. Ke skutečnému rozvoji používání elektřiny došlo až zavedením propojených velkých elektráren a rozvodné sítě ke spotřebitelům, která umožnila levný, všudypřítomný a standardizovaný zdroj el. energie.
Obdobně dnes každá organizace spravuje vlastní výpočetní kapacity (počítače, diskovou kapacitu, software, data, specializovaný hardware), které neumí efektivně sdílet s jinými. Výpočetní grid by měl umožnit právě efektivní sdílení výpočetních kapacit mezi jednotlivými organizacemi.
V laickém pojetí si představte milióny počítačů (desktopy, superpočítače, servery, mainframy atd.), které jsou umístěny po celém světě a patří různým lidem (studentům, doktorům či sekretářkám) nebo různým organizacím (komerční společnosti, univerzity, nemocnice apod.) a jsou připojeny do internetu. Představa Gridu, zde nastupuje jako jeden obrovský, samostatný a super výkonný počítač sestavený z těchto počítačů.
Gridové vs distribuované prostředí
Distribuované aplikace jsou budovány jako specializované systémy pro jediný cíl nebo skupinu uživatelů. Naproti tomu gridové prostředí rozšiřuje původní distribuované prostředí o tyto nové vlastnosti:
Druhy a hierarchie gridů
Gridy dělíme hierarchicky podle povahy aplikací či úloh, které na nich mají běžet. Některé úlohy potřebují velkou výpočetní kapacitu a jiné oproti tomu dostatek místa pro svůj hladký běh. Existuje následující hierarchie gridů:
Poskytuje výpočetní servis a zabezpečené služby pro spouštění aplikací na distribuovaných výpočetních zdrojích. Je schopný dynamicky agregovat výpočetní kapacitu velkého počtu individuálních počítačů.
Poskytuje zpracování rozsáhlých datových sad pomocí služeb již zmíněného "výpočetního gridu". Jeho charakteristikou je sdílení a správa velkého množství dat a to vše při zabezpečeném přístupu (míra zabezpečení je velice důležitá např. pro lékařská data).
Většina těchto funkcí je řešena formou distribuovaných datových katalogů vytvářejících iluzi jednotného hromadného datového úložiště. Tyto katalogy udržují meta-data (velikost, přístupy, komprese atp.) souborů a také jejich umístění, popřípadě umístění jejich kopií v rámci celého gridu.
Je charakterizován snahou o rozšíření možností datových Gridů o poskytování kategorizace dat, ontologií, sdílení znalostí a tvorby workflow. Součástí informačních Gridů jsou virtuální prostředí pro spolupráci resp. virtuální laboratoře umožňující vzdálenou kontrolu a správu senzorů a zařízení.
Virtuální organizace (podstata a princip)
Jednoduchá představa o gridu pokládá ihned několik otázek typu:
Výčet otázek tohoto typu může pokračovat dále. Proto grid zavádí důležitý pojem Virtuální organizace (VO).
Virtuální organizace je souhrn výpočetních zdrojů a lidí pracujících na společném projektu, jejichž cílem je sdílení datových zdrojů a výpočetních kapacit použitelných pro zpracování výpočetních úloh. Jednotlivé virtuální organizace se mohou navzájem podporovat a sdílet zdroje. VO mohou účtovat spotřebu výkonu členům jiného VO a v případě náhlé potřeby výkonu tuto spotřebu vyúčtovat a tím obdržet požadovaný výkon navíc.
Oblasti použití gridů
Pro představu si uvedeme několik příkladu použití, kde gridy mají/mohou mít uplatnění. Následující příkladu jsou jen pár z mnoha:
Modelování a zpracování bioinformatických dat (příkladem jsou 3-D simulace molekul atp.).
Distribuce dat z urychlovačů částic a jejich následná analýza (data dosahují velikosti desítek PB [10^15 bajtů])
Výpočty a analýzy modelů pomocí fluidní dynamiky a pevné mechaniky (příkladem jsou modely letadel a jejich dynamika ve vzduchu).
Produkce a následná analýza interaktivních medicínských simulací.
Analýza a distribuce astronomických dat z teleskopů (data dosahují velikosti stovek TB [10^12 bajtů])
Vyhodnocování, monitorování a simulace znečištění prostředí a předpovědi počasí (příkladem je také analýza tektonických dat o zemětřesení atp.).
Produkce, vysílání a přehrávání interaktivního mediálního obsahu.