Úvod

Definice Gridu

Výpočetní grid je hardwarová a softwarová infrastruktura, která poskytuje spolehlivý, standardizovaný, všudypřítomný a levný přístup ke špičkovým výpočetním službám.

(I. Foster, C. Kesselman. - The Grid: Blueprint for a New Computing Infrastructure, 1999)

V technickém slova smyslu je to rozsáhlý distribuovaný systém organizačně samostatných elementů, kterými mohou být individuální počítače (paměti, CPU, pevné disky) a informační systémy vzájemně propojeny počítačovou sítí.

Výpočetní grid je popisován analogií s elektrickou rozvodnou sítí - kolem roku 1910 měla každá elektrifikovaná budova vlastní generátor elektřiny, ale ty nebyly navzájem propojeny. Nebylo možné použít víc než byla kapacita generátoru, celková kapacita všech generátorů nebyla efektivně využita, zavedení elektřiny bylo drahé. Ke skutečnému rozvoji používání elektřiny došlo až zavedením propojených velkých elektráren a rozvodné sítě ke spotřebitelům, která umožnila levný, všudypřítomný a standardizovaný zdroj el. energie.
Obdobně dnes každá organizace spravuje vlastní výpočetní kapacity (počítače, diskovou kapacitu, software, data, specializovaný hardware), které neumí efektivně sdílet s jinými. Výpočetní grid by měl umožnit právě efektivní sdílení výpočetních kapacit mezi jednotlivými organizacemi.

V laickém pojetí si představte milióny počítačů (desktopy, superpočítače, servery, mainframy atd.), které jsou umístěny po celém světě a patří různým lidem (studentům, doktorům či sekretářkám) nebo různým organizacím (komerční společnosti, univerzity, nemocnice apod.) a jsou připojeny do internetu. Představa Gridu, zde nastupuje jako jeden obrovský, samostatný a super výkonný počítač sestavený z těchto počítačů.

Gridové vs distribuované prostředí

Distribuované aplikace jsou budovány jako specializované systémy pro jediný cíl nebo skupinu uživatelů. Naproti tomu gridové prostředí rozšiřuje původní distribuované prostředí o tyto nové vlastnosti:

  • koordinuje různé druhy zdrojů nepodléhající centralizované správě
  • nevyžaduje striktně stejný hardware, data a aplikace. Je zde tzv. vysoká heterogenita prostředí
  • různé uživatelské skupiny a aplikace interagují s Gridem různě (některé skupiny či aplikace mohou mít větší priority)
  • zdroje a uživatelé často přibývají / ubývají / mění se (jakýkoliv PC se může do Gridu nezávisle připojit a také z něj odpojit)
  • dynamická povaha, kdy jednotlivé úlohy mohou být přesouvány za účelem zvýšení výkonu

Druhy a hierarchie gridů

Gridy dělíme hierarchicky podle povahy aplikací či úloh, které na nich mají běžet. Některé úlohy potřebují velkou výpočetní kapacitu a jiné oproti tomu dostatek místa pro svůj hladký běh. Existuje následující hierarchie gridů:

  • Výpočetní grid

Poskytuje výpočetní servis a zabezpečené služby pro spouštění aplikací na distribuovaných výpočetních zdrojích. Je schopný dynamicky agregovat výpočetní kapacitu velkého počtu individuálních počítačů.

  • Datový grid

Poskytuje zpracování rozsáhlých datových sad pomocí služeb již zmíněného "výpočetního gridu". Jeho charakteristikou je sdílení a správa velkého množství dat a to vše při zabezpečeném přístupu (míra zabezpečení je velice důležitá např. pro lékařská data).
Většina těchto funkcí je řešena formou distribuovaných datových katalogů vytvářejících iluzi jednotného hromadného datového úložiště. Tyto katalogy udržují meta-data (velikost, přístupy, komprese atp.) souborů a také jejich umístění, popřípadě umístění jejich kopií v rámci celého gridu.

  • Informační/znalostní grid

Je charakterizován snahou o rozšíření možností datových Gridů o poskytování kategorizace dat, ontologií, sdílení znalostí a tvorby workflow. Součástí informačních Gridů jsou virtuální prostředí pro spolupráci resp. virtuální laboratoře umožňující vzdálenou kontrolu a správu senzorů a zařízení.

Virtuální organizace (podstata a princip)

Jednoduchá představa o gridu pokládá ihned několik otázek typu:

  • Kdo bude platit za tento výpočetní výkon (počítače, elektřina atp.) ?
  • Kdo zaručí bezpečnost (tj. přístup jen pro určené uživatele) ?
    [*[Kdo zaručí spolehlivou dodávku tohoto výpočetního výkonu ?

Výčet otázek tohoto typu může pokračovat dále. Proto grid zavádí důležitý pojem Virtuální organizace (VO).

Virtuální organizace je souhrn výpočetních zdrojů a lidí pracujících na společném projektu, jejichž cílem je sdílení datových zdrojů a výpočetních kapacit použitelných pro zpracování výpočetních úloh. Jednotlivé virtuální organizace se mohou navzájem podporovat a sdílet zdroje. VO mohou účtovat spotřebu výkonu členům jiného VO a v případě náhlé potřeby výkonu tuto spotřebu vyúčtovat a tím obdržet požadovaný výkon navíc.

Oblasti použití gridů

Pro představu si uvedeme několik příkladu použití, kde gridy mají/mohou mít uplatnění. Následující příkladu jsou jen pár z mnoha:

  • Chemie a biologie

Modelování a zpracování bioinformatických dat (příkladem jsou 3-D simulace molekul atp.).

  • Částicová fyzika

Distribuce dat z urychlovačů částic a jejich následná analýza (data dosahují velikosti desítek PB [10^15 bajtů])

  • Inženýrství a design

Výpočty a analýzy modelů pomocí fluidní dynamiky a pevné mechaniky (příkladem jsou modely letadel a jejich dynamika ve vzduchu).

  • Lékařství

Produkce a následná analýza interaktivních medicínských simulací.

  • Astronomie

Analýza a distribuce astronomických dat z teleskopů (data dosahují velikosti stovek TB [10^12 bajtů])

  • Životní prostředí

Vyhodnocování, monitorování a simulace znečištění prostředí a předpovědi počasí (příkladem je také analýza tektonických dat o zemětřesení atp.).

  • Média (filmy, hudba)

Produkce, vysílání a přehrávání interaktivního mediálního obsahu.