Projekt Seti@home

5.12.2008 | rubrika: Seti@home

Průběh výpočtů

Aplikace SETI@Home zpracovává přijaté jednotky a hledá v nich čtyři základní druhy anomálií signálu:

Tvorba WU
Průběh tvorby pracovních jednotek

Nyní se zaměříme na samotnou tvorbu pracovních jednotek a jejich cestu od teleskopu Arecibo až po domácí počítače a opětovný návrat do serverového komplexu kalifornské univerzity v Berkeley. Radioteleskop naslouchá přicházejícím signálům, které jsou digitálně zaznamenávány. Pomocí DLT pásek poté putují do serverového komplexu univerzity Berkeley. Zde jsou již signály rozděleny na miliony WU (work unit – pracovní jednotka) a uloženy v arhivu a na databázovém severu. Z archivu jsou poté odstraněny chybné jednotky a zbývající WU putují přes datový server, který je pomocí Internetu rozešle účastníkům projektu na miliony počítačů po celém světě. Mezi jednotlivými klienty nedochází ke komunikaci, jelikož internetové připojení je potřeba pouze při komunikaci se serverem. Klientský program pracovní jednotky zpracuje, odešle je zpět na datový server a zažádá si o přidělení další práce. SETI@Home sice provádí svědomitou, ale dříve svým způsobem nadbytečnou práci, jelikož každá jednotka byla počítána celkem čtyřmi uživateli. Nyní je každá WU zpracovávána již pouze dvěmi účastníky. Toto zdvojování práce má své opodstatnění v podobě odstranění chybných jednotek zpracovaných nestabilními počítači.

Proces zpracování dat
Proces zpracování dat

Jednotlivé pracovní jednotky mají délku 107s a překrývají se o 20s, jelikož se Arecibo zaměřuje na další body na obloze právě po dvaceti sekundách. Tak docílíme toho, aby byl celistvý 20s signál obsažen alespoň v 1 WU. Klientský program pravidelně ukládá na disk informace o dosaženém zpracování jednotky, aby mohl ve výpočtu pokračovat, pokud dojde k jeho vypnutí, případně vypnutí celého počítače. Klientský program může běžet jako systémový proces, GUI aplikace, případně jako spořič obrazovky. Zpracované jednotky jsou odeslány prostřednictvím Internetu zpět do serverového komplexu v Berkeley, kde jsou uloženy pro další analýzu. K jejich dalšímu zpracování poté dochází jednak z vědeckého hlediska ale také i evidenčního. Datový server zapíše výsledek do diskového souboru, ze kterého jsou poté výsledky přeneseny do databáze. Pro každý výsledek jsou také zapsány informace ohledně uživatele, který danou jednotku zpracoval, jeho procesorovém čase, bodovém ohodnocení, týmu, státu atd. Tyto informace jsou veřejně dostupné přes internetové prohlížeče. Dalším krokem je následovné porovnání výsledků těch uživatelů, kteří spolu počítali stejnou jednotku. Kanonické výsledky jsou poté zkopírovány do oddělené vědecké databáze. Finálním krokem je konečná analýza detekce umělých signálů, identifikace a eliminace radiového rušení a hledání signálů o stejné frekvenci a poloze na obloze, ovšem zachycených v různém čase.

SETI@Home - Enhanced

Původní server

Dne 3.5. 2006 byla spuštěna rozšířená verze původní aplikace nazvaná Seti@Home Enhanced. Jednalo se o přímý důsledek instalace vícepaprskového přijímače a nového záznamníku. Nová verze je přibližně 5x citlivější na výskyt Gaussových signálů a některé druhy impulsů, než byla předcházející aplikace. Zároveň s vyšší citlivostí stouply nároky na výpočetní výkon v důsledku důkladnější analýzy. Díky široké skupině uživatelů, mezi kterými se nachází i mnoho programátorů, se objevily optimalizace pro rychlejší zpracování dat a tedy efektivnější využití výpočetního výkonu. Přesto trvá zpracování nových jednotek o několik minut déle v závislosti na výkonu počítače. Výpočetní čas se může lišit v řádu násobků, ale také pouze o pár jednotek či maximálně desítek %. Výhodou BOINCu je i to, že se při takovémto přechodu uživatelé počítající se starou oficiální aplikací nemuseli o přechod starat. Staré jednotky se dopočítaly s původní aplikací a BOINC poté automaticky stáhl aplikaci novou včetně citlivějších jednotek. Problém nastává pouze při instalaci optimalizovaných aplikací, kde je potřeba provést ručně reset projektu a tím dojde k automatickému stažení nová verze včetně jednotek. Optimalizace jsou k dispozici pro systémy Windows i Linux a jsou k dispozici pro jednotlivá instrukční sady CPU.

Přechod na novou aplikaci Enhanced poznali uživatelé jednak podle delší doby zpracování jednotlivých datových balíčků a také dle názvu aplikace přímo v BOINCu, kde je zobrazeno setiathome_enhanced 5.27, případně verze vyšší. Zároveň bylo upraveno kreditové ohodnocení spočítaných jednotek. V původní verzi si uživatel nárokoval kredit v závislosti na výsledcích benchmarku procesoru, který provedl BOINC. Vycházelo se z prvních 3 uživatelů, kteří spočítanou jednotku odeslali. Nyní je přidělování kreditu poněkud spravedlivější, protože nevychází z momentálně provedeného testu. Každá pracovní jednotka má nyní pevně přidělené množství kreditu podle odhadu provedených operací s plovoucí desetinnou čárkou. Záleží tedy pouze na výkonu procesoru, za jak dlouho stihne danou jednotku spočítat, a tedy i kolik kreditu v závislosti na počtu odevzdaných jednotek obdrží.

Nový server pro Enhanced

Čas potřebný ke zpracování nových jednotek závisí na AR (úhlu rozsahu). Tato hodnota představuje úhel, pod kterým Arecibo sledovalo oblohu a zaznamenávalo signály, ze kterých je vygenerována pracovní jednotka. Pokud se AR blíží k nule, teleskop byl zaměřen na vybraný konkrétní cíl a vzhledem k obloze se nepohyboval. Hodnoty AR kolem 0,4 představují situaci, kdy se přijímač nepohybuje, ale jeho poloha se mění vlivem rotace Země. Vyšší hodnoty AR představují přesuny od jednoho cíle k dalšímu. Většina zpracovávaných jednotek má AR kolem hodnoty 0.4. Jestliže dostanete jednotky s výrazně vyšším AR, pak tyto jednotky spočítáte za velmi krátkou dobu. Pokud bude ale AR výrazně menší, zpracování může trvat i několikanásobně déle. Pro ilustraci vezměme jednotku s rozsahem úhlu 0.5 a koeficientem 3.06. Jestliže původní staré jednotky byly spočítány za 2h, nové jednotky enhanced s AR 3.06 bude ten samý počítač zpracovávat 3,06 * 2 čili 6,12 hodin. Uživatel si hodnotu AR může vyhledat na stránkách projektu pod svým účtem u přidělených jednotek.

Na závěr jen upozornění. Uváděný čas dokončení výpočtu v BOINC Managerovi je pouze odhad v závislosti na náročnosti pracovní jednotky a parametrů vašeho počítače. Po zpracování jednotky se výsledný čas výpočtu zohlední v parametru DCF, který představuje korekční faktor odhadu délky výpočtu. Po zahájení zpracování další jednotky, DCF opětovně upřesní odhad dokončení. Čím více jednotek tedy novou aplikací zpracujete, tím přesnější bude odhad dokončení.

Screensaver Enhanced
Sceensaver projektu Seti@home - Enhansed