Välkommen till linuxportalen.se!

Linuxportalen.se är Sveriges största och aktivaste webbplats för användare av öppen- och fri programvara.

Du besöker Linuxportalen.se som gäst vilket begränsar din möjlighet att använda webbplatsens alla funktioner. Genom att registera dig som medlem får du inte bara möjlighet att söka bland webbplatsens innehåll, skapa nya och delta i befintliga diskussioner, skapa din egen blogg, kommunicera med andra medlemmar genom privata meddelanden och delta i omröstningar. Du får också tillgång till Veckans Kadavro - en seriestrip unikt skapad för Linuxportalen.se!

Registeringen sker snabbt och är helt kostnadsfri - tveka inte, bli medlem idag!

SUN Grid Engine - en klusterprogramvara

Vad är SUN Grid Engine till för

Programvaran är till för att skapa beräkningskluster. Dessa kluster kan var en heterogen blandning av många olika typer av datorer med olika OS och hårdvara, lika väl som för en homogen samling klienter med exakt samma OS och hårdvara. Vilken maskin (arkitektur), OS och andra villkor som krävs bestäms när ett jobb scheduleras ()läggs ut) för att köras på klustret. Det är du som "beställare" som bestämmer vad som krävs. Systemet stödjer även lastbalansering gnom att nya jobb läggs på den minst belastade maskinen.

 

Vad är det inte

Det handlar inte om lagringskluster eller lastbalansering i den mening att jobb under pågående körning skall flyttas mellan maskiner.

 

Beskrivning av ett användarfall

Det finns många användningsområden för denna men jag kommer att begränsa mig till ett fall som jag själv har installerat och driftat.

Tekniskt beräkningskluster

 • Funktionen är implementerad i ett icke närmare angivet medelstort bolag för dess tekniska beräkningar inom viss del av dess utvecklingsavdelningar. Närmare än så kommer det inte att specificeras. Har du specifika frågor på implementation eller liknande så är du välkommen att höra av dig.
 • För att ha någon att skylla på och kräva funktion av så bestämdes att själva grundkonfigurationen skulle köpas in av ett separat mindre bolag som är specialister på detta. Det gav också en väldigt kort startsträcka att komma igång med arbetet vilket vi såg som väldigt viktigt.
 • För implementation valdes SUN Grid Engine och Red Hat Enterprise Linux
 • Ett annat krav var att det gick att köra på Linux. All utveckling skedde tidigare på SUN och SPARC, men är i och med detta flyttad till Linux och x86 på grund av dess senare suveräna pris/prestanda fördelar.

Systemet är uppbyggt runt en central huvudnod, server, och ett tio-tal standardklienter. Till detta kommer några stycken kraftklienter.

 1. Servernod - har inga speciella prestandakrav, däremot kvrav på driftsäkerhet. Bör dock ha mycket minne eftersom den skall hantera alla alla grafiska inloggningar från användare. Ett annat krav är att den är långlivad och stabil vilket innebär att man skall välja någon av de speciella Server-datorer som finns och inte bara vilken standard-PC som helst.
 2. Standardklienter - är vanliga kontorsdatorer, sådana som alla anställda på bolaget har på sitt kontor. Detta eftersom klustret bara lånar datorn en tid. När datorn kommer och är det snabbaste som finns att få tag i så stoppas den in i klustret och lever sedan där ett år eller två.
  - Minneskrav - på dessa stoppas så mycket minne som det går, typiskt 3-4GB
 3. Kraftklient - är en 1U rackmonterat server dator med 2-4 flertrådade processorer och maximalt med minns, minst 16GB per processor. Typiskt har en sådan dator då 32GB RAM, men kan ha än mer. Trots dessa i viss mån extrrema krav landar de inte på mer än ca. 50.000 kr, ex.moms.

Gemensamt för samtliga datorer ovan är att mängden lokal hårdisk saknar betydelse. Normalt väljs standarddisk, eller minsta tillgängliga disk. All lagring av både program och data sker på centrala diskserversystem på några TB vardera.

 

Teknisk livstid för datorer i klustret

 1. Server - extremt lång. Så lång som möjligt, gärna hela avskrivningstiden ut. Att byta denna dator medför driftstopp i verksamheten. Virtualliserad server är en möjlighet för att göra livstiden 'oändlig'.
 2. Standardklient - kort. Dessa är bara lånade (1-2 år) av verksamheten i övrigt och roteras, lämnas tillbaka till verksamheten, när ny snabbare dator kommer. De medger även dragspelsfunktion. Klustret kan både växa och krympa i antal beroende på verksamhetens behov av beräkningskraft.
 3. Kraftklient - mycket lång. Dessa går inte att använda som kontorsdator eller någon annan plats i företaget. Därför körs dessa till de går sönder eller av annat skäl måste ersättas. Nyanskaffning av dessa styrs inte av teknisk eller ekonomisk avskrivning utan av behov av beräkningskapacitet.

 

Användning

Användare loggar in på server. Där kan de med ett kommando begära bästa (minsta lastade) klient och sedan köra vidare interaktivt arbete på denna maskin. I annat fall är de kvar på servernoden och redigerar sin kod men sedan startar de det tunga jobbet genom att begära resurser av av bästa lediga klient. Denna begäran kan vara av både interaktivt slag som av batch-typ. Interaktivt presenterars ett fönster från utvald klient och presenteras för använbdaren. För batch fallet kan något dussintal beräkningar köas upp av en och samma användare genom exekvering av ett enda script. Nu har vi inte så många licenser av programvaran att detta kan ske ostraffat. Görs det under arbetstid blir alla andra kollegor av med möjligheten att köra sina jobb. Föga populärt, som man väl kan förstå. Därför krävs viss behärskning att inte överlasta beräkningsklustret. All har dock möjlighet att lägga ut hur många jobb som helst. Detta kontrolleras inte på annat sätt än genom internt regelverk. På grund av licensbegränsningar för viss annan mjukvara så ingår det även en kontroll av lediga licenser i samband med att ett jobb läggs ut på klustret. Finns ingen licens ledig så köas jobbet upp och ligger där tills det blir en ledig licens. Därför är det normalt så att när de går hem för dagen så startas en större mängd batchsimuleringar som köas upp för körning under natten.

 

Typiskt så kräver ett jobb 100% CPU och allt tillgängligt minne. Detta ger då nästa begränsning för klustersystemet. Det är ingen mening att lägga ut ett jobb på en maskin som redan går för fullt. Bättre då att vänta på att jobbet gått klart innan nästa jobb startar. Ett normalt jobb kör normalt i flera timmar, upp till åtta är inte ovanligt, så det är mycket beräkningar som skall göras.

 

Multitrådade maskiner blir här helt nödvändiga även för enkel-CPU maskiner, vilket standardklienterna alltid är. På multitrådade maskiner körs beräkningen med full kraft på en av trådarna. Den andra tråden/trådarna hanterar OSet på maskinen och eventuella interaktivt inloggade användare. På en enkeltrådad maskin så upplevs maskinen interaktivt närmast som stendöd om där fuinns ett tungt jobb. Även det tunga jobbet går långsammare. Men med en flertrådad maskin så upplevs den interaktivt närmast som olastad samtidigt som det tunga jobbet går fortare, dvs. det störs inte av att hantera OS och en interaktiv session. 

 

På kraftklienterna läggs de jobb som är än tyngre. Även dessa kräver 100% CPU och allt minne, fast nu pratar vi 16GB RAM. För ett enda jobb, en enda process. Parallellisering av i form av fler trådar är inte möjlig för vår typ av applikation, tyvärr. Beräkningstider för dessa jobb börjar runt åtta timmar men kan glatt hålla på både ett och två DYGN. Mycket tungt.

 

Klustersystemet har många sensorer inbyggda så att optimal maskin kan väljas beroende på tillgänglig mängd och antal CPU, RAM, disk, OS, maskintyp eller mycket annat. Det går även enkelt att skapa pluginer till egna applikationer, andra krav eller licenser för annan mjukvara.

 

----

Linux växer snabbast!

Alternativ för kommentarvisning

Välj ditt önskade sätt att visa kommentarerna och klicka på "Spara" för att verkställa dina ändringar.

hoths bild

Andra användningsområden för SUN Grid Engine

 1. parallell kompillering av programkod
 2. rendrering av bildrutor för tecknad film
 3. transaktionssystem, realtid och batch

Bara några exempel till vad man kan göra.

 

Det går att styra klienters tillgänglighet över tid. Förutsatt att varje jobb inte lastar ner klienten väldigt mycket så kan företagets hela maskinpark användas som del i klustret. Belastning på dessa klienter kan då styras till X antal samtidiga jobb, alternativt till viss last på klienten. Men, när personalen går hem för dagen så kan tillgängligheten på deras maskiner kranas upp. Då kan man exempelvis under tiden 18:30 - 06:30 tillåta att de lastas till 100% vilket ger väldigt många klienter, helt gratis, till klustret. Allt beror dock på tillämpning om detta är lämpligt att göra. En av förutsättningarna torde vara att man har många och relativt korta jobb.

 

----

Linux växer snabbast!

----
Linux växer snabbast!