Jälkitestausta ja lastentautien selvittelyä

Systeemi on nyt ollut käytössä kuukauden verran. Kaikenlaista pientä säätöä on ollut:

  • osalla käyttäjistä oli tyhjiä duplikaatteja viesteistään; ne poistettiin
  • ihan muutaman käyttäjän viestit eivät olleet lopulta siirtyneet; ne siirrettiin
  • viestien kopiointi paikallisen ja ei-paikallisen mappi-palvelun välillä ei toiminut; nyt kukaan ei ota suoraan yhteyttä kansioita sisältäviin mappi-palveluihin
  • @hyad-päätteiset tunnukset aiheuttivat hankaluuksia; niillä kirjautuminen estettiin kokonaan (virallisesti tuettu niitä ei ole koskaan)
  • välillä systeemissä esiintyi järkyttäviä kuormituspiikkejä, jotka onnistuivat jumittamaan sen kerran työaikana; syyksi selvisi keskusmuistin vähyys; muistia lisättiin
  • muistiongelmien vuoksi myös varmuuskopiointeihin kului kauan aikaa – sunnuntaina aloitettu täysvarmuuskopio venyi maanantain puolelle; varmuuskopioiden uudelleenjärjestely ja muistin lisäys poistivat ongelma
  • klusterisofta aiheutti huomattavan korkean määrän tiedostojärjestelmäntarkistusskriptin käynnistyksiä, mikä saattoi pahentaa koneen jumittumista muistiongelmien aikana; päätettiin luottaa siihen, että tiedostojärjestelmän ongelmat huomattaisiin palvelun muusta toimimattomuudesta ja poistettiin tarkistus
  • websieven käyttöoikeuslistoissa oli ongelmana se, että oikeuksien poistoyrityksestä seurasikin e-oikeuden antaminen; tämä korjattiin
  • levyjärjestelmällä oli kuormitusongelma, kun samassa levyryhmässä oli yhden mappilevyn lisäksi käsittämättömän määrän kuormaa aiheuttava logipalvelimen levy; logipalvelimen levy siirrettiin muualle
  • edelleen järjestelmän niillä koneilla, joissa klusteripalveluidenhallintaohjelma on käynnissä, esiintyy yhdentoista tunnin jaksolla tonttulakinnäköisiä piikkejä kuormituskäyrässä. Missään muussa järjestelmän kuormittuneisuutta kuvaavassa suureessa (levynkäyttöaste, prosessorinkäyttöaste, verkonkäyttöaste, prosessien määrä) ei esiinny vastaavaa vaihtelua, eikä järjestelmän silmämääräinen vaste ole piikkien aikana sen huonompi kuin muulloinkaan, joten ne eivät varsinaisesti vaikuta järjestelmän käytettävyyteen. Ilmeisesti käyttöjärjestelmäytimen sisällä esiintyy pientä lyhytaikaista odotusta jollakin resurssilla. Asiaa yritetään selvittää edelleen, muttei kovin korkealla prioriteetilla, koska näennäiset kuormituspiikit ovat oikeasti vain Load average -suureen piikkejä, jotka eivät siis havaitusti merkitse sitä, että järjestelmä olisi oikeasti kuormittunut.

Muuten asiat ovat toimineet kuin unelma:

  • systeemi on järkyttävän paljon nopempi kuin edellinen
  • käyttäjien peruspostilaatikon koko saatiin tuplattua, eikä ahtauden merkkejä ole ainakaan vielä näkyvissä
  • yhteispostilaatikoiden käyttäminen mistä vain onnistuu; siirtoja ei tarvitse enää tehdä
  • yhtään vahingossa poistettua yhteispostilaatikkoa ei ole uuden järjestelmän aikana tullut, kun kansionpoisto-oikeus poistettiin kaikilta paitsi yhteispostilaatikoiden ylläpitäjiltä
  • hieno IMAP PUSH -toimintokin toimii (kokeile vaikka kännykälläsi tai Outlookilla!)
  • poistettujen viestien palautus onnistuu muutamassa sekunnissa, ja ne voi vieläpä palauttaa valikoidusti tunnistetietojen perusteella – ei enää hidasta ja epätarkkaa nauhoilta kaivelua
  • replikointikin toimii: kaikki data on olemassa kahteen kertaan, jos meiltä vaikka hajoaisi kokonainen levyjärjestelmä ;)
  • käyttäjät voivat tavoittaa Mapin yhden yhtenäisen osoitteen kautta (posti.mappi.helsinki.fi). Osoitteella on vieläpä Soneran allekirjoittama sertifikaatti, jota useimmat sähköpostiasiakasohjelmat tukevat ilman erillisten juurisertifikaattien asennusta – vielä kun tieto tästä tavoittaisi käyttäjätkin
  • klusterointi tekee rautatason ylläpidosta kevyttä ja mukavaa: toissa tiistaina tehty muistien päivitys pystyttiin tekemään yhteen koneeseen kerrallaan ilman, että käyttäjät huomasivat kuin enintään kaksi kappaletta noin minuutin katkoja palvelussa
  • varmuuskopioiden palautus (jota on jouduttu tekemään tähän mennessä kerran, kun piti palauttaa kokonainen poistettu kansio) mille tahansa fyysiselle klusterikoneelle toimii kauniisti
  • starttls toimii, joten nyt meillä on tuki niillekin mobiililaitteille, jotka eivät imaps:ää tukeneet – ja päästiin kaatuilleesta stunnelista eroon
  • läpinäkyvyyskin toimi: ihmisten ei tarvinnut tehdä muutoksia sähköpostiohjelmiensa asetuksiin, paitsi niiden, jotka käyttivät jotakin muuta kuin pääkäyttölupansa lyhyttä muotoa (tästä muutostarpeesta taas tiedotettiin kaikille Mappi-käyttäjille etukäteen, vaikka muita tunnusmuotoja ei ollutkaan virallisesti tuettu lähes kolmeen vuoteen)
  • systeemistä on saatu aikaan varsin kattava ylläpitodokumentti

Mitä nyt:

  • keskitettyä roskapostintunnistusta yhteispostilaatikoille pitäisi selvitellä
  • replikaklusteriin pitäisi myös lisätä muistia, että se olisi valmis vastaanottamaan koko käyttäjäkuorman, jos se joskus joudutaan sinne siirtämään – tarvittavat tiedostojärjestelmät siellä on jo olemassa, samoin kuin erikseen viritetty pää-postilaatikkotietokannan replikointi
  • ylläpitodokumenttia on pidettävä ajan tasalla
  • postilaatikon lisäkiintiöiden hinnat pitäisi päättää (esitys taitaa olla johtoryhmän käsittelyssä seuraavassa kokouksessa)
  • automaattisten poissaoloviestien eli ns. vacation-toiminnallisuuden selvittely on työn alla (siihen liittyy periaatetason ongelmia, jotka on mahdollisesti onnistuttu ratkaisemaan MIT:llä, mutta heistä ei ole ainakaan vielä kuulunut, kun kyselin)

Projekti on siirtynyt jälkitestausvaiheeseen, ja päättyy aikataulun mukaisesti vuoden lopussa. Tilanne alkaa jo nyt olla se, että uuden Mapin ylläpito on osa normaalia sähköpostiylläpitotoimintaa.