Protokoll der Sitzung vom 9.7.2008 des NAF Nutzergremiums: --------------------------------------------------------- Anwesende: Wolfgang Ehrenfeld (ATLAS), Andreas Gellrich (IT), Hartmut Stadie (CMS), Jan Erik Sundermann (ATLAS), Carsten Hof (CMS), Kai Leffhalm (IT), diverse Betreiber (auch am Telefon) Entschuldigt: Alexey Zhelezov (LHC-B), Johan Blouw (LHC-B) 1. Bericht vom Vorsitz: Aus dem Grid-Board: Für die Jahre 2008/2009 gibt es insgesamt 1,37 MEuro vom BMBF für NAF Hardware. Die entsprechende NAF Mittel aus der Allianz (inklusive für 2010) werden um gewidmet. Die NAF Allianzmittel für 2011 und 2012 sind ungefähr 200 kEuro pro Jahr. D. h. das es 2010 keine neue Hardware geben wird. Anfrage von ATLAS: ATLAS will die ATLAS TAG DB (Oracle) an der NAF betreiben und will die für die endgültige Entscheidung die folgenden zwei Dinge wissen: wieviel die entsprechende Hardware kosten wird und ob DESY den Oracle Service betreiben kann. Die offizielle Anfrage wird an Volker Guelzow als Projektleiter weitergeleitet. Weiteres: CMS wird einen NAF Workshop auf der GridKa-Sommerschule durchführen. 2. Nächste Hardwarebeschaffung: Knut Woller hat über die erste Runde der Hardwarebeschaffung berichtet. Es sollen etwa 500 TB dCache Storage, 3 Bladecenter fürs Batchsystem und zusätzlicher Plattenplatz für Lustre angeschafft werden. Weitere Anschaffungen sind für November 2008 und 2009 geplant. Die Experimente sollen bis zur nächsten Sitzung entscheiden, ob weitere CPUs im GRID Kontext benötigt werden. Zur Zeit werden die Grid Ressourcen nicht stark explizit benutzt. Bitte VOMS Rolle /atlas/de, /cms/de usw. benutzen. 3. Kontakt zu den Betreibern: Expertenliste Verschiedene Optionen zum Besseren Kontakt zwischen NUC und Betreibern wurde diskutiert. Die Betreiber werden eine Kontaktperson von DESY IT/DV benennen, die diese Funktion übernimmt. 4. LHCb Requirement Paper: Die LHCb Kollegen arbeiten dran. 5. Helmholtz Allianz Arbeitsgruppen auf der NAF: Die Allianz Arbeitsgruppe 'Zentrales Jetveto in der Vektorbosonfusion' geleitet von Markus Schumacher (Siegen) und Dieter Zeppenfeld (Karlsruhe) will auf der NAF arbeiten. Dazu werden Accounts, AFS, Speicherplatz und weitere benötigt. Die Betreiber haben die Anfrage zur Kenntnis genommen. Prinzipiell gibt es keine Probleme, aber es soll bedacht werden, das die NAF für die Datenanalyse ausgerichtet ist. Weitere Details werden zwischen den Betreibern und dem Arbeitsgruppenvorsitz besprochen. 6. AFS Status /afs/naf.desy.de ist vom CERN aus sichtbar. Aufgrund der CERN AFS Konfiguration war dies nicht automatisch möglich. Die Konfiguration unterhalb /afs/naf.desy.de/user wurde so geändert, das $HOME/public immer sichbar ist. Die Betreiber werden die Dokumentation ergänzen: naf_token Skript, um einen AFS Token für die NAF außerhalb der NAF zu erhalten und empfohlene AFS Clientkonfiguration. Die Probleme von CMS mit temporaeren Dateien im AFS braucht einen Fix im AFS Client, der von OpenAfs gemacht werden muss. Der neue CVS Client auf der NAF unterstütze vollständig den CERN CVS Server (Kerberos 5 Authentifizierung). Die Diskussion des Problems, nur ein Kerberos 5 Ticket zu haben, wurde vertagt. Eine saubere Lösung ist nicht erkennbar. 7. Monitoring Status Yves Kemp hat die GRID Monitoring Seiten (http://grid.desy.de/monitoring) vorgestellt, die zur Zeit nur DESY intern oder mit Passwort zugänglich sind. Diese sollen in der Zukunft öffentlich zugänglich sein. Kai Leffhalm hat den Prototypen der BATCH Monitoring Seiten (http://www-zeuthen.desy.de/dv/nafstat/) vorgestellt. Zur Zeit werden noch Informationen per User dargestellt. Für die öffentlich Variante wird die User Information anonymisiert. Außerdem soll die absolute Auslastung bzw. der Leerstand auch angezeigt werden. Für die interaktiven Workgroupserver werden Standard Ganglia-Plot zur Verfügung gestellt. 8. Operation Status: Der Lustre Client hängt sich unter bestimmten Bedingungen auf, so dass ein Reboot des Clients nötig ist. Das Problem konnte im Labor nachgestellt werden. Eine Lösung (Tune) ist wahrscheinlich gefunden. Die Betreiber werden die Dokumentation zu den NAF Filesystemen ergänzen und Tipps/Usecases mit aufführen. 9. User Test Status: ATLAS und CMS sind mit der Testphase fertig. ATLAS hat 86 registrierte User, CMS 20. ILC benutzt die GRID Ressourcen sehr erfolgreich. Die interaktiven Ressourcen werden für Rekonstruktion benutzt. Es wurde vorgeschlagen, einen Workshop zu PROOF zu organisieren, um Fortschritte zu erzielen. Gruppen mit PROOF-Erfahrung sind CMS Hamburg, ATLAS München und Alice. Dies wird auf dem nächsten Treffen weiter diskutiert. 10. User Space: Im ATLAS Computing Model ist User Space auf dem T2 nur temporäre. User Space auf der NAF ist eine willkommene Alternative. Im CMS Computing Model hat jeder User an seinem T2 ein Homeverzeichnis von ungefähr 1-2 TB. Die NAF soll dies für CMS-D übernehmen. Genauere Zahlen (Platz pro aktiven User und Anzahl der aktiven User) sind schwer abzuschätzen. 11. Lokaler dCache Zugriff: Der lokale Zugriff aufs dCache via /pnfs beeinflusst die Performance der ganzen dCache Instanz und führt zu Problemen der Authentifizierung bzw. der Dateirechte. User ID auf der NAF und im T2 sind unterschiedlich. Ein read-only Mount löst die Probleme nicht. Chimera wird den /pnfs Mount in der Zukunft ablösen, aber nur das Performance Problem lösen. Yves Kemp hat Tools/Wrapper entwickelt, die das zweite Problem angehen, indem gsidcap als Zugriffsprotokoll benutzt wird. Es braucht auch keinen /pnfs Mount mehr. Yves wird Informationen über die Tools an die NUC-Liste schicken und die Experimente sollen Feedback auf der nächsten Sitzung geben. 12. Lustre Performance: ATLAS User sehen die hohe I/O Rate von Lustre nicht. Es gibt aber keine konkreten Zahlen. Wolfgang Ehrenfeld wird sich mit Uwe Enslin für weitere Untersuchungen zusammensetzen. Die Leserate soll bis zu 600 MB/s gehen, die Schreibrate bis zu 200 MB/s. 13. Dokumentation: Verbesserungsvorschläge und Kommentare zur Dokumentation sollen an naf-helpdesk@desy.de geschickt werden. 14. Account Registration: Ziel von CMS ist, aus jedem Institut eine Person zu haben, die Accounts erstellen kann. Für LHCb und ILC gibt es jetzt auch Administratoren aus den Experimenten. Das Webformular soll diesen Monat in einer ersten Version fertig gestellt werden. 15. AOB: Nächste Sitzung ist am 6. August 2008 um 14 Uhr. Danach jeden 2. Mittwoch im Monat um 14 Uhr, d.h. 10. September 2008 um 14 Uhr. Die weiteren Sitzungen sind am Telefon. DESY Konferenzsystem: Einwahl 040-8998-1390 ID: 15441#