Diskussion:SciLINC

Aus BC-Wiki
Zur Navigation springen Zur Suche springen

Übersetzung der Ankündigung des Projektteams

Als die Entwicklung des SciLINC Projekts begann hatten wir 4 vorrangige Ziele. Kurz zusammengefasst waren es folgende:

  • 1.Erweitere den öffentlichen Zugang zu national bedeutender wissenschaftlicher Literatur
  • 2.Erhöhe den Nutzen digitalisierten Materials durch die Erstellung eines Web-Magazins für eingescannte Literatur, Schlüsselworten und Onlineressourcen mit Suchwerkzeugen und Analysen.
  • 3.Erstelle ein pädagogisches Lernwerkzeug über das leben der Pflanzen. Während der Bildschirmschoner im Hintergrund Texte verschlagwortet sind auf dem Rechner der Teilnehmer Informationen über das Leben der Pflanzen in den Vereinigten Staaten und der ganzen Welt zu sehen. Die Informationen würden jeden Pflanzennamen oder Terminus, der gerade verschlagwortet würde, beschreiben und würde beschreibende Daten, Bilder, Karten und die vermerkten Links nach draußen anzeigen.
  • 4.Stelle ein Modell zur Nutzung von öffentlichen Anwendungen des verteiltem Rechnens in der Bibliotheksgemeinschaft.

Botanicus erledigt die ersten beiden Ziele, sowie die Verarbeitung der durch SciLINC generierten Datensätze wunderbar. Das Projekt hat auch Ziel #4 erreicht.

Wir haben sehr viel über gridbasierte, verteilte, öffentliche Ressourcen verwendende Computeranwendungen und die BOINC-Architektur gelernt. Es gibt bereits Gedanken und Pläne für zukünftige Analysen die weitaus computerintensiver als die original SciLINC-Anwendung und wir freuen uns schon darauf Ihnen diese Projekte eines Tages vorstellen zu dürfen.

Während die Datenmenge die SciLINC analysieren muss in Zukunft ständig wachsen muss scheint das Anwachsen der Informationsfülle das Benutzererleben beim Laufen lassen von SciLINC nicht zu fördern.

Es wurde vorgeschlagen, die Daten in einzelne Files zu verpacken, und nicht in 50er-Pakete pro WU wie jetzt. Dieser Vorschlag wurde umgesetzt. Wir hatten geplant dies vor dem Stapellauf von SciLINC zu erledigen, aber die Terminplanung verhinderte es und die Gemeinschaft entdeckte das Projekt bevor wir zur Veröffentlichung fertig waren. Wir erwarten das die Tests zeigen werden, dass das Umpacken die Last auf die eigentlichen BOINC-Software verringern wird. Aber es wird den erforderlichen Datentransfer nicht verringern.

Die Wahrheit ist das WUs so schnell erledigt werden dass das Erreichen von Ziel 3 niemals realistisch wurde.

Als die Entwicklung von SciLINC begann war das Verständnis der Projektverantwortlichen das es von einem technischen und wirtschaftlichen Standpunkt aus sinnvoll wäre öffentliche Computerressourcen anstelle eines internen Gridsystems zu nutzen sobald weniger als 1GB Daten pro Rechentag erforderlich ist. Durch die Benutzung des BOINC-Rahmenwerks für den Transfer der Daten zu den Rechnern erfüllt SciLINC dieses Kriterium.

Trotzdem, unsere kurze Erfahrung mit der eingeschworenen BOINC Gemeinschaft in den letzten Wochen hat uns gezeigt das diese Zahlen für die Gemeinschaft etwas andere sind. In der Originalfassung hätte SciLINC etwa 250MB komprimierter Daten versenden müssen um einen modernen Prozessor einen Tag rechnen zu lassen. Dies wären ausgepackt ca. 660MB Eingabedaten. Der Client müsste ca. 44MB Ergebnisse hoch laden, gepackt auf ca. 17MB. Diese Zahlen wurden mit der Weiterentwicklung und Verbesserung von SciLINC nur noch größer.

Dies ist nicht akzeptabel für den Durchschnittsbenutzer von BOINC.

Ein Blick aus der Perspektive eines Dial-Up-Benutzers bedeutet folgendes: Wenn er SciLINC auf 1% BOINC-Anteil setzt, also ca. 15min Rechenzeit pro Tag, müsste er dafür ca. 2,5MB herunterladen. Das mag nicht viel sein für Breitbandnutzer, aber für Dial-Upper (und wir mussten lernen das es davon noch einige unter den BOINC-Fans gibt) würde die Transferzeit die Rechenzeit übertreffen.

Also, wo stehen wir jetzt?

Selbst wenn das Transfer:Credit-Verhältnis für die Gemeinschaft annehmbar wäre hätten wir realistisch gesehen nicht genügend Daten um hunderte oder tausende BOINC-Enthusiasten über eine längere Zeit zu versorgen. Wie wir auf den verschiedenen Foren der Gemeinschaft erfahren haben wird eine relativ geringe Menge Credit für eine relativ hohe Last auf den Systemen verdient. Alle Verbesserungen in Hinsicht auf Datenverarbeitung und -transport die getestet wurden führten nur zu mehr benötigten Datentransfer.

Wie schon oben erwähnt untersuchen wir in den nächsten Monaten die Möglichkeit viel rechenintensiverer Analysen. Es steht zu erwarten, dass diese viel besser in ein BOINC-Projekt passen werden als die aktuelle Aufgabe der Textindizierung und der taxonomischen Analyse, die eine relativ geringe mathematische Komplexität aufweisen.

Aus diesen Gründen wurde entschieden, das von nun an alle SciLINC Berechnungen intern erledigt werden. Wenn wir etwas mit einer besseren Crediterwartung (und einem schöneren Bildschirmschoner) haben, werden wir es der Gemeinschaft verfügbar machen.

Danke für Ihr Interesse und Ihre Unterstützung. Wir freuen uns mit Ihne in der Zukunft wieder zusammenarbeiten zu können.

Das SciLINC Team

Ende