New Releases
Managing the Data Deluge
One of the main problems faced by scientists today is that they are drowning in data. As scientific problems become more complicated, and the models and instruments they use to study them become more complex, so the amount of data is increasing rapidly – in some cases at exponential rates.This explosion in scientific data creates new challenges in how the data is stored, retrieved, analysed and manipulated.
This is not just a problem for the scientists. Given the importance of research in science and engineering for innovation, our ability to find answers to these questions
will directly impact Europe’s competitiveness. Hence, scientific digital repositories are of growing strategic relevance to Europe’s objectives, under
the i2010 strategy, to build a Single European Information Space. Europe has the opportunity to be in the front line of
international developments in this field.
The Scientific Process and the Role of Digital Repositories
The collection of data, and its integrity, is inherent to the scientific process. The full cycle of science includes the
acquisition and measurement of raw data, the develop- ment of models and technology to control physical
phenomena, etc. In certain areas of science (e.g. radio- astronomy, environment, medicine), new technologies and instrumentation
serve as “data factories”, able to produce limitless amounts of data that need to be shared by researchers, often at different locations.
Over recent years Europe has invested heavily in eInfrastructure – ICT- based research infrastructure – as tools to support scientific collabora-
tions. High-speed communication networks, distributed storage, and sharing of computational resources and data processing allow scientists to tackle the full scientific process in an innovative and more effective way.The development of eScience in Europe strongly depends on the availability of these pan-European infrastructures.
What is missing, however, is effective ways of sharing and transferring knowledge. We need to move beyond the network and grid layers, which are already deployed, to create a new data layer within the European eInfrastructures.This can only be addressed by a coherent strategy towards developing European Digital Repositories, federating and providing added value to national and discipline-based repositories.
Building Common Access to Scientific Data Repositories in Europe
To build common access to European scientific results requires a wide-ranging series of roadmaps covering technical, legal and organisational areas, national plans, and users.
These roadmaps for the future pan-European infrastructure also provide valuable information at the national and institutional level.
The majority of content will be sourced at the institutional level. Institutions (universities and research institutes) throughout Europe should be encouraged to set up institutional repositories and to encourage their researchers and authors to deposit their material. International and subject-specific repositories also need to be integrated in a way which best serves the needs of researchers. Europe also has a rich landscape of national initiatives that will foster broad access to scientific repositories.The adoption of metadata standards should be encouraged at all levels.
In the short to medium term, demonstrator/testbed projects should be undertaken to demonstrate trans-national access.These could address themes such as excellence (like Cream of Science, in the Netherlands), discipline (such as mathematics) or region.They would be based on existing, national digital repository infrastructures and would act as a catalyst to further deployment, as well as exploring common issues. Such testbeds would demonstrate the concept of the ‘knowledge infrastructure’ within the European context.The projects DILIGENT, DRIVER and EURO-VO-DCA are currently performing this pathfinding role (see box).
Geschäftsführer der Datenflut
Eines der Hauptprobleme von Wissenschaftlern heute konfrontiert ist, dass sie ertrinken in Daten. Als wissenschaftliche Probleme komplizierter geworden, und die Modelle und Instrumente, die sie verwenden, um sie studieren werden immer komplexer, so dass die Menge an Daten wächst rapide - in einigen Fällen bei exponentiellen rates. This Explosion in wissenschaftlichen Daten schafft neue Herausforderungen, wie die Daten gespeichert, abgerufen, ausgewertet und manipuliert werden.
Diese Problematik hat man beim
Kredit ohne Schufa nicht. Beim Kredit ohne Schufa brauchen keine
gespeicherten Daten abgefragt werden.
Dies ist nicht nur ein Problem für die Wissenschaftler. Angesichts der Bedeutung der Forschung in Wissenschaft und Engineering zur Innovation, unsere Fähigkeit, Antworten auf diese Fragen finden die direkte Auswirkungen auf die Wettbewerbsfähigkeit Europas. Daher wissenschaftlichen digitalen Repositories sind von wachsender strategischer Bedeutung für Europa seine Ziele im Rahmen der i2010-Strategie zum Aufbau einer einheitlichen europäischen Informationsraum. Europa hat die Chance, in der vordersten Linie der internationalen Entwicklungen in diesem Bereich sein.
Des wissenschaftlichen Prozesses und die Rolle der digitalen Repositories
Die Erhebung der Daten und ihre Integrität, inhärent ist, die wissenschaftlichen Prozess. Der vollständige Zyklus der Wissenschaft gehört auch der Erwerb und die Messung der Rohdaten, die Entwicklung von Modellen und Technologien, um physikalische Phänomene, etc. Kontrolle in bestimmten Bereichen der Wissenschaft (z. B. Radio-Astronomie, Umwelt, Medizin), neue Technologien und Instrumente dienen als "Daten-Fabriken", in der Lage, unbegrenzte Mengen an Daten, die von den Forschern geteilt werden, die oft an verschiedenen Standorten müssen produzieren.
In den letzten Jahren stark in Europa investiert eInfrastructure - IKT-basierte Forschungsinfrastruktur - als Werkzeuge für die wissenschaftliche Zusam-tionen zu unterstützen. High-Speed-Kommunikationsnetze, verteilte Speicherung und gemeinsame Nutzung von Rechenressourcen und Datenverarbeitung ermöglichen es Wissenschaftlern, die volle wissenschaftliche Prozess in einem innovativen und effizienteren Entwicklung von eScience Gestaltung. Der in Europa hängt stark von der Verfügbarkeit dieser pan-europäischen Infrastrukturen angehen .
Was fehlt, ist aber wirksame Möglichkeiten des Teilens und der Weitergabe von Wissen. Wir müssen über das Netzwerk und Grid-Schichten, die bereits im Einsatz sind, Umzug in eine neue Daten-Layer innerhalb der Europäischen eInfrastructures. This erstellen kann nur durch eine kohärente Strategie zur Entwicklung der europäischen Digital Repositories angesprochen werden, Föderalisierung und bietet einen Mehrwert zu nationalen und Disziplin-basierten Repositories.
Common Building Zugang zu wissenschaftlichen Daten-Repositories in Europa
Zum Aufbau gemeinsamer Zugang zu den europäischen wissenschaftlichen Ergebnisse erfordert eine umfassende Reihe von Roadmaps für die technischen, rechtlichen und organisatorischen Bereichen, nationale Pläne und Benutzer.
Diese Planungen für die zukünftige europaweite Infrastruktur auch wertvolle Informationen auf nationaler und institutioneller Ebene. Der Großteil der Inhalte auf der institutionellen Ebene bezogen werden. Institutionen (Universitäten und Forschungsinstituten
und gerade hier ist es vorbei mit dem
Schulranzen tragen) in ganz Europa sollten ermutigt werden, einzurichten institutionelle Repositories und ihren Forschern und Autoren zu ermutigen, ihr Material zu hinterlegen. Internationale und fachspezifische Repositories müssen auch in einer Weise, die am besten dient den Bedürfnissen von Forschern integriert werden. Europa hat auch eine reiche Landschaft von nationaler Initiativen, die einen breiten Zugang zu wissenschaftlichen repositories.
DieAnnahme des Metadaten-Standards fördern wird, sollte auf allen Ebenen gefördert werden.
In der kurz-bis mittelfristig sollte Demonstrator / Testbed Projekten durchgeführt, um transnationale access.These könnten Themen wie Exzellenz-Adresse (wie Cream of Science nachweisen können, in den Niederlanden), Disziplin (z. B. Mathematik) oder region.
Sie würde auf bestehende Infrastrukturen nationalen digitalen Repository basieren und wäre als Katalysator für die weitere Entwicklung, sowie Sondierung gemeinsamer Probleme handeln. Solche Prüfstände würde das Konzept der "Wissens-Infrastruktur" im europäischen Kontext Projekte DILIGENT, Fahrer-und EURO-VO-DCA derzeit im Einsatz sind diese Wegfindung Rolle (siehe Kasten) zu demonstrieren.