Literaturflut - Informationslawine - Wissensexplosion
Wächst der Wissenschaft das Wissen über den Kopf?
Werner Marx und Gerhard Gramm (verfasst 1994, aktualisiert im Januar 2002)
Zentrale Informationsvermittlung der Chemisch-Physikalisch-Technischen Sektion der MPG
am Max-Planck-Institut für Festkörperforschung, Stuttgart
Scientific information has stopped growing exponentially as in the last 300 years. Nevertheless, the number of scientific papers published yearly remains dramatic. Well ordered databases and sophisticated search systems allow scientists to find the needle in the haystack. A growing number of factual databases as well as more reviews compress and refine information. Not searching but controlling and working up information appear to become the most important problems in the future.
Wissenschaftler aller Fachrichtungen leiden unter der Last einer Informationsflut, zu der sie mit jeder neuen Veröffentlichung selbst beitragen. Denn auf der ganzen Welt ist ein Millionenheer von Forschern damit beschäftigt, unsere Erkenntnis über die Gesetzmäßigkeiten in Natur und Gesellschaft zu erweitern. Das Produkt dieser Tätigkeit ist Information, die über den Weg der Fachzeitschriften und Fachbücher wieder in den Wissenschaftsprozess einfließt. Da das Internet meist kommerzielle Information und nur zu einem geringen Anteil wissenschaftliche Publikationen enthält, wird es hier ausgenommen. Das rapide Anwachsen des Informationsberges in den klassischen wissenschaftlichen Archiven wird seit den sechziger Jahren mit Schlagworten wie "Informationsflut" oder "Wissensexplosion" umschrieben. Handelt es sich dabei lediglich um Übertreibungen, oder ertrinkt die Wissenschaft tatsächlich in einem Meer von Fachinformation?
Fortschritt in der Wissenschaft vollzieht sich im Rahmen wissenschaftlicher Kommunikation und damit vor allem auf der Grundlage der Veröffentlichung von Forschungsergebnissen in Form von Fachliteratur. Die Publikationen innerhalb eines Fachgebietes stehen inhaltlich miteinander in Beziehung, indem jede neu hinzukommende Veröffentlichung im Grundsatz die früheren Veröffentlichungen zum gleichen Thema berücksichtigt und darauf aufbaut. Nach einer bestimmten Anzahl von Einzelbeiträgen zu einem Forschungsthema wird eine Zusammenfassung in Übersichtsartikeln und Lehrbüchern vorgenommen. Dabei erfolgt eine Bewertung und Synthese der Information, indem Fehler und Unklarheiten beseitigt werden und so ein tiefergehendes Verständnis erreicht wird. Durch diesen Prozess der Aufarbeitung wird Information in Wissen umgewandelt.
Wissen wird definiert als "...die auf Begründungen bezogene und strengen Überprüfungspostulaten unterzogene Kenntnis, institutionalisiert in den Wissenschaften." [1]. Es ist das, worüber sich die Fachleute einer Wissenschaftsdisziplin einig sind und das sie als wahr angenommen haben. Wissen setzt Nachvollziehbarkeit und damit den Wissenden voraus. Der Begriff der Information ist dagegen eng verwandt mit dem der Nachricht und wird als Bezeichnung für Daten gebraucht, vor allem wenn diese eine logische Einheit bilden. Eine Information ist gleichbedeutend mit einer Nachricht, welche für den Empfänger von Interesse ist. Die Informationstheorie betrachtet dagegen Information als ein rein physikalisches Phänomen und berücksichtigt weder den Inhalt einer Nachricht noch die Bedeutung des Empfängers. Eine derartige Betrachtungsweise ist in diesem Zusammenhang aber kaum von Bedeutung. Information und Wissen sind dementsprechend zwei Begriffe aus unterschiedlichen Kategorien. Wissen wird in Form von Information vermittelt und gespeichert, aber Information ist keine eigene Wissensform [2].
Das Wachstum der Wissenskugel
Ein wesentliches Charakteristikum des Wissens ist die ihm innewohnende Tendenz zur Vermehrung. Hubert Markl, der Präsident der Max-Planck-Gesellschaft (MPG), hat einmal das Wissen mit einer Kugel verglichen, die im All des Nichtwissens schwimmt und beständig größer wird. Mit ihrem Wachsen vergrößert sich ihre Oberfläche und mit dieser vermehren sich auch ihre Berührungspunkte mit dem Nichtwissen. Der Philosoph Jürgen Mittelstraß führt diese Analogie fort und spricht von der Möglichkeit einer optimistischen und einer pessimistischen Deutung: "Die pessimistische lautet: Wenn es der Radius der Kugel ist, der das Wissen repräsentiert, dann wächst bei Vergrößerung der Kugel die Oberfläche schneller als der Radius, nämlich mit der 2. Potenz. Also wächst das Nichtwissen schneller als das Wissen, oder, mit anderen Worten: Die Forschung produziert ein schnelleres Wachstum des Nichtwissens als des Wissens. In der optimistischen Deutung wäre es nicht der Radius, sondern das Volumen der Kugel, das das Wissen repräsentiert. Wenn die Kugel wächst, dann wächst ihr Volumen schneller als ihre Oberfläche, nämlich mit der 3. Potenz des Radius. In diesem Falle produzierte die Forschung zwar ebenfalls immer mehr Nichtwissen, aber das Wissen wüchse trotzdem schneller als das Nichtwissen." [3]. In jedem Falle geht also das Anwachsen des Wissens mit einem Anwachsen des Nichtwissens einher, statt es zu verringern.
Das Ziel der Wissenschaft ist Erkenntnisfortschritt und damit Wissenszuwachs. Die Vermehrung des Wissens gehört zu seinem Wesen und kann nicht gebremst werden, ohne Wissenschaft grundsätzlich in Frage zu stellen. Denn mit jedem gelösten wissenschaftlichen Problem entstehen neue Fragen, die wiederum auf eine Beantwortung warten. Der Wachstumsprozess des Wissens verläuft allerdings nicht stetig, sondern wird durch wissenschaftliche Revolutionen vorangetrieben. Dazwischen ist die Wissenschaft mit Aufräumarbeiten beschäftigt, d.h. mit Problemlösungen, die zwar das Wissenschaftsgebäude ergänzen und deshalb notwendig sind, aber keine wirklichen Innovationen darstellen. Nur die außergewöhnliche Forschung, nicht selten von wissenschaftlichen Grenzgängern betrieben, durchbricht manchmal die wohlgeordnete Abfolge von Fragen und Antworten und löst wissenschaftliche Revolutionen aus (Paradigmenwechsel). So jedenfalls sieht es der rennomierte Wissenschaftshistoriker Thomas S. Kuhn, der Anfang der sechziger Jahre eine anhaltende Diskussion zu diesem Thema auslöste [4]. Demnach wäre es aussichtslos, fundierte Prognosen darüber aufstellen zu wollen, was die Wissenschaft in Zukunft einmal alles wissen wird.
Die Quantifizierung des Wachstums
Die Quantifizierung menschlichen Wissens ist vielfach diskutiert worden, ohne dass ein wirklich befriedigender Maßstab dafür gefunden wurde. Wenn aber Wissen in Form von Information übertragen und gespeichert wird, geht das Wachstum des Wissens mit dem Wachstum der Information in Form von Fachliteratur einher und kann darüber abgeschätzt werden. Insbesondere in der Naturwissenschaft wird die Anzahl der Originalveröffentlichungen (Primärliteratur) in Fachzeitschriften und Fachbüchern denn auch häufig als Maß für die Vermehrung des Wissens herangezogen. Derek de Solla Price, der Begründer der Wissenschaft von der Wissenschaft, kommt zu dem Ergebnis, dass gemessen daran das Wissen seit Mitte des 17. Jahrhunderts mit einer Verdopplungszeit von ungefähr 15 Jahren exponentiell wächst [5]. Die Wissensexplosion ist dementsprechend kein neues Phänomen, sondern eine Situation, mit der die moderne Wissenschaft seit ihrer Entstehung konfrontiert ist. Für den einzelnen Wissenschaftler war das Wissen seiner Zeit stets zu groß, um auch nur in seinem Fachgebiet noch überschaubar zu sein. Das exponentielle Wachstum hat zur Folge, dass sich die Wissenschaft in hohem Maße in der Gegenwart konzentriert. Man schätzt, dass 80 bis 90 Prozent aller Wissenschaftler, die jemals gelebt haben, unsere Zeitgenossen sind. Damit wird auch der größte Teil aller jemals geleisteten wissenschaftlichen Tätigkeit in unserer Generation und vor unseren Augen geleistet. Dies gilt allerdings nicht nur für die Gegenwart, sondern hat auch für jeden vergangenen Zeitpunkt gegolten. Zu allen Zeiten konnten Wissenschaftler sagen, dass das Wissen sich in den letzten 10 bis 20 Jahren um soviel vermehrte, wie in der gesamten Zeit vorher.
Die Geschwindigkeit des Wachstums der wissenschaftlichen Information und die Informationsmenge, die gegenwärtig von der Wissenschaft verarbeitet werden muss, sind schwierig zu quantifizieren, lassen sich jedoch an Hand einiger Zahlen einigermaßen verdeutlichen:
Das exponentielle Wachstum der wissenschaftlichen Information und des Wissens mit seiner überraschenden Geschwindigkeit verläuft parallel zum Wachstum der Zahl der Wissenschaftler. Mitte des 17. Jahrhunderts gab es nur eine kleine Gruppe von wissenschaftlich gebildeten Personen. Von 1850 bis 1950 wuchs die Zahl der Menschen mit wissenschaftlich-technischer Ausbildung weltweit von schätzungsweise 1 Million auf 10 Millionen. Von 1950 bis zum Jahre 2000 rechnet man mit einem Anstieg von 10 auf 100 Millionen. Das Wachstum der Zahl der Wissenschaftler und der wissenschaftlichen Publikationen bestätigen, was bei einem exponentiellen Wachstum mit einer Verdopplungszeit von 15 Jahren über dreihundert Jahre zu erwarten ist: Eine Vermehrung ungefähr um den Faktor eine Million. Das Wachstum der wissenschaftlichen Information ist also im Grundsatz kein Prozess krankhafter Wucherung, sondern vielmehr ein ganz natürlicher Vorgang, bedingt durch ein entsprechendes Wachstum der Zahl der Wissenschaftler [6].
Der Wiener Wissenschaftshistoriker Franz Graf-Stuhlhofer unterscheidet zwischen dem Wachstum der wissenschaftlichen Information und dem Wachstum des Wissens. Er bezweifelt, dass das Wachstum wissenschaflicher Information in Form von Publikationen (oder auch der Anzahl bekannter chemischer Elemente, bekannter Pflanzen- und Tierarten oder astronomischer Objekte usw.) ein gutes Maß für die Wachstumsgeschwindigkeit des Wissens darstellt. Die Ursache für den exponentiellen Verlauf sieht er in einer Art positiven Rückkopplung, bedingt durch das Aufwerfen immer neuer Fragen sowie den Austausch der Einzeldisziplinen untereinander und der Wissenschaft mit Technik und Medizin. Auf Basis der Zunahme des Umfanges von Lehrbüchern, der Anzahl berühmter Naturforscher und wichtiger Entdeckungen zwischen 1500 und 1900 stellt er die These auf, dass sich unser Wissen nur ungefähr alle einhundert Jahre verdoppelt [7,8].
Wachstumsgrenzen auch beim Wissen
Exponentielles Wachstum bedeutet, dass die Wachstumsrate proportional der schon erreichten Größe ist. Je umfangreicher das Wissen geworden ist, desto schneller wächst es weiter. Das Wachstum beschleunigt sich durch Selbstverstärkung. Aber grenzenloses Wachstum kann es auch bei der Wissenschaft nicht geben. Wenn man sich die begrenzten finanziellen Mittel (die Kosten pro Wissenschaftler haben sich in der Vergangenheit ungefähr alle zehn Jahre verdoppelt) und den nicht beliebig vermehrbaren Anteil der Wissenschaftler an der Gesamtbevölkerung vor Augen hält, dann ist völlig offensichtlich, dass das exponentielle Wachstum der Wissenschaft nicht noch mehrere Verdopplungsperioden anhalten kann. Für begrenzte Systeme wie bei Wachstumsprozessen in der Natur (z.B. bei Tierpopulationen) oder in Wirtschaft und Gesellschaft (z.B. bei der Rohstoffproduktion) gilt vielmehr die sogenannte logistische Funktion, die besagt, dass das Wachstum proportional ist der jeweils schon vorhandenen Menge und dem Abstand vom Sättigungswert. Der erste Term bedingt den exponentiellen Anstieg und der zweite einen S-förmigen Übergang in Richtung eines Grenzwertes, der nicht überschritten wird. Bereits Anfang der sechziger Jahre wies de Solla Price darauf hin, dass dies auch für das Wachstum der Wissenschaft zu erwarten ist. Er nahm an, dass zwei bis drei Verdopplungsperioden nach Abweichung vom exponentiellen Verhalten ein Wendepunkt eintritt und nach nochmals dem gleichen Zeitintervall eine Sättigungsgrenze erreicht ist. Denn eine Vermehrung um weitere zwei Größenordnungen würde geradezu absurde Zustände herbeiführen: "Wir hätten zwei Wissenschaftler pro Mann, Frau, Kind und Hund der Bevölkerung und müßten doppelt so viel Geld ausgeben, als wir besäßen." [5].
Im Bereich der naturwissenschaftlichen Kerndisziplinen zeichnet sich seit Anfang der siebziger Jahre eine deutliche Abweichung vom exponentiellen Wachstum ab. Die Anzahl der von den großen Referatezeitschriften bzw. den entsprechenden Datenbanken wie Chemical Abstracts, Physical Abstracts und Biological Abstracts jährlich erfassten Fachveröffentlichungen zeigen keinen exponentiellen Anstieg mehr. Auch der jährliche Zuwachs der in Ulrich's International Periodicals Directory erfassten wissenschaftlichen Zeitschriften ist nach einem Maximum im Jahre 1971 deutlich gefallen, und zwar auf den Stand von 1947 [9]. Beides zusammen deutet darauf hin, dass die Wissenschaft nach einer Anfangsphase mit überschwenglichem Wachstum erstmals eine Wachstumsgrenze spürt, die eine Abschwächung zur Folge hat. Dies schließt jedoch nicht aus, dass einzelne besonders aktuelle Forschungsgebiete wie Gentechnik oder Mikroelektronik nach wie vor exponentiell wachsen. Mit dem Verlust ihres traditionellen exponentiellen Wachstums ist die Wissenschaft in eine neue Phase der Entwicklung eingetreten, die durch weitgehende Ausschöpfung der finanziellen und personellen Ressourcen bestimmt wird.
Alterung und Halbwertszeit
Die Bedeutung einer bestimmten wissenschaftlichen Information für den aktuellen Forschungsprozess bleibt nicht für alle Zeiten gleich groß. Neue Erkenntnisse fließen nach ihrer Veröffentlichung in umfassendere Einsichten ein, so dass sich ihre Bedeutung für die momentane Forschung zugunsten einer historischen Bedeutung verringert. Dies bedeutet, dass Primärliteratur nach einer gewissen Zeit so vollständig in spätere Veröffentlichungen eingearbeitet (oder vergessen) wurde, dass darauf immer seltener zurückgegriffen wird. Außerdem ersetzen bessere experimentelle Methoden viele ältere Messergebnisse. Man spricht in diesem Zusammenhang auch vom Altern der Information und deutet damit an, dass wissenschaftliche Information einem Bedeutungswandel unterliegt.
Da eine Auslagerung von veralteter Information (außer beim Internet) nicht stattfindet, wächst die Informationsmenge in dem Maße, in dem neue Information hinzukommt. Veraltete Information wird zwar seltener in Anspruch genommen, verbleibt aber grundsätzlich in den wissenschaftlichen Archiven. Wissenschaftler sind deshalb nicht nur mit der Flut der im Wissenschaftsprozess aktuell entstehenden Information konfrontiert, sondern stehen auch vor einem über Jahrzehnte angesammelten und rapide anwachsenden Informationsberg, auf den sie immer wieder zurückgreifen müssen. Die Forscher erlebten zwar in der Vergangenheit immer die selbe Wachstumsgeschwindigkeit der wissenschaftlichen Information, aber die Archive der Wissenschaft haben sich inzwischen dramatisch vergrößert.
In Analogie zum radioktiven Zerfall führte J.D. Bernal Ende der fünfziger Jahre den Begriff "Halbwertszeit" zur Charakterisierung der Altersverteilung der zu einem bestimmten Zeitpunkt in Gebrauch befindlichen wissenschaftlichen Literatur ein. Kurz danach definierten R.E. Burton und R.W. Kebler die Halbwertszeit wissenschaftlicher Publikationen als die Zeit, nach der die Hälfte der Publikationen nicht mehr nachgefragt wird. Doch dabei besteht die Schwierigkeit, dass man den Zeitpunkt, ab dem eine Publikation nicht mehr gebraucht wird, nie genau kennt. Von Halbwertszeit spricht man immer dann, wenn eine Wahrscheinlichkeitsaussage über gleichartige Einheiten gemacht wird. Dies trifft streng genommen nicht auf Publikationen zu, da diese durchaus Individualität zeigen. Die Analogie ist auch für die ältere Literatur fragwürdig, da diese stärker genutzt wird, als ein exponentielles Abklingen erwarten lässt. Der Begriff "Halbwertszeit" wird deshalb nachfolgend im übertragenen Sinne gebraucht.
Die im Journal Citation Repots (JCR) des amerikanischen Institute for Scientific Information (ISI) gebrauchten Begriffe Citing Half-Life und Cited Half-Life machen eine statistische Aussage über das Alter der Referenzen (Literaturverweise) bzw. der Zitierungen von Arbeiten einzelner Zeitschriften durch andere Arbeiten. Sie entsprechen der Anzahl Jahre von einem bestimmten Jahr rückwärts, aus denen 50% aller in den Arbeiten einer Zeitschrift des betreffenden Jahres aufgeführten Referenzen (Citing Half-Life) bzw. 50% aller im betreffenden Jahr insgesamt zitierten Arbeiten dieser Zeitschrift (Cited Half-Life) stammen. Die Citing Half-Life ist auf die Arbeiten einer Zeitschrift bezogen aktiv, die Cited Half-Life dagegen passiv. Die Citing Half-Life macht demnach eine Aussage über das Zitierverhalten der Autoren einer Zeitschrift und spiegelt deren Auswahlverhalten wider. Die Cited Half-Life informiert dagegen über die Zitierungen von Arbeiten einer Zeitschrift durch andere Arbeiten und gibt wieder, wie lange man sich an diese Arbeiten erinnert. Es ist der gleiche Unterschied, wie zwischen zitierenden (citing) und zitierten (cited) Arbeiten, wobei ein und die selbe Arbeit zu beiden Kategorien gehören kann.
Einer der Autoren (Werner Marx) ermittelte die Altersverteilungen der Referenzen in und der Zitierungen von allen Arbeiten der Max-Planck-Gesellschaft. Die beiden Methoden messen neben dem eigentlichen Altern auch den Effekt des Literaturwachstums. Dementsprechend sollte das alleine durch nachlassendes Interesse bedingte Altern langsamer sein, als es der Verteilung der Referenzen bzw. Zitierungen entspricht. Wenn man nun im Hinblick auf den Wachstumseffekt der Literatur korrigiert, ergibt sich beispielweise für 1999 eine Citing Half-Life (Verteilung der Referenzen der MPG-Arbeiten auf deren Publikationsjahre) von circa 7 Jahren. Zwanzig Jahre früher (1979) war die Citing Half-Life mit ungefähr 6 Jahren deutlich niedriger und nicht höher als in der Gegenwart. Die vielfach vermutete Verringerung der Halbwertszeit wissenschaftlicher Literatur kann dementsprechend zumindest für MPG-Arbeiten nicht bestätigt werden. Auch die (wachstumskorrigierte) Cited Half-Life (Verteilung der von anderen Arbeiten zitierten MPG-Arbeiten auf deren Publikationsjahre) liegt für 1999 mit rund 7 Jahren ungefähr in gleicher Höhe wie die Citing Half-Life. Man muss allerdings berücksichtigen, dass hier jeweils über eine Vielzahl von Fachdisziplinen gemittelt wurde.
Dies alles bedeutet jedoch keineswegs, dass ältere Arbeiten mehr oder weniger vergessen wären. Denn einzelne Arbeiten können auch noch lange nach ihrer Publikation eine andauernde oder sogar eine wieder steigende Resonanz in Form von Zitierungen erfahren (delayed recognition). Zur Untersuchung der Resonanz lange nach ihrer Publikation wurden pauschal die MPG-Arbeiten aus dem Jahre 1975 herangezogen. Von diesen wurden bis zur Gegenwart 77% mindestens ein mal zitiert. Im Zeitraum von 1995 bis zur Gegenwart wurden immerhin noch 39% zitiert. Bezogen auf die überhaupt zitierten MPG-Arbeiten von 1975 sind das rund 50%, an die man sich nach mehr als zwei Jahrzehnten noch erinnert. Dieser Langzeiteffekt ist angesichts der Kurzlebigkeit anderer Dinge in der heutigen Welt für die Wissenschaftler sehr erfreulich.
Die Messung der Qualität
"Eine der Krankheiten dieses Jahrhunderts ist die Überzahl an Büchern; so überladen ist die Welt von ihnen, daß es unmöglich ist, den Wust an unnützem Zeug zu verdauen, der täglich ausgebrütet und in die Welt geworfen wird." So äußerte sich ein englischer Gelehrter namens Barnaby Rich schon im Jahre 1613, ein halbes Jahrhundert vor Herausgabe der ersten wissenschaftlichen Zeitschrift (zitiert nach [5]). Vor dem Hintergrund der atemberaubenden Vermehrung wissenschaftlicher Information ist es naheliegend zu fragen, wie hoch denn der Anteil der wirklich wertvollen Information ist bzw. wieviel Information als nutzloser Ballast in die Archive einfließt. Eine Reihe von statistischen Untersuchungen deutet darauf hin, dass nur ein vergleichsweise kleiner Anteil an Fachliteratur zur Weiterentwicklung der Wissenschaft beiträgt: Bei der Library of Congress in Washington mit 14 Millionen Büchern (1987) wurde mehr als die Hälfte niemals ausgeliehen. Bei der British Lending Library mit 45.000 abonnierten Zeitschriften (1987) werden 70 Prozent selten oder niemals verlangt, während 80 Prozent aller Ausleihen nur einen Kern von 5000 Zeitschriften betreffen [10].
Ein weitgehend akzeptierter Maßstab für die Beurteilung der Bedeutung und des Wertes einer Fachveröffentlichung ist die Häufigkeit, mit der eine Veröffentlichung von anderen Autoren zitiert wurde (d.h. als Literaturverweis im Literaturverzeichnis einer Veröffentlichung aufgeführt ist). Grundlage für die Ermittlung der Zitierungen von Publikationen im Bereich der Naturwissenschaften ist der vom Institute for Scientific Information (ISI) hergestellte Science Citation Index (SCI). Die Anzahl der Zitierungen ist zunächst einmal ein Maß für die (dokumentierte) Resonanz bzw. die Wirkung (Impact), die eine Publikation unter den Fachkollegen hervorgerufen hat. Eine starke Wirkung ist, zumindest über einen längeren Zeitraum betrachtet, zwar eine notwendige, aber noch keine hinreichende Voraussetzung dafür, dass z.B. eine Arbeit als Pionierarbeit angesehen werden kann. Es sollte immer unterschieden werden zwischen Resonanz oder Wirkung einerseits und Bedeutung oder Qualität andererseits. Letztere Begriffe sind wesentlich durch Interessen und Wertvorstellungen geprägt und desshalb nicht objektiv und quantitativ messbar. Eine Publikation, die häufig zitiert wurde, ist jedoch in vielen Fällen wegen ihrer fachlichen Bedeutung von anderen Wissenschaftlern in deren Arbeit berücksichtigt worden und hat dementsprechend einen hohen Stellenwert. Auch wenn diese Bewertungsmethode grob ist, da die Zitierungsgewohnheiten der Wissenschaftler durch eine Reihe weiterer Motive bestimmt sein können, so liefert sie doch einige interessante Zahlen zum Bedeutungsspektrum wissenschaftlicher Information:
Die Zitierungen eines größeren Ensembles von Publikationen (Wissenschaftler, Fachgebiet, Forschungsinstitut, Zeitschrift usw.) verteilen sich entsprechend einer allgemeinen Gesetzmäßigkeit (Pareto-Verteilung, Bradfords Gesetz, Zipfs Gesetzt) sehr ungleichmäßig. Die Verteilung entspricht nicht einer Gauß-Verteilung mit ausgeprägtem Maximum um den Mittelwert, sondern ist höchst unsymmetrisch: Die meisten Publikationen werden nur wenige Male zitiert (z.B. 1-10 mal) und nur ganz wenige werden häufiger zitiert (z.B. 100-1000 mal). Eine solch unsymmetrische Verteilung nennt man auch Pareto-Verteilung. Fast 50 Prozent aller vom Science Citation Index (SCI) erfassten Veröffentlichungen (derzeit aus einem Kernsatz von rund 5.700 Zeitschriften) aus dem Zeitraum 1981-1985 wurden im Zeitraum von 5 Jahren nach ihrem Erscheinen kein einziges Mal von anderen Autoren zitiert. Der Anteil der mehr als einmal zitierten Veröffentlichungen wurde auf 20 Prozent abgeschätzt. Dazu muss einschränkend bemerkt werden, dass 1/4 der erfassten Veröffentlichungen Kurzmitteilungen sind, die in der Regel nicht zitiert werden. Für den Bereich der Naturwissenschaften allein und bei Nichtberücksichtigung der Kurzmitteilungen beträgt der Anteil der nicht zitierten Veröffentlichungen immerhin noch 22 Prozent (aus einer Zitierungsanalyse der Veröffentlichungen in 1984 und deren Zitierungen bis Ende 1988) [11,12].
Wie die veraltete Information, so verbleibt auch die weniger bedeutungsvolle Information in den Archiven der Wissenschaft. Denn zwischen aktueller und veralteter oder zwischen wertvoller und wertloser Information gibt es keine klare Abgrenzung. Außerdem wird die Bedeutung einer Veröffentlichung nicht immer sofort, sondern manchmal erst nach vielen Jahren oder gar Jahrzehnten erkannt. Auch wenn prinzipiell ein großer Teil der für die Fortentwicklung der Wissenschaften wesentlichen Information in verhältnismäßig wenigen Publikationen konzentriert ist, so kann die weniger innovative Literatur nicht ohne weiteres als solche erkannt und einfach beiseite gelassen werden. Die Wissenschaft muss wohl auch in Zukunft damit leben.
Wissenschaftliche Zeitschriften haben seit ihrer Entstehung nicht nur die Funktion eines Kommunikationsmittels, sondern dienen dazu, Ansprüche auf wissenschaftliches Eigentum geltend zu machen. Vor allem deshalb haben Wissenschaftler seit jeher einen starken Drang zum Veröffentlichen. Einige Wissenschaftler veröffentlichen Serien von nacheinander erscheinenden Publikationen zum gleichen Thema, statt die Arbeit bis zu einem gewissen Abschluss reifen zu lassen und dann die Ergebnisse in zusammenhängender Form in einer einzigen Veröffentlichung zu publizieren. Auch die große Zahl von Kurzmitteilungen trägt zur Literaturflut bei. Hierbei handelt es sich um Veröffentlichungen, bei denen in knapper Form vorläufige Ergebnisse publiziert werden, um die wissenschaftliche Priorität zu sichern. Die Veröffentlichung in Serien und die vielen Kuzmitteilungen sind allerdings kein Phänomen der jüngsten Zeit, sondern wurden schon in den zwanziger Jahren kritisiert. Derartige Missstände sind nicht die eigentliche Ursache der gegenwärtigen Literaturvermehrung, sondern verschärfen lediglich das Problem.
In der Wissenschaft wird die Publikationswürdigkeit von Zeitschriften-Manuskripten von erfahrenen Fachkollegen (Peers) beurteilt. Diese "Wächter der Wissenschaft" sollen im Rahmen des sogenannten Peer-Review-Verfahrens die Qualität der Forschung gewährleisten. Dabei besteht die Gefahr, dass Gutachter die Bedeutung einer wissenschaftlichen Arbeit nicht erkennen oder sachfremde Einflüsse in die Beurteilung von Personen bzw. deren Arbeiten einfließen und damit eine objektive Bewertung beeinträchtigen. Gutachtergremien setzen sich außerdem meist nur aus wenigen Experten zusammen, was die Gefahr der Subjektivität noch erhöht. Aus diesen Gründen greift man im Falle der Beurteilung von Publikationen gerne auch auf deren Wirkung in Form von Zitierungen als weiteren Indikator zurück. Die Gutachterverfahren wissenschaftlicher Zeitschriften könnten einer Reform unterworfen werden, die auf eine Reduzierung der Zahl der Veröffentlichungen abzielt. Die Beurteilungskriterien bezüglich Veröffentlichungswürdigkeit müssten dazu verschärft und vereinheitlicht werden. Eine wesentliche Reduzierung des Wachstums der Fachliteratur ist damit jedoch vermutlich nicht zu erreichen. Allenfalls eine zunehmende Bewertung über Zitierungen statt über die Menge der Publikationen könnte die Wissenschaftler dazu veranlassen, weniger zu veröffentlichen. Die oft gebrauchte Bemessungsgröße "Zitierungen pro Publikation" steigt, wenn weniger Publikationen veröffentlicht und diese dann häufiger zitiert werden.
Der Nutzen von Datenbanken
Zu Anfang der naturwissenschaftlichen Forschung wurden Informationen noch überwiegend durch Briefe oder persönliche Unterredungen ausgetauscht. Die zunehmende Publikation von Forschungsergebnissen in Fachzeitschriften ab Mitte des 17. Jahrhunderts war eine erste Reaktion auf die gewachsenen Schwierigkeiten bei der Informationsbewältigung. Als um die Mitte des 19. Jahrhunderts die Anzahl der Fachzeitschriften stark zugenommen hatte und für den einzelnen Forscher die Übersicht verlorenging, bestand die Reaktion in der Gründung von Referatezeitschriften. Diese enthalten neben den Quellenangaben nur noch die Kurzfassungen der Veröffentlichungen und machen diese über Register zugänglich. In den sechziger Jahren dieses Jahrhunderts wurden zur Erstellung der gedruckten Register von Referatezeitschriften erstmals Computer eingesetzt. Dies war der erste Schritt zur elektronischen Archivierung wissenschaftlicher Information in Form von Datenbanken, die in den siebziger Jahren allgemein zugänglich wurden.
Datenbanken verringern nicht die Literaturflut, sondern bewirken zunächst einmal eher das Gegenteil. Denn aus der Menge der insgesamt angesammelten Information ist für den einzelnen Wissenschaftler vor allem der Anteil von Bedeutung, der ihm zugänglich ist. Dieser wird aber nicht nur vom Wachstum und Umfang der Information allein bestimmt, sondern auch von deren Verteilung. Datenbanken erleichtern den Zugriff und fördern einen gewissen Anteil Literatur zutage, der früher nicht aufgefunden werden konnte und deshalb ignoriert wurde. Die Informationslawine der jüngsten Vergangenheit ist damit ein Phänomen, das sowohl im eigentlichen Wachstum der Information als auch in einem zunehmend effektiveren und umfassenderen Zugriff und damit einer besseren Verteilung begründet liegt [13].
Die Nutzung von Datenbanken bedeutet aber andererseits für die Wissenschaftler, dass sie viel schneller, gezielter und umfassender als bisher auf Fachinformation zugreifen können. Sie sind damit in der Lage, eine erheblich größere Informationsmenge als früher zu kontrollieren. Bei der Suche nach einer einzelnen chemischen Verbindung beispielsweise ist es nun unerheblich, ob diese aus einer Menge von einigen Tausend oder einigen Millionen Verbindungen herausgesucht werden muss. Datenbanken eröffnen Suchmöglichkeiten, die mit gedruckten Werken grundsätzlich nicht möglich sind: Die komplexe Verknüpfung von Suchbegriffen erlaubt es, auch komplizierte Zusammenhänge in einer Recherche zu berücksichtigen. Die Struktursuchsysteme der chemiebezogenen Datenbanken ermöglichen die Suche mit Strukturformeln, was für die Chemiker von besonders hohem Nutzen ist. Die wachsende Größe von Datensammlungen bedingt aber auch eine zunehmende Komplexität der Datenbanken und Suchsysteme, die den mit der Menge ansteigenden Bedarf an Ordnung widerspiegelt. Mit der Erstellung einer umfassenden Informationsbasis und effektiven Suchsystemen hört jedoch der Nutzen moderner Informationstechnik weitgehend auf.
Gedruckte Referatezeitschriften wie auch die entsprechenden Datenbanken arbeiten die Primärliteratur im Hinblick auf effektive Suchmöglichkeiten auf (Indexierung), nehmen aber keine inhaltliche Bewertung vor. Anders die Handbücher in Chemie und Physik wie Beilstein oder Gmelin bzw. die entsprechenden Online-Datenbanken. Diese Datensammlungen werden durch eine kritische Bewertung und Zusammenfassung der Originalliteratur erstellt. Es erfolgt eine Extraktion der "harten Fakten", d.h. der chemischen und physikalischen Messwerte, was eine starke Konzentration und Reduktion beinhaltet. Die "weichen" Daten wie Kommentare und Erklärungen der Autoren werden beiseite gelassen. Außerdem werden die Veröffentlichungen mit falschen oder unbrauchbaren Messergebnissen eliminiert, was einer Informationsveredelung gleichkommt. Im Zeitraum von 1975 bis 1988 ist die Zahl der Faktendatenbanken im Verhältnis zu den Referenzdatenbanken von 13 Prozent auf über 50 Prozent angestiegen [14]. Dieser Trend ist sicher nicht zuletzt auch vor dem Hintergrund der Bewältigung der Informationsflut zu sehen.
Daneben wird in Zukunft noch eine andere Form der Komprimierung von Primärliteratur eine wachsende Bedeutung erhalten. Dies ist die Einarbeitung in Übersichtsartikel (Reviews), bei der ein kompetenter Autor den Stand der Kenntnis in seinem Arbeitsgebiet zusammenfasst und damit den Einstieg und die Übersicht für andere Wissenschaftler erheblich erleichtert [15]. Die Zusammenfassung beinhaltet eine Bewertung der Primärliteratur zwecks Informationssynthese, was mit einer starken Verdichtung der Information verbunden ist. In der Datenbank Chemical Abstracts beispielsweise ist der Anteil von Reviews von 4,5 Prozent im Jahre 1967 auf 8,5 Prozent im Jahre 1997 angestiegen. Auch die derzeit hohe Zuwachsrate von Review-Zeitschriften dokumentiert eine verstärkte Review-Aktivität in der Wissenschaft, die vor allem als eine Reaktion auf die Flut von Fachliteratur angesehen werden muss.
Probleme bei der Verarbeitung
"Wenn man gar nicht mehr übersehen kann, was geschaffen wird, so wird allmählich die chemische Literatur zu einem Zahlenfriedhof." Dies schrieb der Chemiker Carl Oppenheimer im Jahre 1927 in einem Aufsatz mit dem Titel "Die papierne Sintflut" [16]. Auch wenn es Oppenheimer primär um Möglichkeiten der Eindämmung ging, so ist hier doch auch der Gesichtspunkt der Verarbeitung angesprochen. Ein Forscher, der sein Spezialgebiet beherrschen will, muss sich durch eine zunehmend größere Informationsmenge hindurcharbeiten, bis er an der Grenze zum Nichtwissen angelangt ist. Heute bleibt einem Wissenschaftler, der versucht, alle auf seinem Fachgebiet erscheinenden Veröffentlichungen zu lesen, kaum mehr Zeit für die eigentliche Forschung. Wenn er sich andererseits nicht oder nur unzureichend informiert, besteht die Gefahr, dass er umsonst arbeitet, weil andere sein Forschungsthema bereits bearbeitet haben. Dieses Dilemma wird sich in Zukunft eher noch verschärfen.
Fachinformation muss aber nicht nur gesucht und zur Kenntnis genommen, sondern auch zielgerichtet in ein immer komplexer werdendes Wissensgefüge eingearbeitet werden. Zu den Problemen des Auffindens und Lesens kommt das Problem der Aufarbeitung. Hier könnte die begrenzte Verarbeitungskapazität des menschlichen Gehirns eine unüberwindliche Grenze darstellen, der man sich immer mehr nähert [17]. Das angesammelte Wissen würde dann seiner eigenen Vermehrung zunehmend im Wege stehen und diese hemmen. Diese Befürchtung ist jedoch nicht neu. Schon Immanuel Kant erkannte dieses Problem, indem er treffend bemerkte: "Die wissenschaftlichen Dinge häufen sich in unseren Zeiten. Bald wird unsere Fähigkeit zu schwach und unsere Lebenszeit zu kurz, nur den nützlichsten Teil daraus zu erfassen." (zitiert nach [18]).
Um die Fachgebiete der Wissenschaft einigermaßen überschaubar zu halten, sind diese durch Abspaltung von Teilbereichen immer wieder verkleinert worden. Der Wissenschaftler wurde zum Spezialisten, der sich nur noch in seinem engen Arbeitsgebiet umfassend auskennt. Die Wissenschaft insgesamt ist durch diese Fragmentierung zunehmend unüberschaubarer geworden. Die Herausbildung immer engerer Fachgebiete ist begleitet von einer zunehmenden Spezialisierung in der Fachsprache. Dadurch werden die Veröffentlichungstexte für die Wissenschaftler in den Nachbardisziplinen immer schwieriger verständlich, was die Kommunikationsbarrieren erhöht und weiterer Fragmentierung Vorschub leistet. In den siebziger Jahren ist eine neue Forschungsdisziplin entstanden, die sich mit komplexen Systemen beschäftigt und unter dem Schlagwort Chaos-Forschung in die Wissenschaft eingegangen ist. Die Chaos-Forschung ist stark interdisziplinär orientiert und hat die gesamte Naturwissenschaft revolutioniert. Sie hat viele Wissenselemente wieder miteinander in Zusammenhang gebracht und damit dem Trend zur Spezialisierung entgegengewirkt. Das Problem der Unüberschaubarkeit des Wissens wurde damit ein wenig entschärft. Es bleibt abzuwarten, ob sich diese Entwicklung in Zukunft weiter fortsetzt.
Bei der Verarbeitung wissenschaftlicher Information geht es aber nicht nur um die Kenntnisnahme von Forschungsergebnissen. Es genügt nicht, Informationen zu besitzen, man muss sie auch beherrschen können. Es besteht die Gefahr eines Missverhältnisses zwischen erarbeitetem und verarbeitetem Wissen. Mittelstraß spricht von der zunehmenden Kluft zwischen Verfügungs- und Orientierungswissen: "Nicht daß das Wissen wächst und unübersehbar wird, ist das Beunruhigende, sondern unsere immer evidenter werdende Unfähigkeit, mit diesem Wissen vernünftig umzugehen. Dem Wachstum eines Verfügungswissens, d.h. eines positiven Wissens um Ursachen, Wirkungen und Mittel, korrespondiert der gefährliche Stillstand eines Orientierungswissens, d.h. eines Wissens um begründete Zwecke und Ziele." [3]. Denn Wissenschaft wird nicht als Selbstzweck betrieben, sondern sie hat auch die konkrete Aufgabe, der Gesellschaft bei der Lösung ihrer Probleme zu helfen. Dazu bedarf es der Fähigkeit, Wissen und Probleme miteinander in Zusammenhang zu bringen. Dies lässt sich aber nicht erlernen, sondern erwächst aus Berurteilungsvermögen und gesellschaftlicher Verantwortung, die zwar auf dem Wissen aufbauen, aber doch weit darüber hinausreichen.
Das Ende des exponentiellen Wachstums der wissenschaftlichen Information und die Entwicklung moderner Informationssysteme lassen hoffen, dass das Wissen der Wissenschaft nicht über den Kopf wächst. Das immer noch bedrohliche Anwachsen des Informationsberges der wissenschaftlichen Archive wird weitere Maßnahmen zur Eindämmung, Komprimierung und Ordnung erzwingen. Es bleibt abzuwarten, ob die Beherrschung und Verarbeitung des wachsenden Wissens zukünftigen Generationen gelingt oder sie schließlich überfordert. Ob die Wissenschaft die richtigen Antworten auf die sich abzeichnenden großen Probleme der Zukunft bereithält und deren Lösung ermöglicht, ist eine ganz andere Frage.
Literaturhinweise: