Archiv der Kategorie: Möglichkeit

chatGPT – Wie besoffen muss man sein?

Journal: Philosophie Jetzt – Menschenbild
ISSN 2365-5062, 13.Februar 2023 – 17.April 2023
URL: cognitiveagent.org, Email: info@cognitiveagent.org
Autor: Gerd Doeben-Henisch (cagent@cognitiveagent.org)

Kontext

Beitrag ansehen

Seit der Freigabe des chatbots ‚chatGPT‘ für die größere Öffentlichkeit geht eine Art ‚Erdbeben‘ durch die Medien, weltweit, in vielen Bereichen, vom Privatpersonen über Institutionen, Firmen, Behörden …. jeder sucht das ‚chatGPT Erlebnis‘. Diese Reaktionen sind erstaunlich, und erschreckend zugleich.

Anmerkung: In meinem Englischen Blog hatte ich nach einigen Experimenten mit chatGPT eine erste Reflexion über den möglichen Nutzen von chatGPT geschrieben. Mir hatte es für ein erstes Verständnis geholfen; dieses hat sich dann bis zu dem Punkt weiterentwickelt, der im vorliegenden Text zum Ausdruck kommt.[6]

Form

Die folgenden Zeilen bilden nur eine kurze Notiz, da es sich kaum lohnt, ein ‚Oberflächenphänomen‘ so intensiv zu diskutieren, wo doch die ‚Tiefenstrukturen‘ erklärt werden sollten. Irgendwie scheinen die ‚Strukturen hinter chatGPT‘ aber kaum jemanden zu interessieren (Gemeint sind nicht die Details des Quellcodes in den Algortihmen).

chatGPT als Objekt

Der chatbot mit Namen ‚chatGPT‘ ist ein Stück Software, ein Algorithmus, der (i) von Menschen erfunden und programmiert wurde. Wenn (ii) Menschen ihm Fragen stellen, dann (iii) sucht er in der ihm bekannten Datenbank von Dokumenten, die wiederum Menschen erstellt haben, (iv) nach Textmustern, die nach bestimmten formalen Kriterien (z.T. von den Programmierern vorgegeben) einen Bezug zur Frage aufweisen. Diese ‚Textfunde‘ werden (v) ebenfalls nach bestimmten formalen Kriterien (z.T. von den Programmierern vorgegeben) in einen neuen Text ‚angeordnet‘, der (vi) jenen Textmustern nahe kommen soll, die ein menschlicher Leser ‚gewohnt‘ ist, als ’sinnvoll‘ zu akzeptieren.

Textoberfläche – Textbedeutung – Wahrheitsfähig

Ein normaler Mensch kann — mindestens ‚intuitiv‘ — unterscheiden zwischen den (i) ‚Zeichenketten‘, die als ‚Ausdrücke einer Sprache‘ benutzt werden, und jenen (ii) ‚Wissenselementen‘ (im Kopf des Hörer-Sprechers), die als solche ‚unabhängig‘ sind von den Sprachelementen, aber die (iii) von Sprechern-Hörer einer Sprache ‚frei assoziiert‘ werden können, so dass die korrelierten ‚Wissenselemente zu dem werden, was man gewöhnlich die ‚Bedeutung‘ der Sprachelemente nennt.[1] Von diesen Wissenselementen (iv) ‚weiß‘ jeder Sprachteilnehmer schon ‚vorsprachlich‘, als lernendes Kind [2], dass einige dieser Wissenselemente unter bestimmten Umständen mit Umständen der Alltagswelt ‚korrelierbar‘ sind. Und der normale Sprachbenutzer verfügt auch ‚intuitiv‘ (automatisch, unbewusst) über die Fähigkeit, solche Korrelation — im Lichte des verfügbaren Wissens — einzuschätzen als (v) ‚möglich‘ oder (vi) als eher ‚unwahrscheinlich‘ bzw. (vi) als ‚bloße Fantasterei‘.[3]

Die grundlegende Fähigkeit eines Menschen, eine ‚Korrelation‘ von Bedeutungen mit (intersubjektiven) Umweltgegebenheiten feststellen zu können, nennen — zumindest einige — Philosophen ‚Wahrheitsfähigkeit‘ und im Vollzug der Wahrheitsfähigkeit spricht man dann auch von ‚zutreffenenden‘ sprachlichen Äußerungen oder von ‚wahren (empirischen) Aussagen‘.[5]

Unterscheidungen wie ‚zutreffend‘ (‚wahr‘), ‚möglicherweise zutreffend‘, ‚eher nicht zutreffend‘ oder ‚auf keinen Fall zutreffend‘ deuten an, dass der Wirklichkeitsbezug menschlicher Wissenselemente sehr vielfältig und ‚dynamisch‘ ist. Etwas, das gerade noch zutreffend war, kann im nächsten Moment nicht mehr zutreffend sein. Etwas, das lange als ‚bloße Fantasterei‘ abgetan wurde, kann dann doch plötzlich als ‚möglich‘ erscheinen oder ‚trifft plötzlich zu‘. Sich in diesem ‚dynamisch korrelierten Bedeutungsraum‘ so zu bewegen, dass eine gewisse ‚innere und äußere Konsistenz‘ gewahrt bleibt, stellt eine komplexe Herausforderung dar, die von Philosophie und den Wissenschaften bislang eher nicht ganz verstanden, geschweige denn auch nur annähernd ‚erklärt‘ worden ist.

Fakt ist: wir Menschen können dies bis zu einem gewissen Grad. Je komplexer der Wissensraum ist, je vielfältiger die sprachlichen Interaktion mit anderen Menschen werden, umso schwieriger wird es natürlich.

‚Luftnummer‘ chatGPT

(Letzte Änderung: 15.Februar 2023, 07:25h)

Vergleicht man den chatbot chatGPT mit diesen ‚Grundeigenschaften‘ des Menschen, dann kann man erkennen, dass chatGPT nichts von alledem kann. (i) Fragen kann er von sich aus nicht sinnvoll stellen, da es keinen Anlass gibt, warum er fragen sollte (es sei denn, jemand induziert ihm eine Frage). (ii) Textdokumente (von Menschen) sind für ihn Ausdrucksmengen, für die er über keine eigenständigen Bedeutungszuordnung verfügt. Er könnte also niemals eigenständig die ‚Wahrheitsfrage‘ — mit all ihren dynamischen Schattierungen — stellen oder beantworten. Er nimmt alles für ‚bare Münze‘ bzw. man sagt gleich, dass er ’nur träumt‘.

Wenn chatGPT aufgrund seiner großen Text-Datenbank eine Teilmenge von Ausdrücken hat, die irgendwie als ‚wahr‘ klassifiziert sind, dann kann der Algorithmus ‚im Prinzip‘ indirekt ‚Wahrscheinlichkeiten‘ ermitteln, die andere Ausdrucksmengen, die nicht als ‚wahr‘ klassifiziert sind, dann doch ‚mit einer gewissen Wahrscheinlichkeit‘ als ‚wahr erscheinen‘
lassen. Ob der aktuelle chatGPT Algorithmus solche ‚wahrscheinlichen Wahrheiten explizit‘ benutzt, ist unklar. Im Prinzip übersetzt er Texte in ‚Vektorräume‘, die auf verschiedene Weise ‚ineinander abgebildet‘ werden, und Teile dieser Vektorräume werden dann wieder in Form eines ‚Textes‘ ausgegeben. Das Konzept ‚Wahrheit‘ taucht in diesen mathematischen Operationen — nach meinem aktuellen Kenntnisstand — nicht auf. Wenn, dann wäre es auch nur der formale logische Wahrheitsbegriff [4]; dieser liegt aber mit Bezug auf die Vektorräume ‚oberhalb‘ der Vektorräume, bildet in Bezug auf diese einen ‚Meta-Begriff‘. Wollte man diesen auf die Vektorräume und Operationen auf diesen Vektorräumen tatsächlich anwenden, dann müsste man den Code von chatGPT komplett neu schreiben. Würde man dies tun — das wird aber keiner schaffen — dann würde sich der Code von chatGPT dem Status einer formalen Theorie nennen (wie in der Mathematik) (siehe Anmerkung [5]). Von einer empirischen Wahrheitsfähigkeit wäre chatGPT dann immer noch meilenweit entfernt.

Hybride Scheinwahrheiten

Im Anwendungsfall, bei dem der Algorithmus mit Namen ‚chatGPT‘ Ausdrucksmengen benutzt, die den Texten ähneln, die Menschen produzieren und lesen, navigiert sich chatGPT rein formal und mit Wahrscheinlichkeiten durch den Raum der formalen Ausdruckselemente. Ein Mensch, der die von chatGPT produzierten Ausdrucksmengen ‚liest‘, aktiviert aber automatisch (= unbewusst!) sein eigenes ’sprachliches Bedeutungswissen‘ und projiziert dieses in die abstrakten Ausdrucksmenge von chatGBT. Wie man beobachten kann (und hört und liest von anderen), sind die von chatGBT produzierten abstrakten Ausdrucksmengen dem gewöhnten Textinput von Menschen in vielen Fällen — rein formal — so ähnlich, dass ein Mensch scheinbar mühelos seine Bedeutungswissen mit diesen Texten korrelieren kann. Dies hat zur Folge, dass der rezipierende (lesende, hörende) Mensch das ‚Gefühl‘ hat, chatGPT produziert ’sinnvolle Texte‘. In der ‚Projektion‘ des lesenden/hörenden Menschen JA, in der Produktion von chatGPT aber NEIN. chatGBT verfügt nur über formale Ausdrucksmengen (kodiert als Vektorräume), mit denen er ‚blind‘ herumrechnet. Über ‚Bedeutungen‘ im menschlichen Sinne verfügt er nicht einmal ansatzweise.

Zurück zum Menschen?

(Letzte Änderung: 27.Februar 2023)

Wie leicht sich Menschen von einer ‚fake-Maschine‘ so beeindrucken lassen, dass sie dabei sich selbst anscheinend vergessen und sich ‚dumm‘ und ‚leistungsschwach‘ fühlen, obgleich die Maschine nur ‚Korrelationen‘ zwischen menschlichen Fragen und menschlichen Wissensdokumenten rein formal herstellt, ist eigentlich erschreckend [7a,b], und zwar mindestens in einem doppelten Sinne: (i)Statt die eigene Potentiale besser zu erkennen (und zu nutzen), starrt man gebannt wie das berühmte ‚Kaninchen auf die Schlange‘, obgleich die Maschine immer noch ein ‚Produkt des menschlichen Geistes‘ ist. (ii) Durch diese ‚kognitive Täuschung‘ wird versäumt, das tatsächlich ungeheure Potential ‚kollektiver menschlicher Intelligenz‘ besser zu verstehen, das man dann natürlich durch Einbeziehung moderner Technologien um mindestens einen evolutionären Level weiter voran bringen könnte. Die Herausforderung der Stunde lautet ‚Kollektiver Mensch-Maschine Intelligenz‘ im Kontext einer nachhaltigen Entwicklung mit Priorität bei der menschlichen kollektiven Intelligenz. Die aktuelle sogenannte ‚Künstliche (= maschinelle) Intelligenz‘ sind ziemlich primitive Algorithmen. Integriert in eine entwickelte ‚kollektive menschliche Intelligenz‘ könnten ganz andere Formen von ‚Intelligenz‘ realisiert werden, solche, von denen wir aktuell höchstens träumen können.

Kommentierung weiterer Artikel von anderen Autoren zu chatGPT

(Letzte Änderung: 17.April 2023)

Achtung: Einige der Text in den Anmerkungen sind aus dem Englischen zurück übersetzt worden. Dies geschah unter Benutzung der Software www.DeepL.com/Translator (kostenlose Version).

Siehe [8], [9], [10], [12],[13],[14],[15]

Anmerkungen

[1] In den vielen tausend ’natürlichen Sprachen‘ dieser Welt kann man beobachten, wie ‚erfahrbare Umweltgegebenheiten‘ über die ‚Wahrnehmung‘ zu ‚Wissenselementen‘ werden können, die dann in jeder Sprache mit unterschiedlichen Ausdrücken korreliert werden. Die Sprachwissenschaftler (und Semiotiker) sprechen daher hier von ‚Konventionen‘, ‚frei vereinbarte Zuordnungen‘.

[2] Aufgrund der körperlichen Interaktion mit der Umgebung, die ‚Wahrnehmungsereignisse‘ ermöglicht, die von den ‚erinnerbaren und gewussten Wissenselementen‘ unterscheidbar sind.

[3] Die Einstufung von ‚Wissenselementen‘ als ‚Fantasterei‘ kann falsch sein, wie viele Beispiele zeigen, wie umgekehrt, die Einstufung als ‚wahrscheinlich korrelierbar‘ auch falsch sein kann!

[4] Nicht der ‚klassischen (aristotelischen) Logik‘ da diese noch keine strenge Trennung von ‚Form‘ (Ausdruckselementen) und ‚Inhalt‘ (Bedeutung) kannte.

[5] Es gibt auch Kontexte, in denen spricht man von ‚wahren Aussagen‘, obgleichgar keine Beziehung zu einer konkreten Welterfahrung vorliegt. So z.B. im Bereich der Mathematik, wo man gerne sagt, dass eine Aussage ‚wahr‘ ist. Dies ist aber eine ganz ‚andere Wahrheit‘. Hier geht es darum, dass im Rahmen einer ‚mathematischen Theorie‘ bestimmte ‚Grundannahmen‘ gemacht wurden (die mit einer konkreten Realität nichts zu tun haben müssen), und man dann ausgehend von diesen Grundannahmen mit Hilfe eines formalen Folgerungsbegriffs (der formalen Logik) andere Aussagen ‚ableitet‘. Eine ‚abgeleitete Aussage‘ (meist ‚Theorem‘ genannt), hat ebenfalls keinerlei Bezug zu einer konkreten Realität. Sie ist ‚logisch wahr‘ oder ‚formal wahr‘. Würde man die Grundannahmen einer mathematischen Theorie durch — sicher nicht ganz einfache — ‚Interpretationen‘ mit konkreter Realität ‚in Beziehung setzen‘ (wie z.B. in der ‚angewandten Physik‘), dann kann es unter speziellen Bedingungen sein, dass die formal abgeleiteten Aussagen einer solchen ‚empirisch interpretierten abstrakten Theorie‘ eine ‚empirische Bedeutung‘ gewinnen, die unter bestimmten Bedingungen vielleicht ‚korrelierbar‘ ist; dann würde man solche Aussagen nicht nur ‚logisch wahr‘ nennen, sondern auch ‚empirisch wahr‘. Wie die Geschichte der Wissenschaft und der Wissenschaftsphilosophie zeigt, ist der aber ‚Übergang‘ von empirisch interpretierten abstrakten Theorien zu empirisch interpretierbaren Folgerungen mit Wahrheitsanspruch nicht trivial. Der Grund liegt im benutzten ‚logischen Folgerungsbegriff‘. In der modernen formalen Logik gibt es mahezu ‚beliebig viele‘ verschiedene formale Folgerzungsbegriffe. Ob ein solcher formaler Folgerungsbegriff tatsächlich die Struktur empirischer Gegebenheiten über abstrakte Strukturen mit formalen Folgerungen ‚angemessen wiedergibt‘, ist keinesfalls gesichert! Diese Problemstellung ist in der Wissenschaftsphilosophie bislang nicht wirklich geklärt!

[6] Gerd Doeben-Henisch, 15.-16.Januar 2023, „chatGBT about Rationality: Emotions, Mystik, Unconscious, Conscious, …“, in: https://www.uffmm.org/2023/01/15/chatgbt-about-rationality-emotions-mystik-unconscious-conscious/

[7a] Der chatbot ‚Eliza‘ von Weizenbaum von 1966 war trotz seiner Einfachheit in der Lage, menschliche Benutzer dazu zu bringen, zu glauben, dass das Programm sie ‚versteht‘ selbst dann, wenn man ihnen erklärte, dass es nur ein einfacher Algorithmus sei. Siehe das Stichwort ‚Eliza‘ in wkp-de: https://de.wikipedia.org/wiki/ELIZA

[7b] Joseph Weizenbaum, 1966, „ELIZA. A Computer Program For the Study of Natural Language. Communication Between Man And Machine“, Communications of the ACM, Vol.9, No.1, January 1966, URL: https://cse.buffalo.edu/~rapaport/572/S02/weizenbaum.eliza.1966.pdf Anmerkung: Obwohl das Programm ‚Eliza‘ von Weizenbaum sehr einfach war, waren alle Benutzer fasziniert von dem Programm, weil sie das Gefühl hatten „Es versteht mich“, dabei spiegelte das Programm nur die Fragen und Aussagen der Benutzer. Anders gesagt: die Benutzer waren ‚von sich selbst‘ fasziniert mit dem Programm als eine Art ‚Spiegel‘.

[8] Ted Chiang, 2023, „ChatGPT Is a Blurry JPEG of the Web. OpenAI’s chatbot offers paraphrases, whereas Google offers quotes. Which do we prefer?“, The NEW YORKER, February 9, 2023. URL: https://www.newyorker.com/tech/annals-of-technology/chatgpt-is-a-blurry-jpeg-of-the-web . Anmerkung: Chang betrachtet das Programm chatGPT im Paradigma eines ‚Kompressions-Algorithmus‘: Die Fülle der Informationen wird ‚verdichtet/ abstrahiert‘, so dass ein leicht unscharfes Bild der Textmengen entsteht, keine 1-zu-1 Kopie. Dies führt beim Benutzer zum Eindruck eines Verstehens auf Kosten des Zugriffs auf Details und Genauigkeit. Die Texte von chatGPT sind nicht ‚wahr‘, aber sie ‚muten an‘.

[9] Dietmar Hansch, 2023, „Der ehrlichere Name wäre ‚Simulierte Intelligenz‘. An welchen Defiziten Bots wie chatGBT leiden und was das für unseren Umgang mit Ihnen heißen muss.“, FAZ, 1.März 2023, S.N1 . Bemerkung: Während Chiang (siehe [8] sich dem Phänomen chatGPT mit dem Konzept ‚Kompressions-Algorithmus‘ nähert bevorzugt Hansch die Begriffe ’statistisch-inkrementelles Lernen‘ sowie ‚Einsichtslernen‘. Für Hansch ist Einsichtslernen an ‚Geist‘ und ‚Bewusstsein‘ gebunden, für die er im Gehirn ‚äquivalente Strukturen‘ postuliert. Zum Einsichtslernen kommentiert Hansch weiter „Einsichtslernen ist nicht nur schneller, sondern auch für ein tiefes, ganzheitliches Weltverständnis unverzichtbar, das weit greifende Zusammenhänge erfasst sowie Kriterien für Wahrheit und Wahrhaftigkeit vermittelt.“ Es verwundert dann nicht wenn Hansch schreibt „Einsichtslernen ist die höchster Form des Lernens…“. Mit Bezug auf diesen von Hansch etablierten Referenzrahmen klassifiziert er chatGPT in dem Sinne dass er nur zu ’statistisch-inkrementellem Lernen‘ fähig sei. Ferner postuliert Hansch für den Menschen, „Menschliches Lernen ist niemals rein objektiv, wir strukturieren die Welt immer in Bezug auf unsere Bedürfnisse, Gefühle und bewussten Zwecke…“. Er nennt dies den ‚Humanbezug‘ im menschlichen Erkennen, und genau diesen spricht er chatGPT auch ab. Für geläufige Bezeichnung ‚KI‘ als ‚Künstliche Intelligenz‘ postuliert er, dass der Terminus ‚Intelligenz‘ in dieser Wortverbindung nichts mit der Bedeutung zu tun habe, die wir im Fall des Menschen mit ‚Intelligenz‘ verbinden, also auf keinen Fall etwas mit ‚Einsichtslernen‘, wie er zuvor schon festgestellt hat. Um diesem Umstand mehr Ausdruck zu verleihen würde er lieber den Begriff ‚Simulierte Intelligenz‘ benutzen (siehe dazu auch [10]). Diese begriffliche Strategie wirkt merkwürdig, da der Begriff Simulation [11] normalerweise voraussetzt, dass es eine klare Sachlage gibt, zu der man ein vereinfachtes ‚Modell‘ definiert, mittels dem sich dann das Verhalten des Originalsystems in wichtigen Punkten — vereinfacht — anschauen und untersuchen lässt. Im vorliegenden Fall ist aber nicht ganz klar, was denn überhaupt das Originalsystem sein soll, das im Fall von KI simuliert werden soll. Es gibt bislang keine einheitliche Definition von ‚Intelligenz‘ im Kontext von ‚KI‘! Was die Begrifflichkeit von Hansch selbst angeht, so sind die Begriffe ‚statistisch-inkrementelles Lernen‘ sowie ‚Einsichtslernen‘ ebenfalls nicht klar definiert; der Bezug zu beobachtbarem menschlichen Verhalten geschweige den zu den postulierten ‚äquivalenten Gehirnstrukturen‘ ist beliebig unklar (was durch den Bezug zu bis heute nicht definierten Begriffen wie ‚Bewusstsein‘ und ‚Geist‘ nicht gerade besser wird).

[10] Severin Tatarczyk, 19.Februar 2023, zu ‚Simulierter Intelligenz‘: https://www.severint.net/2023/02/19/kompakt-warum-ich-den-begriff-simulierte-intelligenz-bevorzuge-und-warum-chatbots-so-menschlich-auf-uns-wirken/

[11] Begriff ‚Simulation‘ in wkp-de: https://de.wikipedia.org/wiki/Simulation

[12] Doris Brelowski machte mich auf folgenden Artikel aufmerksam: James Bridle, 16.März 2023, „The stupidity of AI. Artificial intelligence in its current form is based on the wholesale appropriation of existing culture, and the notion that it is actually intelligent could be actively dangerous“, URL: https://www.theguardian.com/technology/2023/mar/16/the-stupidity-of-ai-artificial-intelligence-dall-e-chatgpt?CMP=Share_AndroidApp_Other . Anmerkung: Ein Beitrag, der kenntnisreich und sehr differenziert das Wechselspiel zwischen Formen der AI beschreibt, die von großen Konzernen auf das gesamte Internet ‚losgelassen‘ werden, und was dies mit der menschlichen Kultur und dann natürlich mit den Menschen selbst macht. Zwei Zitate aus diesem sehr lesenwerten Artikel: Zitat 1: „The entirety of this kind of publicly available AI, whether it works with images or words, as well as the many data-driven applications like it, is based on this wholesale appropriation of existing culture, the scope of which we can barely comprehend. Public or private, legal or otherwise, most of the text and images scraped up by these systems exist in the nebulous domain of “fair use” (permitted in the US, but questionable if not outright illegal in the EU). Like most of what goes on inside advanced neural networks, it’s really impossible to understand how they work from the outside, rare encounters such as Lapine’s aside. But we can be certain of this: far from being the magical, novel creations of brilliant machines, the outputs of this kind of AI is entirely dependent on the uncredited and unremunerated work of generations of human artists.“ Zitat 2: „Now, this didn’t happen because ChatGPT is inherently rightwing. It’s because it’s inherently stupid. It has read most of the internet, and it knows what human language is supposed to sound like, but it has no relation to reality whatsoever. It is dreaming sentences that sound about right, and listening to it talk is frankly about as interesting as listening to someone’s dreams. It is very good at producing what sounds like sense, and best of all at producing cliche and banality, which has composed the majority of its diet, but it remains incapable of relating meaningfully to the world as it actually is. Distrust anyone who pretends that this is an echo, even an approximation, of consciousness. (As this piece was going to publication, OpenAI released a new version of the system that powers ChatGPT, and said it was “less likely to make up facts”.)“

[13] David Krakauer in einem Interview mit Brian Gallagher in Nautilus, March 27, 2023, Does GPT-4 Really Understand What We’re Saying?, URL: https://nautil.us/does-gpt-4-really-understand-what-were-saying-291034/?_sp=d9a7861a-9644-44a7-8ba7-f95ee526d468.1680528060130. David Krakauer, Evolutionstheoretiker und Präsident des Santa Fe Instituts für Complexity Science, analysiert die Rolle von Chat-GPT-4-Modellen im Vergleich zum menschlichen Sprachmodell und einem differenzierteren Verständnis dessen, was „Verstehen“ und „Intelligenz“ bedeuten könnte. Seine Hauptkritikpunkte stehen in enger Übereinstimmung mit der obigen Position. Er weist darauf hin, dass (i) man klar zwischen dem „Informationskonzept“ von Shannon und dem Konzept der „Bedeutung“ unterscheiden muss. Etwas kann eine hohe Informationslast darstellen, aber dennoch bedeutungslos sein. Dann weist er darauf hin (ii), dass es mehrere mögliche Varianten der Bedeutung von „Verstehen“ gibt. Die Koordinierung mit dem menschlichen Verstehen kann funktionieren, aber Verstehen im konstruktiven Sinne: nein. Dann setzt Krakauer (iii) GPT-4 mit dem Standardmodell der Wissenschaft in Beziehung, das er als „parsimony“ charakterisiert; chat-GPT-4 ist eindeutig das Gegenteil. Ein weiterer Punkt (iv) ist die Tatsache, dass die menschliche Erfahrung einen „emotionalen“ und einen „physischen“ Aspekt hat, der auf somato-sensorischen Wahrnehmungen im Körper beruht. Dies fehlt bei GPT-4. Dies hängt (v) mit der Tatsache zusammen, dass das menschliche Gehirn mit seinen „Algorithmen“ das Produkt von Millionen von Jahren der Evolution in einer komplexen Umgebung ist. Die GPT-4-Algorithmen haben nichts Vergleichbares; sie müssen den Menschen nur ‚überzeugen‘. Schließlich (vi) können Menschen „physikalische Modelle“ generieren, die von ihren Erfahrungen inspiriert sind, und können mit Hilfe solcher Modelle schnell argumentieren. So kommt Krakauer zu dem Schluss: „Das Narrativ, das besagt, dass wir das menschliche Denken wiederentdeckt haben, ist also in vielerlei Hinsicht falsch. Einfach nachweislich falsch. Das kann nicht der richtige Weg sein.“ Anmerkungen zum Text von Krakauer: Benutzt man das allgemeine Modell von Akteur und Sprache, wie es der Text oben annimmt, dann ergeben sich die Punkt (i) – (vi) als Folgerungen aus dem allgemeinen Modell. Die Akzeptanz eines allgemeinen Akteur-Sprache Modells ist leider noch nicht verbreitet.

[14] Von Marie-José Kolly (Text) und Merlin Flügel (Illustration), 11.04.2023, „Chatbots wie GPT können wunderbare Sätze bilden. Genau das macht sie zum Problem“. Künstliche Intelligenz täuscht uns etwas vor, was nicht ist. Ein Plädoyer gegen die allgemeine Begeisterung. Online-Zeitung ‚Republik‘ aus der SChweiz, URL: https://www.republik.ch/2023/04/11/chatbots-wie-gpt-koennen-wunderbare-saetze-bilden-genau-das-macht-sie-zum-problem? Hier einige Anmerkungen:

Der Text von Marie-José Kolly sticht hervor weil der Algorithmus mit Namen chatGPT(4) hier sowohl in seinem Input-Output Verhalten charakterisiert wird und zusätzlich ein Vergleich zum Menschen zumindest in Ansätzen vorgenommen wird.

Das grundsätzliche Problem des Algorithmus chatGPT(4) besteht darin (wie auch in meinem Text oben herausgestellt), dass er als Input-Daten ausschließlich über Textmengen verfügt (auch jene der Benutzer), die nach rein statistischen Verfahren in ihren formalen Eigenschaften analysiert werden. Auf der Basis der analysierten Regelmäßigkeiten lassen sich dann beliebige Text-Kollagen erzeugen, die von der Form her den Texten von Menschen sehr stark ähneln, so sehr, dass viele Menschen sie für ‚von Menschen erzeugte Texte‘ nehmen. Tatsächlich fehlen dem Algorithmus aber das, was wir Menschen ‚Weltwissen‘ nennen,es fehlt echtes ‚Denken‘, es fehlen ‚eigene‘ Werte-Positionen, und der Algorithmus ‚versteht‘ seine eigenen Text ’nicht‘.

Aufgrund dieses fehlenden eigenen Weltbezugs kann der Algorithmus über die verfügbaren Textmengen sehr leicht manipuliert werden. Eine ‚Massenproduktion‘ von ‚Schrott-Texten‘, von ‚Desinformationen‘ ist damit sehr leicht möglich.

Bedenkt man, dass moderne Demokratien nur funktionieren können, die Mehrheit der Bürger über eine gemeinsame Faktenbasis verfügt, die als ‚wahr‘ angenommen werden können, über eine gemeinsame Wissensmenge, über zuverlässige Medien, dann können mit dem Algorithmus chatGPT(4) genau diese Anforderungen an eine Demokratie massiv zerstört werden.

Interessant ist dann die Frage, ob chatGPT(4) eine menschliche Gesellschaft, speziell eine demokratische Gesellschaft, tatsächlich auch positiv-konstruktiv unterstützen kann?

Vom Menschen ist jedenfalls bekannt, dass dieser den Gebrauch seiner Sprache von Kindes Beinen an im direkten Kontakt mit einer realen Welt erlernt, weitgehend spielerisch, in Interaktion mit anderen Kindern/ Menschen. Für Menschen sind ‚Worte‘ niemals isolierte Größen sondern sie sind immer dynamisch eingebunden in ebenfalls dynamische Kontexte. Sprache ist nie nur ‚Form‘ sondern immer zugleich auch ‚Inhalt‘, und dies auf mannigfaltige Weise. Dies geht nur weil der Mensch über komplexe kognitiven Fähigkeiten verfügt, die u.a. entsprechende Gedächtnisleistungen wie auch Fähigkeiten zur Verallgemeinerung/ Generalisierung umfassen.

Die kulturgeschichtliche Entwicklung von gesprochener Sprache, über Schrift, Buch, Bibliotheken bis hin zu gewaltigen digitalen Datenspeichern hat zwar bezüglich der ‚formen‘ von Sprache und darin — möglicherweise — kodiertem Wissen Gewaltiges geleistet, aber es besteht der Eindruck, dass die ‚Automatisierung‘ der Formen diese in die ‚Isolation‘ treibt, so dass die Formen ihren Kontakt zur Realität, zur Bedeutung, zur Wahrheit immer mehr verlieren. Aus der Sprache als zentralem Moment der Ermöglichung von mehr komplexem Wissen und mehr komplexem Handeln wird damit zunehmend ein ‚Parasit‘, der immer mehr Raum beansprucht und dabei immer mehr Bedeutung und Wahrheit vernichtet.

[15] Gary Marcus, April 2023, Hoping for the Best as AI Evolves, Gary Marcus on the systems that “pose a real and imminent threat to the fabric of society.” Communications of the ACM, Volume 66, Issue 4, April 2023 pp 6–7, https://doi.org/10.1145/3583078 . Anmerkung: Gary Marcus schreibt anlässlich der Wirkungen von Systemen wie chatGPT(OpenAI), Dalle-E2 und Lensa über die ernst zunehmenden negativen Wirkungen, die diese Werkzeuge innerhalb einer Gesellschaft haben können, und zwar in einem Ausmaß, das eine ernsthafte Bedrohung für jede Gesellschaft darstellt! Sie sind inhärent fehlerhaft in den Bereichen Denken, Tatsachen und Halluzinationen. Mit nahezu Null Kosten lassen sich mit ihnen sehr schnell umfangreiche Desinformationskampagnen erstellen und ausführen. Am Beispiel der weltweit wichtigen Webseite ‚Stack Overflow‘ für Programmierer konnte (und kann) man sehen, wie der inflationäre Gebrauch von chatGPT aufgrund der inhärenten vielen Fehler dazu führt, dass das Management-Team von Stack Overflow seine Benutzer dringend bitten musste, den Einsatz von chatGPT komplett zu unterlassen, um den Zusammenbruch der Seite nach 14 Jahren zu verhindern. Im Falle von großen Playern, die es gezielt auf Desinformationen absehen, ist solch eine Maßnahme unwirksam. Diese Player zielen darauf ab, eine Datenwelt zu erschaffen, in der niemand mehr irgend jemandem vertrauen kann. Dies vor Augen stellt Gary Marcus 4 Postulate auf, die jede Gesellschaft umsetzen sollte: (1) Automatisch generierter Inhalt sollte komplett verboten werden; (2) Es müssen rechtswirksame Maßnahmen verabschiedet werden, die ‚Missinformationen‘ verhindern können; (3) User Accounts müssen fälschungssicher gemacht werden; (4) Es wird eine neue Generation von KI Werkzeugen gebraucht, die Fakten verifizieren können.

DER AUTOR

Einen Überblick über alle Beiträge von Autor cagent nach Titeln findet sich HIER.


AVICENNAS ABHANDLUNG ZUR LOGIK – Teil 14

VORGESCHICHTE

Für einen Überblick zu allen vorausgehenden Beiträgen dieser rekonstruierenden Lektüre von Avicennas Beitrag zur Logik siehe AVICENNAS ABHANDLUNG ZUR LOGIK – BLITZÜBERSICHT.

1. Wenn also eine Formulierung von Konvertierungsregeln nicht ohne Bezug auf irgend eine Bedeutung M hinter den Ausdrücken möglich ist, stellt sich zum wiederholten Male die Frage, über welche mögliche Bedeutung M ‚hinter‘ den Ausdrücken gesprochen werden muss.

KONVERTIERUNG MIT BEDEUTUNG – MIT WELCHER?

2. Beginnen wir mit dem Ausgangspunkt, dass Aussagen PROP solche Ausdrücke von der Menge aller Ausdrücke E sind, die ‚wahr‘ oder ‚falsch‘ sein können. ‚Treffen sie zu‘ gelten sie als ‚wahr‘; ‚treffen sie nicht zu‘ gelten sie als ‚falsch‘.
3. Bislang hatten wir schon die generelle Annahme geäußert, dass das Denken und Wissen eines Menschen im ‚Innern‘ dieses Menschen zu verorten sei und der Mensch ‚in‘ einer umgebenden Welt W mit realen Ereignissen X vorkommt.
4. Um die Begriffe ‚wahr/ falsch‘ bzw. ‚zutreffen/ nicht zutreffen‘ zu ‚erklären‘, nehmen wir an, dass die Menge des möglichen Wissens K eines einzelnen Menschen sich zerlegen lässt in die Teilmengen ‚Vorgestellt‘ K_v, ‚Erinnert‘ K_m sowie ’sinnlich präsent‘ K_s. Es gilt also $latex K = K_{s} \cup M_{v} \cup M_{m}$.
5. Eine Bedeutung wird dann durch eine Beziehung zwischen dem Wissen K und möglichen Ausdrücken $latex PROP \subseteq E$ gebildet: $latex M \subseteq PROP \times K$.
6. Speziell gilt aber, dass man zwischen einer ’neutralen‘ Bedeutung $latex M_n \subseteq E \times (K_{v} \cup K_{m})$ unterscheiden muss, die weder ‚wahr‘ noch ‚falsch‘ ist, und der ’sinnlich fundierten‘ Bedeutung $latex M_s \subseteq E \times K_{s}$. Gibt es zwischen einer neutralen Bedeutung $latex M_{n}$ und einer sinnlich fundierten Bedeutung $latex M_{s}$ eine Beziehung des ‚Zutreffens‘ $latex M_{s} \models M_{n}$, dann kann man sagen, dass das Wissen $latex K_{n}$ in dieser Beziehung ‚wahr‘ ist, andernfalls nicht, geschrieben $latex M_{s} \not\models K_{n}$.
7. Zusätzlich kann man im Bereich des erinnerten Wissens $latex K_{m}$ noch unterscheiden zwischen einem solchen, das Bezug zu ‚vormals sinnlich fundiertem Wissen‘ aufweist als $latex K_{ms}$ und solchem, das ‚keinen Bezug zu vormals fundiertem sinnlichen Wissen‘ aufweist als $latex K_{mns}$.
8. Erinnertes Wissen mit Bezug zu vormals fundiertem Wissen $latex K_{ms}$ hat die Eigenart, dass sich in Abhängigkeit von der ‚Häufigkeit‘ der erinnerbaren Wissenselementen in $latex K_{ms}$ eine Art ‚Erwartung‘ bzgl. des neuerlichen Eintretens dieses Wissens als sinnliches Wissen $latex K_{vs}$ ausbildet: $latex \mu: K_{ms} \longrightarrow K_{vs}$ mit $latex K_{vs} \subseteq K_{v}$, d.h. im Bereich des vorgestellten Wissens $latex K_{v}$ gibt es solches mit einem speziellen Erwartungsanteil $latex K_{vs}$ hervorgerufen durch besondere Erinnerungen.

EXKLUSIVE MODALOPERATOREN

9. An dieser Stelle könnte man dann noch die Begriffe ‚möglich‘ $latex \diamond$ und ’notwendig‘ $latex \boxempty$ wie folgt einführen: ein vorgestelltes Wissen gilt als ‚möglich‘, wenn der Erwartungswert nicht gleich 1 ist, also $latex \diamond K_{v} \leftrightarrow \mu(K_{v}) \not= 1$, andernfalls als notwendig, also $latex \boxempty K_{v} \leftrightarrow \mu(K_{v}) = 1$
10. Daraus kann man ableiten, dass gelten soll $latex \boxempty K_{v} \leftrightarrow \neg\diamond K_{v}$ oder $latex \neg\boxempty K_{v} \leftrightarrow \diamond K_{v}$.
11. Diese Definition von ‚möglich‘ und ’notwendig‘ entspricht nicht ganz der ‚Intuition‘, dass etwas, was ’notwendig‘ ist, auf jeden Fall auch möglich sein sollte; allerdings folgt – intuitiv — aus der Möglichkeit keine Notwendigkeit. Die vorausgehende Definition von möglich und notwendig erinnert ein wenig an das ‚exklusive Oder‘, das auch ’schärfer‘ ist als das normale Oder. Nennen wie die hier benutzte Definition von ‚möglich‘ $latex \diamond$ und ’notwendig‘ $latex \boxempty$ daher auch die ‚exklusiven Modaloperatoren‘: Wenn etwas notwendig ist, dann ist es nicht möglich, und wenn etwas möglich ist, dann ist es nicht notwendig.
12. Anmerkung: wenn etwas ‚gedanklich notwendig‘ ist, folgt daraus in diesem Rahmen allerdings nicht, dass es auch tatsächlich sinnlich eintritt. Aus der gedanklichen Notwendigkeit folgt nur, dass es in der erinnerbaren Vergangenheit bislang immer eingetreten ist und daher die Erwartung sehr hoch ist, dass es wieder eintreten wird.

WAHR und FALSCH ABKÜRZUNGEN

13. Wenn man von einer Aussage $latex e \in E$ sagen kann, dass das zugehörige vorstellbare Wissen $latex M(e)=K_{v}$ ‚wahr‘ ist, weil es auf ein sinnliches Wissen $latex K_{s}$ ‚zutrifft oder eben ‚falsch‘, weil es ’nicht zutrifft‘, dann soll dieser Sachverhalt hier wie folgt abgekürzt werden:
14. Eine Aussage A soll genau dann mit ‚wahr‘ $latex \top$ bezeichnet werden, wenn es ein sinnliches Wissen gibt, das das zugehörige vorgestellte Wissen ‚erfüllt‘, also $latex (A)\top \leftrightarrow M(A)=K_{v}$ und es gibt ein sinnlich fundiertes Wissen $latex K_{s}$, so dass gilt $latex K_{s} \models K_{v}$.
15. Eine Aussage A soll genau dann mit ‚falsch‘ $latex \bot$ bezeichnet werden, wenn es kein sinnliches Wissen gibt, das das zugehörige vorgestellte Wissen ‚erfüllt‘, also $latex (A)\bot \leftrightarrow M(A)=K_{v}$ und $latex K_{s} \not\models K_{v}$. [Anmerkung: Es gibt nur ein einziges sinnlich fundiertes Wissen, und zwar das jeweils aktuelle!]

AUSSAGEOPERATOREN

16. Jetzt kann man folgende Operatoren über Aussagen definieren:
17. NEGATION: die Verneinung einer Aussage A ist wahr, wenn die Aussage selbst falsch ist, also $latex (\neg A)\top \leftrightarrow (A)\bot$.
18. KONJUNKTION: die Konjunktion $latex \wedge$ von zwei Aussagen A und B ist wahr, wenn beide Aussagen zugleich wahr sind; ansonsten ist die Konjunktion falsch, also $latex (A \wedge B)\top \leftrightarrow (A)\top\ und\ zugleich\ (B)\top$; ansonsten falsch.
19. DISJUNKTION: die Disjunktion $latex \vee$ von zwei Aussagen A und B ist wahr, wenn eine von beiden Aussagen wahr ist; ansonsten ist die Disjunktion falsch, also $latex (A \vee B)\top \leftrightarrow (A)\top\ oder\ (B)\top$; ansonsten falsch.
20. EXKLUSIVE DISJUNKTION: die exklusive Disjunktion $latex \sqcup$ von zwei Aussagen A und B ist wahr, wenn genau eine von beiden Aussagen wahr ist; ansonsten ist die exklusive Disjunktion falsch, also $latex (A \sqcup B)\top \leftrightarrow\ Entweder\ (A)\top\ oder\ (B)\top$; ansonsten falsch.
21. IMPLIKATION: die Implikation $latex \rightarrow$ von zwei Aussagen A und B ist wahr, wenn nicht A wahr ist und zugleich B falsch, also $latex (A \rightarrow B)\top \leftrightarrow\ nicht (A)\top\ und\ zugleich\ (B)\bot$; ansonsten falsch.

Fortsetzung folgt

QUELLEN

  • Avicenna, ‚Avicennas Treatise on Logic‘. Part One of ‚Danesh-Name Alai‘ (A Concise Philosophical Encyclopedia) and Autobiography, edited and translated by Farang Zabeeh, The Hague (Netherlands): Martinus Nijhoff, 1971. Diese Übersetzung basiert auf dem Buch ‚Treatise of Logic‘, veröffentlicht von der Gesellschaft für Nationale Monumente, Serie12, Teheran, 1952, herausgegeben von M.Moien. Diese Ausgabe wiederum geht zurück auf eine frühere Ausgabe, herausgegeben von Khurasani.
  • Digital Averroes Research Environment
  • Nicholas Rescher (1928 – ),The Development of Arabic Logic. University of Pittsburgh Press, 1964
  • Stanford Encyclopedia of Philosophy, Aristotle’s Logic
  • Whitehead, Alfred North, and Bertrand Russell, Principia Mathematica, 3 vols, Cambridge University Press, 1910, 1912, and 1913; Second edition, 1925 (Vol. 1), 1927 (Vols 2, 3). Abridged as Principia Mathematica to *56, Cambridge University Press, 1962.
  • Alfred North Whitehead; Bertrand Russell (February 2009). Principia Mathematica. Volume One. Merchant Books. ISBN 978-1-60386-182-3.
  • Alfred North Whitehead; Bertrand Russell (February 2009). Principia Mathematica. Volume Two. Merchant Books. ISBN 978-1-60386-183-0.
  • Alfred North Whitehead; Bertrand Russell (February 2009). Principia Mathematica. Volume Three. Merchant Books. ISBN 978-1-60386-184-7

Eine Übersicht über alle bisherigen Blogeinträge nach Titeln findet sich HIER.

AVICENNAS ABHANDLUNG ZUR LOGIK – Teil 9

(Mit Nachtrag vom 1.Sept.2014)

VORGESCHICHTE

Für einen Überblick zu allen vorausgehenden Beiträgen dieser rekonstruierenden Lektüre von Avicennas Beitrag zur Logik siehe AVICENNAS ABHANDLUNG ZUR LOGIK – BLITZÜBERSICHT.

Nach der üblichen Darstellung der Position von Avicenna folgt dann der Teil ‚DISKUSSION‘, in der seine Position kritisch hinterfragt und die Rekonstruktion einer möglichen Theorie der Alltagslogik fortgesetzt wird.

KATEGORISCH – AFFIRMATIV/ NEGATION – UNIVERSAL/ PARTIKULÄR

1. Im folgenden Abschnitt treten Begriffe auf, die z.T. schon zuvor auftraten (‚Kategorisch‘, ‚Negation‘, ‚Universal‘, ‚Partikulär‘), die aber jetzt mit neuen Randbedingungen nochmals diskutiert werden.

KATEGORISCH ALS AFFIRMATIV/ NEGATIV

2. Der Abschnitt beginnt mit einer Diskussion von ‚kategorischen‘ (‚kategorisierenden‘) Aussagen und der Frage, wann sie ‚affirmativ‘ und wann sie ’negativ‘ sind.

SUBJEKT – PRÄDIKAT, EINFACH – ZUSAMMENGESETZT

3. Zusätzlich zu den Unterscheidungen ‚affirmativ‘ – ’negativ‘ im Kontext einer ‚kategorisierenden‘ Aussage berücksichtigt Avicenna auch hier wieder Teilausdrücke. Während er zuvor die semantisch motivierten Begriffe ‚Name‘, ‚Verb‘ (auch ‚Term‘ genannt), sowie ‚Präposition‘ erwähnt hatte, benutzt er nun auch das Begriffspaar ‚Subjekt‘ und ‚Prädikat‘. Beide sind – wie sich aus dem Verwendungskontext nahelegt – ’semantisch‘ motiviert, d.h. nur durch Rückgriff auf die Bedeutung kann man zur Klassifikation ‚Subjekt‘ bzw. ‚Prädikat‘ kommen.
4. Versucht man die Begriffe ‚Name‘, ‚Verb‘ (‚Term‘), sowie ‚Präposition‘ mit den neuen Begriffen ‚Subjekt‘ und ‚Prädikat‘ in Beziehung zu setzen, dann gibt es eine gewisse Korrelation zwischen ‚Name‘ und ‚Subjekt‘ einerseits sowie ‚Verb‘ und ‚Prädikat‘ andererseits. Da Avicenna selbst keinerlei weitere Hinweise auf eine mögliche Beziehung liefert, bleibt an dieser Stelle einiges unklar.
5. Deutlich ist nur, dass Avicenna die Ausdrucksseite eines Ausdrucks e = <e1, e2, …> durch Rückgriff auf eine – nicht explizit beschriebene – Bedeutungsstruktur so analysiert, dass er sagen kann, welche ‚Teile‘ des Ausdrucks e als ‚Subjekt‘ zu nehmen sind, und welche Teile als ‚Prädikat‘.
6. So unterscheidet er im Bedeutungsraum zwischen ‚dem, über das‘ eine Feststellung getroffen wird, und ‚dem, was‘ in dieser Feststellung gesagt wird.
7. Im Beispielsatz N:(der Mensch)V:(ist)N:(ein Lebewesen) analysiert er den Teil [N:(der Mensch)] als ‚Subjekt‘ und den Teil [V:(ist)N:(ein Lebewesen)] als ‚Prädikat‘.
8. Ein anderer Beispielsatz (Wer immer)(sein)N:(Essen)OP:(nicht)V:(kaut)(der)V:(schädigt)(seinen)N:(Darm) enthält Aussageteile, für die Avicenna bislang keine semantisch motivierte grammatische Beschreibungskategorien eingeführt hat. Avicenna analysiert den Ausdruck wie folgt: Subjekt = [(Wer immer)(sein)N:(Essen)OP:(nicht)V:(kaut)] und Prädikat = [(der)V:(schädigt)(seinen)N:(Darm)].
9. Den Unterschied zwischen Subjekt = [N:(der Mensch)] und Subjekt = [(Wer immer)(sein)N:(Essen)OP:(nicht)V:(kaut)] charakterisiert Avicenna als Unterschied zwischen einem ‚einfachen‘ und einem ‚zusammengesetzten‘ Subjekt. Entsprechend auch für das Prädikat: Prädikat = [V:(ist)N:(ein Lebewesen)] und Prädikat = [(der)V:(schädigt)(seinen)N:(Darm)].
10. Sowohl für die Verwendung der Begriffe ‚Subjekt/ Prädikat‘ wie auch ‚einfach/ zusammengesetzt‘ liefert Avicenna keine explizite Kriterien. Er zitiert nur einige Ausdrücke als Beispiele und appelliert an die sprachliche Intuition des Lesers, die implizit verwendeten Analysekriterien zu verstehen.

AFFIRMATIV – NEGATIV

11. In den soeben erwähnten Kontexten wie auch in nachfolgenden Beispielen diskutiert er auch die Begriffe ‚affirmativ‘ und ’negativ‘.
12. Sein Hauptkriterium zur Verwendung der Begriffe ‚affirmativ‘ und ’negativ‘ ist der (semantische, bedeutungsgeleitete!) Aspekt, ob das, was in einer Aussage in einem Prädikat von einem Subjekt behauptet wird, ‚zutrifft’/ ‚der Fall ist‘ oder ’nicht zutrifft’/ ’nicht der Fall ist‘. Trifft das im Prädikat behauptete zu, dann will er es ‚affirmativ‘ nennen, ansonsten ’negativ‘.
13. Im vorausgehenden Abschnitt waren diese Verwendungskriterien auch benutzt worden, um zu sagen, wann eine Aussage ‚wahr‘ bzw. ‚falsch‘ ist. Nach den bisherigen Kriterien müsste man dann sagen, dass ‚wahr‘ und ‚affirmativ‘ einerseits und ‚falsch‘ und ’negativ‘ dann bedeutungsgleich wären.
14. In einem weiteren Beispiel benutzt Avicenna die Aussage SUBJ[N:(Zid)] PRÄD[V:(ist)(ohne)N:(Sicht)] – engl.: ‚Zid is without sight‘ – als ein Beispiel für eine ‚affirmative‘ Aussage, da das Prädikat PRÄD[V:(ist)(ohne)N:(Sicht)] eine Eigenschaft beschreibt, die auf das Subjekt (Zid) zutrifft.
15. Andererseits wird der Teilausdruck ‚ist ohne Sicht‘ bedeutungsmäßig als eine ‚Negation‘ verstanden im Sinne von ‚hat keine Sicht‘ im Gegensatz zu ‚hat Sicht‘. D.h. eine bedeutungsmäßige ‚Verneinung‘ kann durch verschiedene Ausdruckselemente realisiert werden, auch ohne den Ausdruck ’nicht‘. Dies würde bedeuten, dass eine ‚ausdrucksmäßig realisierte Verneinung‘ das Fehlen einer bestimmten Eigenschaft aussagen kann. Nach den Worten Avicennas kann aber genau solche eine Feststellung, dass eine bestimmte Eigenschaft fehlt, eine ‚Affirmation‘ sein, eben das Festellen, dass es der Fall ist, dass eine bestimmte Eigenschaft fehlt.
16. Wenn also eine Affirmation das Absprechen einer Eigenschaft beinhalten kann, wie sieht dann eine Verneinung einer solchen Affirmation aus?
17. Avicenna bringt folgendes Beispiel: SUBJ[N:(Zid)] PRÄD[V:(ist)(nicht)(ohne)N:(Sicht)]. Für ihn ist dieses eine ‚Negation‘, da die Affirmation, eine bestimmte Eigenschaft sei nicht da, verneint wird.
18. Mann könnte das Beispiel auch umschreiben zu: (Es ist nicht der Fall, dass) SUBJ[N:(Zid)] PRÄD[V:(ist)(ohne)N:(Sicht)].
19. Ersetzt man die Teilausdrücke durch Buchstaben – was Avicenna im Text auch einmal demonstriert –, dann könnte man auch schreiben (Es ist nicht der Fall, dass) (A)(B), bzw. dann $latex (A)\neg(B)$.

EXISTENZ

20. Zwischendrin bemerkt Avicenna auch mal, dass das Treffen einer Feststellung, eigentlich nur Sinn mache, wenn dasjenige, von dem etwas ausgesagt wird, auch existiere. Doch wird dieser Punkt nicht weiter diskutiert.

UNIVERSELL – PARTIKULÄR – QUANTITÄT – QUANTOREN

21. Vom Subjekt einer Aussage sagt Avicenna, sie kann ‚partikulär‘ oder ‚universell‘ sein. Falls universell, dann kann man unterscheiden, ob sie ‚unbestimmt‘ (engl.: ‚indeterminate‘) ist – wie viele genau involviert sind — oder eben ‚bestimmt‘ (engl.: ‚determinate‘).
22. Im Beispielausdruck (Zid)(ist)(ein)(Lebewesen) ist (Zid) ‚partikulär‘.
23. Im Beispielausdruck (Menschen)(bewegen)(sich) ist nach Avicenna unklar, ob ‚alle‘ Menschen gemeint sind oder nur ‚einige‘.
24. Die ‚bestimmten universellen Aussagen‘ teilt Avicenna in vier Klassen ein:
25. Typ 1: Subjekt = Alle, Affirmativ (Bsp.: Q=[(Jeder)]S=[(Mensch)]P=[(ist)(ein)(Lebewesen)]
26. Typ 2: Subjekt = Alle, Negativ (Bsp.: Q=[(Kein)]S=[(Mensch)]P=[(ist)(sterblich)](?)
27. Typ 3: Subjekt = Einige, Affirmativ Q=[(Einige)]S=[(Mensch)]P=[(sind)(Schriftsteller)]
28. Typ 4: Subjekt = Einige, Negativ Q=[(Nicht alle)]S=[(Mensch)]P=[(sind)(Schriftsteller)] (?)
29. Hier sind nur einige von Avicennas Beispielsätzen angeführt. Einige Beispiele werfen Fragen auf (?).
30. Mehrfach formuliert Avicenna auch folgendes ‚Metaprinzip‘: Wenn eine Aussage über ‚Alle‘ spricht, dann sei es unsicher, ob wirklich alle gemeint sind; sicher sei es aber, dass wenigstens ‚einige‘ gemeint sind.
31. Aus all diesen Überlegungen leitet er dann folgende Fallunterscheidungen her (von mir abgekürzt ‚+‘ für ‚affirmativ‘, ‚-‚ für negativ‘, ‚1‘ für ‚partikulär‘, ‚0‘ für ‚unbestimmt‘ und ‚a‘ für universell‘:
32. (+,1)
33. (-,1)
34. (0,+)
35. (0,-)
36. (a,+)
37. (a,-)
38. (1,+)
39. (1,-)
40. Die Fälle (+,1) und (-,1) bezeichnet Avicenna als ’nutzlos für die Wissenschaft‘ und die Fälle (0,+) und (0,-) sollten vermieden werden, da sie ‚verwirrend‘ sind.

NOTWENDIG – KONTINGENT

41. Am Beispiel der kategorisierenden Aussagen illustriert Avicenna auch die Begriffe ’notwendig‘ und ‚kontingent‘. Die Verwendung dieser Begriffe stimmt überein mit den zuvor eingeführten Begriffe ‚wesentlich‘ und ‚akzidentell‘.

MÖGLICH

42. Auch erwähnt Avicenna hier den Begriff ‚möglich‘. Er sieht mindestens zwei Verwendungsweisen von ‚möglich‘: einmal als (i) ’nicht unmöglich‘ und (ii) im Sinne von ‚kann existieren‘ und ‚kann nicht existieren‘. Fall (ii) ist für ihn das ‚real mögliche‘ und stimmt nach Ihm mit dem normalsprachlichen Gebrauch überein.
43. Die Verwendungsweise in Fall (i) von ‚möglich := nicht unmöglich‘ widerspricht eigentlich den Regel einer expliziten Definition, wie er sie an früherer Stelle aufgestellt hatte. Dort hatte er verlangt, dass der neu zu definierende Ausdruck e_new nicht auf der rechten Seite bei den definierenden – als bekannt vorausgesetzten – Ausdrücken vorkommen darf, also e_neu := <e_alt1, …, e_altn>.
44. Der Ausdruck ‚möglich := nicht unmöglich‘ entspricht dem Ausdruck ‚möglich := nicht nicht möglich‘. Darin wird der neue Ausdruck über sich selbst definiert, was ‚zirkulär‘ ist.

DISKUSSION

45. Dieser neue Text verstärkt den Eindruck der vorausgehenden Seiten, dass Avicenna keine wirklich systematische Theorie hat. Er folgt den in der Literatur vorkommenden Begriffen nach keiner erkennbaren Regel, und seine Analyse benutzt Kriterien, die höchst selten explizit benannt werden. Vorzugsweise stellt er Beispielsätze vor, die er nach impliziten Kriterien diskutiert. Auch wiederholt er scheinbar ähnliche Bedeutungszusammenhänge mit jeweils neuen Begriffen. Dennoch besteht noch immer der Eindruck, dass sich der bislang gewählte Interpretationszusammenhang durchhalten lässt.

REKONSTRUIERENDE ECKWERTE BISHER

46. Als Eckwerte der rekonstruierenden Interpretation gilt bislang die Unterscheidung vom (i) ‚wissenden System‘ S in einer (ii) umgebenden realen Welt W und der Fähigkeit des wissenden Systems, (iii) bestimmte Ereignisse X der realen Welt W über einen Verarbeitungsprozess $latex \lambda$ in einen (iv) internen Bedeutungsraum M zu übersetzen. Parallel zum Bedeutungsraum M gibt es (v) eine Menge von Ausdrücken E, die (vi) auf unterschiedliche Weise mit dem Bedeutungsraum E innerhalb einer gewussten Beziehung $latex K \subseteq E \times M$ verknüpft werden können. Im Bereich des Bedeutungsraumes M kann (vii) unterschieden werden zwischen ‚aktuellen‘ Bedeutungsrepräsentationen M_now, die von aktuellen Ereignissen X der realen Welt verursacht sind, und ‚zeitlosen‘ Bedeutungsrepräsentationen M_0, mit $latex M_{now} \cap M_{0} = \emptyset, M_{now} \subseteq M, M_{0} \subseteq M$. Der Unterschied zwischen $latex M_{now}, M_{0}$ bezieht sich auf die zeitliche Komponente T in $latex M_{now}, M_{0}$. Würde man die zeitliche Komponente T aus $latex M_{now}$ ‚herausrechnen (also etwa $latex M_{now0} = M_{now} – T$), dann könnten die beiden Mengen $latex M_{now}, M_{0}$ gemeinsame Elemente enthalten ($latex M_{now0} \cap M_{0} \neq \emptyset$ ). Dies bedeutet, dass die charakterisierenden Eigenschaften der Objekte in $latex M_{now*}, M_{0}$ wissensmäßig ‚gleich‘ sein können. Durch (viii) Vergleich von Elementen aus M_now0 und M_0 kann dann entschieden werden, ob es der Fall ist, dass Elemente aus M_0 in M_now vorkommen oder nicht; falls sie vorkommen, dann ist eine feststellende (affirmative oder negative) Aussage ‚wahr‘, ansonsten ‚falsch‘.

REKONSTRUKTION: AFFIRMATIV – NEGATIV

47. Schon bei den von Avicenna angeführten Beispielen und deren Diskussion wird deutlich, dass eine gewisse Unklarheit darüber existiert, wie ’negative Ausdruckselemente‘ (wie z.B. ’nicht‘, ‚ohne‘) innerhalb des Begriffspaares ‚affirmativ/ negativ‘ zu bewerten sind. Zwar macht Avicenna darauf aufmerksam, dass das ‚Fehlen von etwas‘ eine Eigenschaft sein kann, die man ja gerade – affirmativ — aussagen möchte, aber es fehlt letztlich ein hartes Kriterium, wann das ‚Fehlen‘ von etwas nur ein ‚Ausdruckselement‘ ist oder ein ’semantischer Tatbestand‘, der ‚oberhalb‘ der Ausdruckselemente liegt, also wo es gerade das ‚Fehlen von etwas‘ ist, das man aussagen will.
48. In dieser Rekonstruktion wird davon ausgegangen, dass jede Aussage – entsprechend den Aussagen von Avicenna – entweder ‚wahr‘ oder ‚falsch‘ ist. Dies setzt voraus, dass jede Aussage als solche ‚grundsätzlich affirmativ‘ ist, sie will etwas über ein Subjekt aussagen. Für diese Aussage wird ein Ausdruck e generiert (in der Regel mit mehreren Teilausdrücken, mindestens Subjekt und Prädikat), der einen Sachverhalt m_p mittels des Prädikats über ein Subjekt m_s behauptet. Innerhalb der Aussage e kann der Sachverhalt m_p sowohl ‚zusprechend‘ (affirmativ) im Sinne von ‚ist ein…’/ ‚hat …‘ sein oder absprechend, negierend ‚ist nicht …‘, ‚hat nicht …‘ usw. Unabhängig davon ob die kombinierten Sachverhalte (m_s, m_p) ‚zusprechend‘ oder ‚absprechend‘ sind, können sie ‚wahr‘ (in der realen Welt W zutreffend) oder ‚falsch‘ (in der realen Welt W nicht zutreffend) sein.
49. Während die Frage von ‚wahr’/ ‚falsch‘ eine rein semantische Angelegenheit ist, die durch die simultane wissensmäßige Unterscheidung von ’nur gewusst/ gedacht/ vorgestellt/ erinnert/ im Sinne von $latex M_{0}$ einerseits und ‚als aktuell wahrgenommen gewusst‘ im Sinne von $latex M_{now}$ möglich ist, hängt die Unterscheidung von ‚affirmativ/ negativ‘ davon ab, ob es Ausdruckselemente gibt, die explizit so vereinbart sind, dass sie in einem S-P-Urteilszusammenhang als ‚zusprechend‘ oder ‚absprechend‘ identifiziert werden können. Wenn niemand weiß, dass ’nicht‘ in der Deutschen Sprache eine ‚Verneinung‘ darstellt, kann auch kein ‚Absprechen von etwas‘ erkennen. Wenn jemand aber weiß, dass mit dem Ausdruckselement ’nicht‘ etwas verneint wird, dann weiß er aufgrund der Aussagensemantik, dass der Ausdruck ‚ist nicht sterblich‘ eben die Verneinung von ‚ist sterblich‘ ist (unabhängig von ‚wahr‘ und ‚falsch‘). Und da die Bedeutung der Verneinung an den Ausdruck ’nicht‘ geknüpft ist, wird diese Bedeutung jedes mal aktiviert, wenn das Ausdruckselement ’nicht‘ auftritt: ‚ist nicht sterblich‘, ‚ist nicht nicht sterblich‘, ‚es gilt nicht, dass Zid nicht unsterblich ist‘, usw. Allerdings sind die Konventionen in jeder Sprache unterschiedlich, wie das Auftreten von negierenden Ausdruckselementen vorzunehmen ist (während im Deutschen eine Häufung wie ’nicht nicht‘ in Grenzfällen noch gehen mag, geht ’nicht nicht nicht‘ normalerweise nicht mehr. Darüber hinaus gibt es zahllose andere Ausdruckselemente (wie z.B. ‚kein(e), mit, ohne, haben, …), die auch negierende Funktionen übernehmen können.
50. Ein Ausdruck wie (Zid (ist ohne Sicht)), bedeutungsmäßig äquivalent etwa zu zu (Zid (hat keine Sicht)) oder (Zid (kann nicht sehen)), sagt affirmativ ein Fehlen aus. Ob dies während der Aussage in der realen Welt zutrifft (= wahr) oder nicht (=falsch), folgt aus der Aussage selbst nicht.
51. Eine Verneinung dieser Aussagen geschieht zunächst auf der Ausdrucksebene, und dann kann man den so konstruierten Sachverhalt bzgl. Wahrheit oder Falschheit bewerten.
52. Es hängt von geltenden Konventionen ab, wie man die Verneinung der Aussage (Zid (ist ohne Sicht)) auf der Ausdrucksebene realisiert. Eine Möglichkeit besteht darin, auf einer Metaebene zu sagen, ‚Die Aussage (Zid (ist ohne Sicht)) trifft nicht zu. Dies würde primär aber meinen, dass diese Aussage in der realen Welt W nicht zutrifft. Würde man die interne Struktur der Aussage (Zid (ist ohne Sicht)) ändern, dann würde man eine neue Aussage schaffen, von der man wiederum fragen kann, ob sie in der realen Welt W zutrifft oder nicht. Also man könnte natürlich formulieren (Zid (ist nicht ohne Sicht)); damit würde man verneinen, dass Zid ohne Sicht sei, also eine Verneinung der vorhergehenden Aussage. Aber auch diese neuerliche Verneinung wäre grundsätzlich eine Affirmation, nämlich etwas, was man über Zid Aussagen will.
53. Die rekonstruierende Hypothese lautet also: jeder Ausdruck e vom Typ Aussage PROP impliziert die Affirmation eines Sachverhaltes m_p über ein Subjekt m_s unabhängig davon, wie viele Negationen/ Verneinungen der Ausdruck e enthält. Eine so realisierte affirmative Aussage zu (m_s, m_p) kann wahr oder falsch sein.

EXISTENZ

54. Das von Avicenna nur kursorisch erwähnte Moment der Existenz ist in der aktuell rekonstruierenden Interpretation gegeben durch die Annahme der umgebenden realen Welt W, deren aktuelle induzierten Bedeutungsrepräsentationen M_now als Bezugspunkt für die Charakterisierungen wahr/ falsch genutzt werden kann. In diesem Rahmen können beliebige Aussagen gebildet werden ,unabhängig davon, ob sie aktuell wahr/ falsch sind.

MÖGLICH

55. Die Kategorie ‚möglich‘ ist durch die bloße Angabe ‚kann existieren und kann nicht existieren‘ kaum erklärt. Zu sagen, dass ein B über ein gegebenes/ bekanntes A ‚hinausgeht‘, setzt eigentlich voraus, dass man die Ereignisse X der realen Welt W zunächst mal überhaupt als ‚exstierend‘ erkennen kann $latex \lambda(X)$ , so dass dann relativ zu diesem Wissen $latex \lambda(X)$ ein anderes Element Y als ’neu‘ oder als ‚möglich‘ explizit gedacht werden könnte. Wir wissen vom menschlichen Denken, dass wir uns allerlei Dinge als M_0 ‚vorstellen‘, ‚denken‘, ‚träumen‘ … können, von denen zum Zeitpunkt des Vorstellens nicht bekannt ist, ob sie sich genauso auch ereignen werden. Bei einigen dieser Vorstellungen M_0* haben wir ein zusätzliches Wissen K*, aufgrund dessen wir aus der Vergangenheit wissen, dass sie mit einer gewissen Wahrscheinlichkeit eintreten können; von daher räumen wir diesen mittels K* als ‚eintretbar‘ klassifizierten Vorstellungen M_0* eine gewisse Möglichkeit ein. Bei anderen Vorstellungen $latex M_{X} = M_{0} – M_{0*}$ ist es uns weniger bis gar nicht klar, ob sie eintreten können, da das zugehörige Wissen K_X zu schwach ist.

QUNATITÄT – QUANTOREN

56. Im Kontext der schon zuvor erwähnten Begriffe ‚universell‘ und ‚partikulär‘ führt Avicenna nun den Gedanken der ‚Bestimmtheit’/ ‚Unbestimmtheit‘ ein und entwickelt daraus die Idee der Quantität in Gestalt von Quantoren.
57. Dies führt zu der grundsätzlichen Erweiterung (Q,S,P), d.h. das Zutreffen eines Sachverhaltes m_p wird nicht mehr nur für ein Subjekt S allgemein behauptet, sondern das Objekt m_s, das bedeutungsmäßig ein Subjekt fundiert, wird bezüglich seiner Quantität Q weiter spezifiziert als ‚Alle/ Jeder‘, ‚Nicht Alle/Einige‘, ‚Alle – nicht/ Keine(r)‘.
58. Bei der konkreten Angabe der sich daraus ergebenden möglichen Klassen kommt es aber dann bei Avicenna zu Unklarheiten, da er bei dieser Einteilung sein Begriffspaar ‚affirmativ/ negativ‘ benutzt, von dem wir zuvor gesehen haben, dass es möglicherweise ‚fehlerhaft‘ ist, da er den Begriff ‚affirmativ‘ und ’negativ‘ auf die gleiche semantische Stufe stellt. Wie zuvor aber schon festgestellt worden ist, muss man diese beiden Begriffe trennen. Wenn Avicenna z.B. die beiden ersten Typen seiner Aussagen klassifiziert als
59. Typ 1: Subjekt = Alle, Affirmativ (Bsp.: Q=[(Jeder)]S=[(Mensch)]P=[(ist)(ein)(Lebewesen)] oder Q=[(Jeder)]S=[(Mensch)]P=[(ist)(sterblich)]
60. Typ 2: Subjekt = Alle, Negativ (Bsp.: Q=[(Kein)]S=[(Mensch)]P=[(ist)(sterblich)](?)
61. dann ist die Charakterisierung von Typ 1 nachvollziehbar, von Typ 2 aber nicht. Von der Idee her soll in Typ 2 gezeigt werden, wie die Negation von Typ 1 beschaffen ist. In Typ 1 wird (affirmativ) behauptet, dass jeder Mensch ein Lebewesen ist bzw. sterblich ist. Im Typ 2 soll auch etwas (affirmativ) behauptet werden, nämlich dass ’nicht alle‘ Menschen Lebewesen sind bzw. sterblich sind. D.h. die Aussagen vom Typ 2 sind grundsätzlich weiterhin ‚affirmativ‘, es wird aber in ihrem Ausdruck ein zusätzliches verneinendes Ausdruckselement – hier ’nicht‘ – eingeführt, so dass der Sachverhalt, der affirmativ behauptet werden soll, ein zusätzliches verneinendes Element enthält. Daraus würde sich ergeben:
62. Typ 2b Q=[(Nicht alle)]S=[(Menschen)]P=[(sind)(sterblich)], was man umformen könnte zu Q=[(Einige)]S=[(Menschen)]P=[(sind)(nicht)(sterblich)].
63. Aus (nicht alle) folgt nicht (keine), wie bei Avicenna, sondern (einige).
64. Auch im Beispiel der Verneinung von ‚einige‘ kommt es bei Avicenna zu Unklarheiten:
65. Typ 3: Subjekt = Einige, Affirmativ Q=[(Einige)]S=[(Mensch)]P=[(sind)(Schriftsteller)]
66. Typ 4: Subjekt = Einige, Negativ Q=[(Nicht alle)]S=[(Mensch)]P=[(sind)(Schriftsteller)] (?)
67. Im Fall von Typ 4 geht es um die (affirmative) Behauptung, dass ’nicht einige‘ gemeint sind. Aus ’nicht einige‘ folgt aber nicht – wie bei Avicenna – ’nicht alle‘, sondern ‚(alle …. nicht…), d.h.
68. Typ 4b: Q=[(Nicht einige)]S=[(Mensch)]P=[(sind)(Schriftsteller)] kann umgeformt werden zu Q=[(Alle)]S=[(Mensch)]P=[(sind)(nicht)(Schriftsteller)]
69. Daraus folgt, dass eine Klassifikation nicht nach dem Muster (Q -affirmativ) und (Q – negativ) vorgenommen werden sollte, sondern nach dem Muster, alle Aussagen sind ‚affirmativ‘; innerhalb dieser Menge kann man verschiedene Quantoren unterscheiden (alle) bzw. (einige), und diese Quantoren sind entweder nicht verneint oder verneint. Das würde folgendes Schema ergeben:
70. Typ 1: Q=’alle‘
71. Typ 2b: Q='(nicht)(alle)‘ bzw. $latex (\neg)(Q)$ ist äquivalent zu Q=(einige),S,($latex \neg$),P).
72. Typ 3: Q=’einige‘
73. Typ 4b: Q='(nicht)(einige)‘ bzw. $latex (\neg)(Q)$ ist äquivalent zu Q=(alle),S,($latex \neg$),P).
74. Das von Avicenna formulierte ‚Metaprinzip‘: ‚Wenn eine Aussage über ‚Alle‘ spricht, dann ist es unsicher, ob wirklich alle gemeint sind; sicher ist es aber, dass wenigstens ‚einige‘ gemeint sind‘, muss auch hinterfragt werden. Würde sein Metaprinzip gelten, dann könnte man keine wirklichen ‚All-Aussagen‘ mehr machen, da grundsätzlich die intendierte Bedeutung von ‚alle‘ verneint würde. Dies macht keinen Sinn. Wenn jemand tatsächlich ‚alle‘ meint und dies ausdrücken will, dann muss der dazu vereinbarte Ausdruck ‚alle‘ auch entsprechend verwendet werden.
75. Die von Avicenna vorgenommene Fallunterscheidungen (von mir abgekürzt ‚+‘ für ‚affirmativ‘, ‚-‚ für negativ‘, ‚1‘ für ‚partikulär‘, ‚0‘ für ‚unbestimmt‘ und ‚a‘ für universell‘) der Art:
76. (+,1)
77. (-,1)
78. (0,+)
79. (0,-)
80. (a,+)
81. (a,-)
82. (1,+)
83. (1,-)
84. leidet an der gleichen Schwäche, wie schon zuvor bei der Diskussion seiner vier Quantorentypen, hier verstärkt um sein falsches Metaprinzip. Klammert man ‚affirmativ‘ als Einteilungskriterium aus, da dies auf alle Typen zutrifft, bleiben nur die beiden Quantoren und deren Verneinung:
85. Q=’alle‘,S,P
86. Q=(nicht)(alle),S,P $latex \leftrightarrow $ Q=(einige),S,(nicht),P
87. Q=’einige‘,S,P
88. Q=(nicht)(einige),S,P $latex \leftrightarrow $ Q=(alle),S,(nicht),P
89. Wollte man den umgangssprachlichen Quantor ‚keiner‘ benutzen, könnte man diesen über Typ 4b definieren: Q=’kein(er)‘,S,P $latex \leftrightarrow$ Q=(alle),S,($latex \neg$),P).

Fortsetzung folgt …

QUELLEN

  • Avicenna, ‚Avicennas Treatise on Logic‘. Part One of ‚Danesh-Name Alai‘ (A Concise Philosophical Encyclopedia) and Autobiography, edited and translated by Farang Zabeeh, The Hague (Netherlands): Martinus Nijhoff, 1971. Diese Übersetzung basiert auf dem Buch ‚Treatise of Logic‘, veröffentlicht von der Gesellschaft für Nationale Monumente, Serie12, Teheran, 1952, herausgegeben von M.Moien. Diese Ausgabe wiederum geht zurück auf eine frühere Ausgabe, herausgegeben von Khurasani.
  • Digital Averroes Research Environment
  • Stanford Encyclopedia of Philosophy, Aristotle’s Logic
  • Whitehead, Alfred North, and Bertrand Russell, Principia Mathematica, 3 vols, Cambridge University Press, 1910, 1912, and 1913; Second edition, 1925 (Vol. 1), 1927 (Vols 2, 3). Abridged as Principia Mathematica to *56, Cambridge University Press, 1962.
  • Alfred North Whitehead; Bertrand Russell (February 2009). Principia Mathematica. Volume One. Merchant Books. ISBN 978-1-60386-182-3.
  • Alfred North Whitehead; Bertrand Russell (February 2009). Principia Mathematica. Volume Two. Merchant Books. ISBN 978-1-60386-183-0.
  • Alfred North Whitehead; Bertrand Russell (February 2009). Principia Mathematica. Volume Three. Merchant Books. ISBN 978-1-60386-184-7

Eine Übersicht über alle bisherigen Blogeinträge nach Titeln findet sich HIER.

CARTESIANISCHE MEDITATIONEN III, Teil 7

Journal: Philosophie Jetzt – Menschenbild, ISSN 2365-5062, 25.Dezember  2011
URL: cognitiveagent.org
Email: info@cognitiveagent.org

Autor: Gerd Doeben-Henisch
Email: gerd@doeben-henisch.de

(99) Auf den letzten Seiten der Pariser Vorlesung(en) führt Husserl seine ganzen Überlegungen nochmals verstärkt zusammen und er kommt darin zu Formulierungen, die der Autor dieses Kommentars grenzwertig findet; grenzwertig, da man das Gefühl nicht los wird, dass Husserl hier weniger als der kühle, analysierende Philosoph spricht (schreibt), sondern als ein Redner unter Erwartungsdruck, der zugleich eine ‚philosophie-politische‘ Position –nämlich die einer Phänomenologie– zu vertreten hat, von der die Welt –salopp formuliert– erwartet, dass sie ihre Probleme löst. Vielleicht ist diese Interpretation zu stark, vielleicht tut man Husserl damit sogar Unrecht, aber die sehr emphatischen Formulierungen, in denen er zudem Dinge zusammenführt, die zuvor nicht wirklich sauber analysiert worden sind, erzeugen einen ‚Unterton‘ im Text, den man schwerlich ‚überhören‘ kann.

(100) Nach der Kritik am alltäglich und positiv-wissenschaftlichen naiven Denken schreibt er: ‚Es gibt aber nur eine radikale Selbstbesinnung, das ist die phänomenologische. Radikale und völlig universale Selbstbesinnung ist aber untrennbar, und zugleich völlig untrennbar von der phänomenologischen Methode der Selbstbesinnung in Form der Wesensallgemeinheit. Universale und wesensmäßige Selbstauslegung besagt aber Herrschaft über alle dem ego und seiner transzendentalen Intersubjektivität eingeborenen idealen Möglichkeiten.‘ (vgl. CM2, S37, Z8 -15)

(101) Zu sagen, dass radikale Selbstbesinnung in sich ‚untrennbar‘ ist, erscheint nach den bisherigen Analysen plausibel. Dass die hier einschlägige Methode auf jeden Fall (= untrennbar) die phänomenologische Methode sei, ist anhand der (informellen) Definition von phänomenologischer Methode verständlich. Dass die Selbstbesinnung notwendigerweise in ‚Form von Wesensallgemeinheiten‘ stattfindet, ist dagegen nur bedingt war. Selbstbesinnung erlaubt die Auffassung von allem, was sich im Wissen-um vorfindet; die möglichen Allgemeinheiten sind nur ein Teil davon. Doch ist offensichtlich genau dieser Teil für Husserl an dieser Stelle wichtig, denn hier hebt er dann nochmals ab auf den Punkt, dass eine ‚wesensmäßige Selbstauslegung‘ ‚Herrschaft‘ bedeuten kann, Herrschaft über ‚alle eingeborenen idealen Möglichkeiten‘. Lassen wir den verräterischen Terminus ‚Herrschaft‘ für einen Moment auf der Seite.

(102) Aufmerken lässt der Überstieg von ‚Wesensallgemeinheiten‘ zu ‚allen eingeborenen idealen Möglichkeiten‘. Streng genommen sind die Termini ‚eingeboren‘ und ‚ideal‘ im Rahmen seiner Phänomenologie nicht wirklich definiert (wobei Husserl keinen einzigen Terminus im strengen Sinne definiert; er nutzt alle Termini immer nur ‚informell‘, beiläufig, im Kontext alltäglichen Redens, über dessen Geltungsbedingungen er sich nirgends Rechenschaft gibt).

(103) Wenn ‚phänomenologisch‘ heißt, das Gegebene aufzunehmen, dann wäre ein Terminus wie ‚eingeboren‘ nur möglich, wenn damit etwas Gegebenes gemeint ist, dem eine Eigenschaft anhaftet, anhand deren ich dieses Gegebene von anderem Gegebenen unterscheiden kann, und zwar z.B. die Eigenschaft ‚eingeboren‘ zu sein im Sinne von ‚dem Denken notwendig zugehörig‘ und sich darin unterscheidend von einem konkreten So-Seienden, das sich zwar auch im Denken vorfindet, aber nicht denknotwendig.

(104) In der Kombination von ‚eingeborenen … Möglichkeiten‘ wird es aber schwierig. ‚Möglichkeit‘ unterstellt ’normalerweise‘ die Verfügbarkeit von Alternativen in einem kombinatorischen Raum. Ein ‚kombinatorischer Raum‘ als solcher ist aber niemals eine phänomenologische Gegebenheit im primären Sinne. Er erschließt sich nur ‚im Denken‘, in einem ‚Prozess von verschiedenen Denkzuständen‘, die wiederum gepaart sind mit ‚Erinnerungsleistungen‘, durch die diese verschiedenen unterscheidbaren Zustände ‚zusammengehalten‘ werden. Sicher kommt solchen Denkprozessen samt ihrer ‚Vereinigung‘ mittels der Erinnerung eine gewisse Evidenz zu, aber diese Evidenz ist verglichen mit der primären phänomenologischen Evidenz des unmittelbar Gegebenen eine ‚abgeleitete‘ ’sekundäre‘ Evidenz, deren ‚Wahrheit‘ von der ‚Wahrheit der Denkübergänge‘ abhängt. In der normalen Denkerfahrung wissen wir, dass diese Übergänge –sobald sie erinnerungsabhängig sind– ‚falsch‘ sein können. Dass Husserl diese Problematik nicht sieht –oder zumindest nicht anspricht– erstaunt.

(105) Liegt die Rettung möglicherweise in dem zusätzlichen Terminus ‚ideal‘, wenn er von ‚eingeborenen idealen Möglichkeiten‘ spricht? Wie gesagt, ‚ideal‘ ist nirgends wirklich definiert. Nehmen wir an, Husserl meint damit auch etwas ‚Allgemeines‘ und damit etwas über das konkret So-Seiende Hinausweisendes, ein dem Denken zugehöriges Typisches und darin Denknotwendiges. Dann würde ‚eingeboren ideal‘ gemeinsam auf ein Denknotwendiges zielen, auf solche Möglichkeiten, die ‚denknotwendig‘ sind. Aber was ist ein ‚Mögliches‘, das ‚Notwendig‘ sein soll? Der Unterschied vom Möglichen zum Notwendigen ist ja normalerweise gerade, dass ein Mögliches sein kann, aber nicht sein muss. Ein ’notwendig Mögliches‘ wäre dann evtl. interpretierbar als ein Mögliches, das nicht sein muss, aber wenn es eintreten sollte, dann gibt es vorgegebene Formen, in denen es auftreten wird. Die ‚eingeborenen idealen Möglichkeiten‘ wären dann sozusagen die allgemeinen (idealen) Bedingungen des Auftretens von etwas, falls es auftritt.

(106) Mit dieser Interpretation der ‚eingeborenen idealen Möglichkeiten‘ wäre ein mögliches begriffliches Konstrukt gefunden, das ‚Denknotwendige‘ im Kontext des ‚Möglichen‘ zu denken, es fragt sich nur, was man damit gewonnen hat? Ist es wirklich realistisch, dass unser Denken seinen eigenen Möglichkeitsraum hinsichtlich allgemeingültiger Kriterien vollumfänglich abstecken kann (so wie ein Goldgräber seinen Claim früher markiert hatte, um dadurch seinen Besitzanspruch zu sichern)? Trifft es zu, dass wir das Allgemeine des Denkens nur anlässlich des Auftretens von irgendetwas ‚Gegebenem‘ erleben können durch die ‚Art und Weise‘, ‚wie‘ wir etwas erleben, dann wäre es zu keinem Zeitpunkt möglich, mit ‚absoluter‘ Sicherheit zu wissen, ob wir schon ‚alle‘ Arten des Denkens kennengelernt haben oder nur einen Teil, weil wir eben unserem Denken noch nicht Gelegenheit gegeben haben, ‚alle‘ seine ‚eingeborenen‘ Eigenschaften zu ‚zeigen‘. Als Denknotwendiges wäre solch ein Allgemeines des Denkens zwar ‚transzendental‘, aber ‚ob‘ es sich im Denken zeigt, das ist für das jeweilige Wissen ‚kontingent‘, weil das Denken nicht denken muss! Ich kann denken, ich muss aber nicht, ebenso: ein Etwas ‚kann‘ sich ereignen, es muss aber nicht. Das Denknotwendige steht damit auf einem ‚wackligen Grund‘. Im ‚Sein‘ zeigt es sich als etwas ‚Allgemeines‘, aber dieses Sein als solches ist kein notwendiges, es ist als erfahrbares Sein ein kontingentes Sein, bis hin zum trlS selbst!

(107) Außerdem können wir 82 Jahre nach Husserls Vorlesung wissen, dass aufgrund von fortgeschritteneren Denkoperationen das phänomenologische Wissen nur auffassen kann, was sich im Erleben zeigt. Was immer sich hier an allgemeinen Strukturen enthüllt, das phänomenologische Denken verbleibt letztlich in einer ‚passiven‘ Rolle des hinnehmenden Aufnehmens. In diesem Kontext das Wort ‚Herrschaft‘ zu benutzen, wie Husserl es tut, wirkt wie das Wort eines Süchtigen, der versucht seine Sucht mit beschönigenden Worten zu ‚verdecken‘. Das phänomenologische Wissen herrscht nicht, es nimmt passiv hin und versucht das sich darin Zeigende zu ’sortieren‘, versucht sich aus all diesen ‚Fragmenten‘ einen ‚Reim zu machen‘. Die Neurowissenschaften in Gestalt von Neuropsychologie, die evolutionäre Biologie und Psychologie sowie alle an der evolutionären Sicht beteiligten Wissenschaften haben Indizien zusammengetragen, die die Hypothese nahelegen, dass die allgemeinen Formen des Denkens (und darin eingeschlossenen auch die konkreten Qualitäten der So-Seiend-Gegebenen) Wirkungen von physiologischen Mechanismen des Körpers und des das Gehirn ‚einhüllenden‘ Körpers sind, der eine ‚Produkt‘ von mehr als 3 Milliarden Jahren ‚Konstruktionsprozess‘ ist. D.h. was immer wir überhaupt von Ereignissen in der Umgebung des Körpers erfassen können und wie wir es erfassen können, hängt ab von physiologischen Strukturen, in denen physikalische Energie hundertfach, tausendfach immer wieder umgeformt und korreliert wird, damit wir bestimmte Gegebenheiten in einer bestimmten Weise erleben können. So wenig das originäre phänomenologische Erleben und Denken durch die anderen Disziplinen ersetzt werden kann, so wenig kann das phänomenologische Denken alleine, ganz für sich genommen, zu letzten Klarheiten und allgemeinen Erkenntnissen führen, die über seinen individuellen Reflexionsprozess hinausweisen.

(108) Um die Bedeutung des individuell Erkannten für ein ‚größeres Ganzes‘ sichtbar machen zu können, muss das phänomenologische Denken Strukturelemente wie z.B. ‚einzelnes individuelles Bewusstsein‘, ‚fremdes Bewusstsein‘, ‚Körper‘, ‚Außenwelt‘ usw. in einem konsistenten Zusammenhang explizieren, um den –möglicherweise unterschiedlich geltenden– verschiedenen Wissensformen einen logischen Zusammenhang zu geben, der es erlaubt, ihre Aussagen wechselseitig zu beziehen, um damit einen ‚je größeren‘ Zusammenhang sichtbar zu machen. Dies wäre keine neue Art von Philosophie, sondern die Anwendung des phänomenologischen Denkens auf alle heute verfügbare Wissensformen, einschließlich der sogenannten ‚empirischen Wissenschaften‘.

(109) Die empirischen Wissenschaften fallen nicht aus dem Rahmen des phänomenologischen Wissens heraus (!!!), sondern sie definieren sich selbst als ein Teilbereich innerhalb (!!!) des phänomenologischen Denkens. Leider hat die phänomenologische Philosophie bislang ihre Energie darauf verschwendet, diese Form phänomenologischen Denkens eher zu ‚verteufeln‘ anstatt die hier vorliegenden Eigenheiten zu reflektieren und unter Berücksichtigung dieser Eigenheiten diese in das größere Ganze zu ‚integrieren‘.

(110) Terme wie ‚Herrschaft‘ ausüben mögen nichts Besonderes bedeuten, sie können aber ‚Indizien‘ sein für ein tieferliegendes ‚psychologisches‘ Motiv des ‚Herrschen‘, sprich ‚Kontrollieren Wollens‘, das dem Ideal philosophischen Erkennens letztlich fremd ist. Dieses ‚Herrschen Wollen‘ hat natürlich –wie immer im historischen Leben– mehr Chancen auf Erfolg, wenn ich all das ‚ausgrenze‘, was sich meiner Kontrolle möglicherweise widersetzen könnte. Empirisches Wissen hat diese Eigenschaft, eine vollständig umfassende Kontrolle zu verhindern, falsche Allmachtsansprüche zu entlarven, Denknotwendiges als dann letztlich doch ‚kontingentes Denken‘ erscheinen zu lassen, usw. Kontrollbedürfnis und narzistische Momente einer individuellen Psyche sind immer gefährdet, sich ein ’sperriges Ganzes‘ so ‚zurecht‘ zu schneiden, dass es möglichst ‚pflegeleicht‘ wird, so eine Art ‚Philosophie der sauberen Denkräume‘, Philosophie als ‚persönlicher Besitzt des jeweiligen Philosophen‘, und dergleichen mehr. Ob und wieweit solche Momente bei Husserl unterstellt werden können (oder müssten), soll hier nicht entschieden werden. Die von ihm gelieferten Indizien in Richtung kontrollierende Herrschaft und Ausgrenzung des widerspenstigen Empirischen sollten aber auf jeden Fall notiert werden.

(111) Fassen wir (vorläufig) zusammen, Husserls Formulierung von der ‚Herrschaft über alle dem ego … eingeborenen idealen Möglichkeiten.‘ (vgl. CM2, S37, Z8 -15) erscheint schon für den Bereich des individuellen Bewusstseins problematisch. In der vollständigen Formulierung kommt aber auch das ‚Intersubjektive‘ vor: ‚Herrschaft über alle dem ego und seiner transzendentalen Intersubjektivität …‘. (vgl. CM2, S37, Z8 -15) Hatten wir zuvor schon angemerkt, dass der Ausweis des transzendentalen Charakters der Intersubjektivität, so wie Husserl sie beschrieben hat, in keiner Weise überzeugen kann, so wirft die fraglose Einbeziehung des Terminus ‚Intersubjektivität‘ in den transzendentalen Status des transzendentalen ego alle die zuvor gestellten Fragen wieder neu auf. Hier nun verstärkt durch den Kontext, dass die denknotwendigen Eigenschaften alles Möglichen auch für das Intersubjektive so erkannt werden können, dass sie im Denken ‚beherrscht‘, sprich ‚kontrolliert‘ werden können.

(112) Nun hat Husserl –wie bei allen anderen wichtigen Termen– es versäumt, sauber zu erklären, was er genau unter dem ‚Intersubjekiven‘ versteht. Am Beispiel des ‚alter ego‘ sprach er von einer ‚Ähnlichkeitsapperzeption‘, die ‚miterfahren‘ wird, ‚konsequent indiziert, sich dabei einstimmig bewährend‘.( vgl. CM2, S.35, Z9-11) Eine Erklärung kann man dies nicht nennen, eine Definition auch nicht, außerdem ist es beschränkt auf einen Teilaspekt von Intersubjektivität. Eine ernsthafte Diskussion darüber, ob und wieweit also die vorausgehenden Aussagen über die Herrschaft im Kontext des Intersubjektiven zutreffen oder nicht, erscheint mir von daher kaum möglich.

(113) Trotz der Schwierigkeiten der Auslegungen im Detail ist erkennbar, dass Husserl auf den letzten 2-3 Seiten versucht, der Vision einer ‚universalen Philosophie‘ trotz aller noch bestehenden methodischen Problemen Namen und Struktur zu verleihen. Sich abgrenzend gegenüber ‚positiven Wissenschaften in der Weltverlorenheit‘ auf der einen Seite sowie von den  ‚universalen Systemen deduktiver Theorie‘ auf der anderen Seite sieht er den wahren Weg einer letztbegründeten (philosophischen) Erkenntnis in einer ‚universalen Selbsterkenntnis, zunächst einer monadischen, dann einer intermonadischen.‘ (vgl. CM2, S.39, Z12-25) Dieses Konzept schliesst für Husserl nicht aus, dass es unterschiedliche ‚phänomenologische Disziplinen‘ geben kann, die untereinander ‚korreliert sind‘. (vgl. CM2, S39, Z17f)

Zur Fortsetzung siehe CM3, Teil 8.

ÜBERSICHT: Eine Übersicht über alle Blog-Beiträge nach Themen findet sich HIER