Connectionism

Connectionism ist eine Reihe von Annäherungen in den Feldern von künstlicher Intelligenz, kognitiver Psychologie, Erkenntnistheorie, neuroscience und Philosophie der Meinung, dass Modelle geistige oder Verhaltensphänomene als die auftauchenden Prozesse von miteinander verbundenen Netzen von einfachen Einheiten. Es gibt viele Formen von connectionism, aber die meisten Standardformen verwenden Nervennetzmodelle.

Kernprinzipien

Der connectionist Hauptgrundsatz ist, dass geistige Phänomene durch miteinander verbundene Netze von einfachen und häufig gleichförmigen Einheiten beschrieben werden können. Die Form der Verbindungen und der Einheiten kann sich vom Modell bis Modell ändern. Zum Beispiel konnten Einheiten im Netz Neurone vertreten, und die Verbindungen konnten Synapsen vertreten.

Das Verbreiten der Aktivierung

In den meisten connectionist Modellen ändern sich Netze mit der Zeit. Ein nah zusammenhängender und sehr allgemeiner Aspekt von connectionist Modellen ist Aktivierung. Jederzeit hat eine Einheit im Netz eine Aktivierung, die ein numerischer Wert ist, der beabsichtigt ist, um etwas Aspekt der Einheit zu vertreten. Zum Beispiel, wenn die Einheiten im Modell Neurone sind, konnte die Aktivierung die Wahrscheinlichkeit vertreten, dass das Neuron eine Handlungspotenzial-Spitze erzeugen würde. Wenn sich die Aktivierung zu allen anderen damit verbundenen Einheiten ausbreitet. Das Verbreiten der Aktivierung ist immer eine Eigenschaft von Nervennetzmodellen, und es ist in connectionist von kognitiven Psychologen verwendeten Modellen sehr üblich.

Nervennetze

Nervennetze sind bei weitem das meistens verwendete connectionist Modell heute. Obwohl es eine große Vielfalt von Nervennetzmodellen gibt, folgen sie fast immer zwei Kernprinzipien bezüglich der Meinung:

  1. Jeder geistige Staat kann als (N) - dimensionaler Vektor von numerischen Aktivierungswerten über Nerveneinheiten in einem Netz beschrieben werden.
  2. Gedächtnis wird durch das Ändern der Kraft der Verbindungen zwischen Nerveneinheiten geschaffen. Die Verbindungskräfte oder "Gewichte", werden allgemein als (N×N) - dimensionale Matrix vertreten.

Der grösste Teil der Vielfalt unter Nervennetzmodellen kommt her:

  • Interpretation von Einheiten: Einheiten können als Neurone oder Gruppen von Neuronen interpretiert werden.
  • Definition der Aktivierung: Aktivierung kann in einer Vielfalt von Wegen definiert werden. Zum Beispiel, in einer Maschine von Boltzmann, wird die Aktivierung als die Wahrscheinlichkeit interpretiert, eine Handlungspotenzial-Spitze zu erzeugen, und wird über eine logistische Funktion auf der Summe der Eingänge zu einer Einheit bestimmt.
  • Das Lernen des Algorithmus: Verschiedene Netze modifizieren ihre Verbindungen verschieden. Im Allgemeinen wird jede mathematisch definierte Änderung in Verbindungsgewichten mit der Zeit den "Lernalgorithmus" genannt.

Connectionists sind in Übereinstimmung, dass wiederkehrende Nervennetze (Netze, worin Verbindungen des Netzes einen geleiteten Zyklus bilden können) ein besseres Modell des Gehirns sind als feedforward Nervennetze (Netze ohne geleitete Zyklen). Viele wiederkehrende connectionist Modelle vereinigen auch dynamische Systemtheorie. Viele Forscher, wie der connectionist Paul Smolensky, haben behauptet, dass sich connectionist Modelle zu völlig dauernden, hoch-dimensionalen, nichtlinearen, dynamischen Systemannäherungen entwickeln werden.

Biologischer Realismus

Der Nervennetzzweig von connectionism weist darauf hin, dass die Studie der Geistestätigkeit wirklich die Studie von Nervensystemen ist. Das verbindet connectionism mit neuroscience, und Modelle schließen unterschiedliche Grade des biologischen Realismus ein. Die Arbeit von Connectionist im allgemeinen braucht nicht biologisch realistisch zu sein, aber einige Nervennetzforscher, rechenbetonter neuroscientists, versuchen, die biologischen Aspekte von natürlichen Nervensystemen sehr nah im so genannten "neuromorphic Netze" zu modellieren. Viele Autoren finden, dass die klare Verbindung zwischen der Nerventätigkeit und dem Erkennen ein ansprechender Aspekt von connectionism ist. Das ist als reductionist kritisiert worden.

Das Lernen

Connectionists betonen allgemein die Wichtigkeit vom Lernen in ihren Modellen. So haben connectionists viele hoch entwickelte Lernverfahren für Nervennetze geschaffen. Das Lernen ist immer mit dem Ändern der Verbindungsgewichte verbunden. Im Allgemeinen schließen diese mathematische Formeln ein, um die Änderung in Gewichten wenn gegeben Sätze von Daten zu bestimmen, die aus Aktivierungsvektoren für eine Teilmenge der Nerveneinheiten bestehen.

Durch das Formalisieren des Lernens auf solche Art und Weise haben connectionists viele Werkzeuge. Eine sehr allgemeine Strategie in connectionist das Lernen von Methoden ist, Anstieg-Abstieg über eine Fehleroberfläche in einem durch die Gewicht-Matrix definierten Raum zu vereinigen. Der ganze Anstieg-Abstieg, der in connectionist Modellen erfährt, schließt das Ändern jedes Gewichts durch die partielle Ableitung der Fehleroberfläche in Bezug auf das Gewicht ein. Rückübertragung, zuerst gemacht populär in den 1980er Jahren, ist wahrscheinlich der meistens bekannte connectionist Anstieg-Abfallalgorithmus heute.

Geschichte

Connectionism kann zu Ideen mehr als ein alte Jahrhundert verfolgt werden, die ein wenig mehr waren als Spekulation bis zur Mitte-zu-spät des 20. Jahrhunderts. Erst als die 1980er Jahre, dass connectionism eine populäre Perspektive unter Wissenschaftlern geworden ist.

Parallele hat Verarbeitung verteilt

Das Vorherrschen connectionist Annäherung war heute als Parallele hat Verarbeitung verteilt (PDP) ursprünglich bekannt. Es war eine künstliche Nervennetzannäherung, die die parallele Natur der Nervenverarbeitung und die verteilte Natur von Nervendarstellungen betont hat. Es hat ein allgemeines mathematisches Fachwerk für Forscher zur Verfügung gestellt, um darin zu funktionieren. Das Fachwerk hat acht Hauptaspekte eingeschlossen:

  • Eine Reihe von in einer Prozession gehenden Einheiten, die durch eine Reihe von ganzen Zahlen vertreten ist.
  • Eine Aktivierung für jede Einheit, die durch einen Vektoren von zeitabhängigen Funktionen vertreten ist.
  • Eine Produktionsfunktion für jede Einheit, die durch einen Vektoren von Funktionen auf den Aktivierungen vertreten ist.
  • Ein Muster der Konnektivität unter Einheiten, die durch eine Matrix von reellen Zahlen vertreten sind, die Verbindungskraft anzeigen.
  • Eine Fortpflanzungsregel, die die Aktivierungen über die Verbindungen ausbreitet, die durch eine Funktion auf der Produktion der Einheiten vertreten sind.
  • Eine Aktivierungsregel, um Eingänge zu einer Einheit zu verbinden, um seine neue Aktivierung zu bestimmen, die durch eine Funktion auf der aktuellen Aktivierung und Fortpflanzung vertreten ist.
  • Eine Lernregel, um Verbindungen zu modifizieren, die auf der Erfahrung gestützt sind, die durch eine Änderung in den Gewichten vertreten ist, auf jeder Zahl von Variablen gestützt.
  • Eine Umgebung, die das System mit der Erfahrung versorgt, die durch Sätze von Aktivierungsvektoren für eine Teilmenge der Einheiten vertreten ist.

Diese Aspekte sind jetzt das Fundament für fast alle connectionist Modelle. Eine wahrgenommene Beschränkung von PDP ist, dass es reductionistic ist. D. h. alle kognitiven Prozesse können in Bezug auf die Nervenzündung und Kommunikation erklärt werden.

Viel von der Forschung, die zur Entwicklung von PDP geführt hat, wurde in den 1970er Jahren getan, aber PDP ist populär in den 1980er Jahren bei der Ausgabe der Buchparallele Verteilte Verarbeitung geworden: Erforschungen in der Mikrostruktur des Erkennens - Band 1 (Fundamente) und Band 2 (Psychologische und Biologische Modelle), durch James L. McClelland, David E. Rumelhart und PDP Research Group. Die Bücher werden jetzt als Samenconnectionist-Arbeiten betrachtet, und es ist jetzt üblich, PDP und connectionism völlig auszugleichen, obwohl der Begriff "connectionism" in den Büchern nicht gebraucht wird.

Frühere Arbeit

Die direkten Wurzeln von PDP waren die perceptron Theorien von Forschern wie Frank Rosenblatt von den 1950er Jahren und den 1960er Jahren. Aber Perceptron-Modelle wurden sehr unpopulär durch das Buch Perceptrons von Marvin Minsky und Seymour Papert, veröffentlicht 1969 gemacht. Es hat die Grenzen auf den Sorten von Funktionen demonstriert, die einzelner-layered perceptrons berechnen kann, zeigend, dass sogar einfache Funktionen wie die exklusive Trennung richtig nicht behandelt werden konnten. Die PDP-Bücher haben diese Beschränkung durch die Vertretung überwunden, dass Mehrniveau, nichtlineare Nervennetze viel robuster waren und für eine riesengroße Reihe von Funktionen verwendet werden konnten.

Viele frühere Forscher haben connectionist Stil-Modelle, zum Beispiel in den 1940er Jahren und 1950er Jahren, Warren McCulloch, Walter Pitts, Donald Olding Hebb und Karl Lashley verteidigt. McCulloch und Pitts haben gezeigt, wie Nervensysteme Logik der ersten Ordnung durchführen konnten: Ihr klassisches Papier "Eine Logische Rechnung von Ideen, die in der Nerventätigkeit" (1943) immanent sind, ist in dieser Entwicklung hier wichtig. Sie waren unter Einfluss der wichtigen Arbeit von Nicolas Rashevsky in den 1930er Jahren. Hebb hat außerordentlich zu Spekulationen über die Nervenwirkung beigetragen, und hat einen Lerngrundsatz, das Lernen von Hebbian vorgeschlagen, das noch heute verwendet wird. Lashley hat für verteilte Darstellungen infolge seines Misserfolgs argumentiert, irgendetwas wie ein lokalisierter engram in Jahren von Verletzungsexperimenten zu finden.

Connectionism abgesondert von PDP

Obwohl PDP die dominierende Form von connectionism ist, sollte andere theoretische Arbeit auch als connectionist klassifiziert werden.

Viele connectionist Grundsätze können verfolgt werden, um früh in der Psychologie wie die von William James zu arbeiten. Psychologische Theorien, die auf Kenntnissen über das menschliche Gehirn gestützt sind, waren gegen Ende des 19. Jahrhunderts modisch. Schon in 1869 hat der Neurologe John Hughlings Jackson für Mehrniveau argumentiert, hat Systeme verteilt. Aus dieser Leitung folgend, haben die Grundsätze von Herbert Spencer der Psychologie, 3. Ausgabe (1872) und des Projektes von Sigmund Freud für eine Wissenschaftliche Psychologie (zusammengesetzter 1895) connectionist oder proto-connectionist Theorien vorgetragen. Diese haben dazu geneigt, spekulative Theorien zu sein. Aber bis zum Anfang des 20. Jahrhunderts experimentierte Edward Thorndike am Lernen, das ein connectionist Typ-Netz postuliert hat.

In den 1950er Jahren hat Friedrich Hayek vorgeschlagen, dass die spontane Ordnung im Gehirn aus dezentralisierten Netzen von einfachen Einheiten entstanden ist. Die Arbeit von Hayek wurde in der PDP Literatur bis neulich selten zitiert.

Eine andere Form des connectionist Modells war das Verwandtschaftsnetzfachwerk, das vom Linguisten Sydney Lamb in den 1960er Jahren entwickelt ist. Verwandtschaftsnetze sind nur von Linguisten verwendet worden, und wurden mit der PDP-Annäherung nie vereinigt. Infolgedessen werden sie jetzt von sehr wenigen Forschern verwendet.

Es gibt auch Hybride connectionist Modelle, größtenteils symbolische Darstellungen mit Nervennetzmodellen mischend.

Die hybride Annäherung ist von einigen Forschern (wie Ron Sun) verteidigt worden.

Connectionism gegen die Computationalism-Debatte

Da connectionism immer populärer gegen Ende der 1980er Jahre geworden ist, gab es eine Reaktion dazu durch einige Forscher, einschließlich Jerry Fodors, Steven Pinkers und anderer. Sie haben behauptet, dass connectionism, weil er entwickelt wurde, Gefahr gelaufen ist auszulöschen, was sie als der Fortschritt gesehen haben, der in den Feldern der Erkenntnistheorie und Psychologie durch die klassische Annäherung von computationalism wird macht. Computationalism ist eine spezifische Form von cognitivism, der behauptet, dass Geistestätigkeit rechenbetont ist, d. h. dass die Meinung durch das Durchführen rein formeller Operationen auf Symbolen wie eine Maschine von Turing funktioniert. Einige Forscher haben behauptet, dass die Tendenz in connectionism ein Rückfall zu associationism und dem Aufgeben der Idee von einer Sprache des Gedankens, etwas war, was sie gefühlt haben, war falsch. Im Gegensatz waren es jene wirklichen Tendenzen, die connectionism attraktiv für andere Forscher gemacht haben.

Connectionism und computationalism brauchen nicht uneins zu sein, aber die Debatte gegen Ende der 1980er Jahre und Anfang der 1990er Jahre hat zu Opposition zwischen den zwei Annäherungen geführt. Während der Debatte haben einige Forscher behauptet, dass connectionism und computationalism völlig vereinbar sind, obwohl die volle Einigkeit auf diesem Problem nicht erreicht worden ist. Die Unterschiede zwischen den zwei Annäherungen, die gewöhnlich zitiert werden, sind der folgende:

  • Computationalists postulieren symbolische Modelle, die zu Grunde liegender Gehirnstruktur überhaupt nicht ähneln, wohingegen sich connectionists mit "dem auf niedriger Stufe" Modellieren beschäftigen, versuchend sicherzustellen, dass ihre Modelle neurologischen Strukturen ähneln.
  • Computationalists konzentrieren sich im Allgemeinen auf die Struktur von ausführlichen Symbolen (geistige Modelle) und syntaktische Regeln für ihre innere Manipulation, wohingegen sich connectionists darauf konzentrieren, von Umweltstimuli zu erfahren und diese Information in einer Form von Verbindungen zwischen Neuronen zu versorgen.
  • Computationalists glauben, dass innere Geistestätigkeit aus der Manipulation von ausführlichen Symbolen besteht, wohingegen connectionists glauben, dass die Manipulation von ausführlichen Symbolen ein schlechtes Modell der Geistestätigkeit ist.
  • Computationalists postulieren häufig Gebiet spezifische symbolische Subsysteme haben vorgehabt, das Lernen in spezifischen Gebieten des Erkennens zu unterstützen (z.B, Sprache, intentionality, Zahl), wohingegen connectionists ein oder ein kleiner Satz von sehr allgemeinen Lernmechanismen postulieren.

Aber, trotz dieser Unterschiede, haben einige Theoretiker vorgeschlagen, dass die connectionist Architektur einfach die Weise ist, auf die das Symbol-Manipulationssystem zufällig im organischen Gehirn durchgeführt wird. Das ist logisch möglich, weil es wohl bekannt ist, dass connectionist Modelle Symbol-Manipulationssysteme der in computationalist Modellen verwendeten Art durchführen können, weil tatsächlich sie fähig sein müssen, wenn sie die menschliche Fähigkeit erklären sollen, Symbol-Manipulationsaufgaben durchzuführen. Aber die Debatte ruht, ob diese Symbol-Manipulation das Fundament des Erkennens im Allgemeinen bildet, so ist das nicht eine potenzielle Verteidigung von computationalism. Dennoch können rechenbetonte Beschreibungen nützliche Beschreibungen auf höchster Ebene des Erkennens der Logik zum Beispiel sein.

Die Debatte hat größtenteils auf logische Argumente darüber im Mittelpunkt gestanden, ob connectionist Netze dazu fähig waren, die syntaktische in dieser Sorte des Denkens beobachtete Struktur zu erzeugen. Das wurde später, obwohl mit Prozessen erreicht, um kaum im Gehirn möglich zu sein, so hat die Debatte angedauert. Heute haben Fortschritt in der Neurophysiologie und allgemeine Fortschritte im Verstehen von Nervennetzen, zum erfolgreichen Modellieren sehr vieler dieser frühen Probleme geführt, und die Debatte über das grundsätzliche Erkennen ist so unter neuroscientists zu Gunsten von connectionism größtenteils entschieden worden. Jedoch müssen diese ziemlich neuen Entwicklungen noch Einigkeitsannahme unter denjenigen erreichen, die in anderen Feldern, wie Psychologie oder Philosophie der Meinung arbeiten.

Ein Teil der Bitte von rechenbetonten Beschreibungen ist, dass sie relativ leicht sind zu dolmetschen, und so als das Beitragen zu unserem Verstehen von besonderen geistigen Prozessen gesehen werden können, wohingegen connectionist Modelle im Allgemeinen im Ausmaß undurchsichtiger sind, dass sie nur in sehr allgemeinen Begriffen (wie das Spezifizieren des Lernalgorithmus, der Zahl von Einheiten, usw.), oder in unnützlich auf niedriger Stufe Begriffen beschreibbar sein können. In diesem Sinn connectionist Modelle kann realisieren, und dadurch Beweise für, eine breite Theorie des Erkennens (d. h., connectionism) zur Verfügung stellen, ohne eine nützliche Theorie des besonderen Prozesses zu vertreten, der modelliert wird. In diesem Sinn könnte die Debatte als einigermaßen das Reflektieren eines bloßen Unterschieds im Niveau der Analyse betrachtet werden, in der besondere Theorien aufgestellt werden.

Die neue Beliebtheit von dynamischen Systemen in der Philosophie der Meinung hat eine neue Perspektive auf der Debatte hinzugefügt; einige Autoren behaupten jetzt, dass jeder Spalt zwischen connectionism und computationalism als ein Spalt zwischen computationalism und dynamischen Systemen mehr abschließend charakterisiert wird.

Das kürzlich vorgeschlagene Hierarchische zeitliche Speichermodell kann Auflösung dieses Streits mindestens zu einem gewissen Grad helfen, vorausgesetzt, dass es wie die neocortex Extrakte (symbolische) Information auf höchster Ebene vom auf niedriger Stufe Sinneseingang erklärt.

Siehe auch

Referenzen

  • Rumelhart, D.E. J.L. McClelland und PDP Research Group (1986). Parallele Verteilte Verarbeitung: Erforschungen in der Mikrostruktur des Erkennens. Band 1: Fundamente, Cambridge, Massachusetts: MIT Presse
  • McClelland, J.L. D.E. Rumelhart und PDP Research Group (1986). Parallele Verteilte Verarbeitung: Erforschungen in der Mikrostruktur des Erkennens. Band 2: Psychologische und Biologische Modelle, Cambridge, Massachusetts: MIT Presse
  • Mehr rosa, Steven und Mehler, Jacques (1988). Verbindungen und Symbole, Magister artium von Cambridge: MIT Presse.
  • Jeffrey L. Elman, Elizabeth A. Bates, Mark H. Johnson, Annette Karmiloff-Smith, Domenico Parisi, Kim Plunkett (1996). Das Umdenken der Angeborenkeit: Eine connectionist Perspektive auf der Entwicklung, Magister artium von Cambridge: MIT Presse.
  • Marcus, Gary F. (2001). Die algebraische Meinung: Connectionism und Erkenntnistheorie (Das Lernen, die Entwicklung und die Begriffsänderung), Cambridge, Massachusetts integrierend: MIT Presse

Links


Vaitupu / Internationaler Flughafen von Orlando
Impressum & Datenschutz