Internetarchiv

Mit dem arXiv verwirrter:Not.

:For-Hilfe, die das Internetarchiv in der englischen Wikipedia zitiert, sieh.

Das Internetarchiv ist eine gemeinnützige Digitalbibliothek mit der festgesetzten Mission des "universalen Zugangs zu allen Kenntnissen". Es bietet dauerhafte Lagerung und Zugang zu Sammlungen von digitalisierten Materialien, einschließlich Websites, Musik, bewegender Images und fast 3 Millionen öffentlicher Bereichsbücher an. Das Internetarchiv wurde von Brewster Kahle 1996 gegründet. Es ist ein Mitglied des IIPC (Internationales Internetbewahrungskonsortium).

Mit Büros, die in San Francisco, Kalifornien, den USA, und den Datenzentren in San Francisco, der Rotholz-Stadt, und der Bergansicht, Kalifornien, den USA gelegen sind, ist die größte Sammlung des Archivs sein Webarchiv, "Schnellschüsse des World Wide Web". Um die Stabilität und Dauer des Internetarchivs zu sichern, wird seine Sammlung an der Bibliothek Alexandrina in Ägypten widergespiegelt.

Das Archiv erlaubt dem Publikum, Digitalmaterial zu seiner Datentraube sowohl zu laden als auch herunterzuladen, und stellt uneingeschränkten Onlinezugriff diesem Material ohne Kosten zur Verfügung. Das Archiv beaufsichtigt auch eines des größten Buches in der Welt digitization Projekte. Es ist ein Mitglied der amerikanischen Bibliotheksvereinigung und wird durch den Staat Kalifornien als eine Bibliothek offiziell anerkannt.

Zusätzlich zu seiner Archivieren-Funktion ist das Archiv eine Aktivist-Organisation, für ein freies und offenes Internet verteidigend.

Das Archiv ist 501 (c) (3) das gemeinnützige Funktionieren in den Vereinigten Staaten. Es hat einen Personal 200, von denen die meisten Buchscanner in seinen Buchabtastungszentren sind. Sein Hauptbüro in San Francisco Häusern ungefähr 30 Angestellte. Das Archiv hat ein jährliches Budget von $ 10 Millionen, ist auf eine Vielfalt von Quellen zurückzuführen gewesen: Einnahmen von seinen kriechenden Webdienstleistungen, verschiedenen Partnerschaften, Bewilligungen, Spenden und dem Fundament von Kahle-Austin.

Geschichte

Brewster Kahle hat das Archiv 1996 zur gleichen Zeit gegründet, dass er die gewinnorientierte kriechende Webgesellschaft Internet von Alexa begonnen hat. Das Archiv hat begonnen, das World Wide Web von 1996 zu archivieren, aber es hat diese Sammlung bis 2001 nicht bereitgestellt, als es die Wayback Maschine entwickelt hat. Gegen Ende 1999 hat das Archiv seine Sammlungen außer dem Webarchiv ausgebreitet, mit dem Vorverweilen Archiv beginnend. Jetzt schließt das Internetarchiv Texte, bewegende Audioimages und Software ein. Es veranstaltet mehrere andere Projekte: das Bildarchiv von NASA, das kriechende Vertragsdienstarchiv - Es und die wiki-editable Bibliothekskatalog- und Buchinformationsseite Offene Bibliothek. Kürzlich hat das Archiv begonnen zu arbeiten, um spezialisierte Dienstleistungen in Zusammenhang mit den Informationszugriffsbedürfnissen nach dem druckarbeitsunfähigen zur Verfügung zu stellen.

Gemäß seiner Website:

: Die meisten Gesellschaften legen Wichtigkeit auf der Bewahrung von Kunsterzeugnissen ihrer Kultur und Erbes. Ohne solche Kunsterzeugnisse hat Zivilisation kein Gedächtnis und keinen Mechanismus, von seinen Erfolgen und Misserfolgen zu erfahren. Unsere Kultur erzeugt jetzt immer mehr Kunsterzeugnisse in der Digitalform. Die Mission des Archivs ist zu helfen, jene Kunsterzeugnisse zu bewahren und eine Internetbibliothek für Forscher, Historiker und Gelehrte zu schaffen.

Wayback Maschine

Das Internetarchiv hat auf dem populären Gebrauch des Begriffes "WABAC Maschine" von einem Segment des alten Cartoons von Rocky und Bullwinkle kapitalisiert, und verwendet den Namen "Wayback Maschine" für seinen Dienst, der Archiven des World Wide Web erlaubt, gesucht und zugegriffen zu werden. Dieser Dienst erlaubt Benutzern, archivierte Versionen von Webseiten der Vergangenheit zu sehen, was das Internetarchiv einen "dreidimensionalen Index" nennt. Millionen von Websites und ihren verbundenen Daten (Images, Quellcode, Dokumente, usw.) werden in einer riesigen Datenbank gespart. Der Dienst kann verwendet werden, um zu sehen, wie was vorherige Versionen von Websites gepflegt haben, auszusehen, ursprünglichen Quellcode von Websites zu ergreifen, die nicht mehr direkt verfügbar sein können, oder Websites zu besuchen, die nicht mehr sogar bestehen. Nicht alle Websites sind jedoch verfügbar, weil viele Website-Eigentümer beschließen, ihre Seiten auszuschließen. Als mit allen Seiten, die auf Daten von Webkettenfahrzeugen gestützt sind, verpasst das Internetarchiv große Gebiete des Webs für eine Vielfalt anderer Gründe. Internationale Neigungen sind auch in seinem Einschluss gefunden worden, obwohl das nicht scheint, das Ergebnis einer absichtlichen Politik zu sein.

Beispiele von den Archiven von WaybackMachine:

Der Gebrauch des Begriffes "Wayback Maschine" im Zusammenhang des Internetarchivs ist so üblich geworden, dass "Wayback Maschine" und "Internetarchiv" fast synonymisch sind. Dieser Gebrauch kommt in der populären Kultur z.B in der TV-Show vor ("Vermächtnis", zuerst geführt am 3. Aug 2008), ein Extraspielen einer Computertechnologie verwendet die Wayback "Maschine", um ein Archiv einer Stil-Website von Facebook eines Studenten zu finden. Schnellschüsse nehmen gewöhnlich mindestens 6-18 hinzuzufügende Monate.

Offene Bibliothek

Die Offene Bibliothek ist ein anderes Projekt des Internetarchivs. Die Seite bemüht sich, eine Webseite-Datenbank für jedes Buch jemals veröffentlicht, eine Art offene Quellversion von WorldCat einzuschließen. Es hält 23 Millionen Katalogaufzeichnungen von Büchern zusätzlich zu den vollen Texten von ungefähr 1,600,000 öffentlichen Bereichsbüchern, die völlig lesbar und herunterladbar sind. Offene Bibliothek ist ein freies/offenes Quellsoftwareprojekt mit seinem auf der Offenen Bibliotheksseite frei verfügbaren Quellcode.

Archiv - Es

Zuerst aufmarschiert Anfang 2006, Archiv - ist Es ein Webarchivieren-Dienst, der Einrichtungen und Personen erlaubt, Sammlungen des Digitalinhalts zu bauen und zu bewahren und Digitalarchive zu schaffen. Durch eine Webanwendung kann Archiv - den Es vereinigt, ernten, katalogisieren, führen, und ihre archivierten Sammlungen durchsuchen. Sammlungen werden vom Internetarchiv veranstaltet und sind für das Publikum mit der Volltextsuche verfügbar. Inhalt hat sich durch das Archiv versammelt - Es wird mit einer primären und Aushilfskopie versorgt, wird ins allgemeine Archiv des Archivs des Internets regelmäßig mit einem Inhaltsverzeichnis versehen, und eine Kopie der Daten kann an die Partnereinrichtungen gesandt werden.

Bezüglich des Mais 2011, Archivs - hatte Es mehr als 180 Partnereinrichtungen in 44 US-Staaten und 14 Ländern, die mehr als 2.7 Milliarden URL-ADRESSEN für im Laufe 1534 öffentliche Sammlungen gewonnen haben. Archiv - Es vereinigt sind Universitäten und Universitätsbibliotheken, setzen Archive, Bundeseinrichtungen, Museen, Gesetzbibliotheken und kulturelle Organisationen, einschließlich der Elektronischen Literaturorganisation, Archive des Staates North Carolina und Bibliothek, Universität von Stanford, Universität von Columbia, amerikanischen Universität in Kairo, Georgetown Gesetzbibliothek und vieler anderer fest.

nasaimages.org

Images von NASA wurden durch eine Raumgesetz-Abmachung zwischen dem Internetarchiv und NASA geschaffen, um öffentlichen Zugang zum Image der NASA, Video und Audiosammlungen in einer einzelnen, auffindbaren Quelle zu bringen. Die Bildmannschaft von NASA arbeitet nah mit allen Zentren von NASA, um fortzusetzen, zur jemals wachsenden Sammlung an nasaimages.org beizutragen. Die Seite gestartet im Juli 2008 und hat jetzt mehr als 100,000 Sachen online.

Mediasammlungen

Zusätzlich zu Webarchiven erhält das Internetarchiv umfassende Sammlungen von Digitalmedien aufrecht, die durch den uploader beglaubigt, um im öffentlichen Gebiet in den Vereinigten Staaten zu sein, oder laut einer Lizenz lizenziert werden, die Neuverteilung wie Kreative Unterhaus-Lizenzen erlaubt. Die Medien werden in Sammlungen durch das Sektorformat (bewegende Images, Audio-, Text, usw.), und in Subsammlungen durch verschiedene Kriterien organisiert. Jede der Hauptsammlungen schließt eine Subsammlung "des Open Sources" ein, wo allgemeine Beiträge durch das Publikum versorgt werden.

Bewegende Bildsammlung

Beiseite von Hauptfilmen schließt die Bewegende Bildsammlung von IA ein: Wochenschauen; klassische Cartoons; pro- und Antikriegspropaganda; Lassen Sie die Sammlung "von A.V. Geeks" von Elsheimer aus; und ephemeres Material davon Vorverweilt Archive, wie Werbung, Bildungs- und Industriefilme und Dilettant und Hausfilmsammlungen.

Die Sammlung von Brick Films von IA enthält Zeichentrickfilm der Halt-Bewegung, der mit Ziegeln von Lego gefilmt ist, von denen einige "Remakes" von Hauptfilmen sind. Die Wahl-2004-Sammlung ist eine parteiunabhängige öffentliche Quelle, um Videomaterialien zu teilen, die bis 2004 USA-Präsidentenwahl verbunden sind. Die Unabhängige Nachrichtensammlung schließt Subsammlungen wie die Internetarchiv-Welt Auf der Kriegskonkurrenz von 2001 ein, in der Wettbewerber kurze Filme geschaffen haben, die "warum Zugang zu Geschichtssachen demonstrieren." Unter ihren am meisten heruntergeladenen Videodateien sind Augenzeugeaufnahmen verheerenden 2004 Erdbeben von Indischem Ozean. Das Fernseharchiv am 11. September enthält archivalische Gesamtlänge von den Hauptfernsehnetzen in der Welt der Terroristenangriffe vom 11. September 2001, als sie sich im lebenden Fernsehen entfaltet haben.

Einige der auf dem Internetarchiv verfügbaren Filme sind:

hat

Siehe auch [Wikipedia-Liste von Filmen, die frei auf dem Internetarchiv] verfügbar sind.

Audiosammlung

Die Audiosammlung schließt Musik, Audiobücher, Nachrichtensendungen, alte Zeitradioshows und ein großes Angebot an anderen Audiodateien ein.

Die Lebende Musik-Archiv-Subsammlung schließt mehr als 100,000 Konzertaufnahmen von unabhängigen Künstlern, sowie mehr feststehenden Künstlern und Musikensembles mit permissiven Regeln über die Aufnahme ihrer Konzerte wie die Dankbaren Toten, und mehr kürzlich, Die Zersplitternden Kürbise ein. Jordan Zevon hat auch jedem erlaubt, Konzertaufnahmen seines Vaters Warren Zevon auf dem Internetarchiv zu teilen.

Das Archiv veranstaltet frei verteilbare Musik über seinen Dienst von Netlabels.

Textsammlung

Die Textsammlung schließt digitalisierte Bücher von verschiedenen Bibliotheken um die Welt sowie viele spezielle Sammlungen ein. Das Internetarchiv operiert 23 Abtastungszentren in fünf Ländern, ungefähr 1,000 Bücher pro Tag, finanziell unterstützt von Bibliotheken und Fundamenten digitalisierend., als es ungefähr 1 Million Texte gab, war die komplette Sammlung mehr als 0.5 petabytes, der rohe Kameraimages, abgeschnittene und verdrehte Images, PDFs und rohe OCR-Daten einschließt.

Zwischen ungefähr 2006 und Microsoft 2008-Corporation hatte eine spezielle Beziehung mit Internetarchiv-Texten durch sein Lebendes Suchbuchprojekt, mehr als 300,000 Bücher scannend, die zur Sammlung, sowie finanziellen Unterstützung und Abtastungsausrüstung beigetragen wurden. Am 23. Mai 2008 hat Microsoft bekannt gegeben, dass es das Lebende Buchsuchprojekt beenden und nicht mehr Bücher scannen würde. Microsoft hat seine gescannten Bücher ohne vertragliche Beschränkung bereitgestellt und hat seine Abtastungsausrüstung seinen ehemaligen Partnern geschenkt.

Um den Oktober 2007 haben Archiv-Benutzer begonnen, öffentliche Bereichsbücher von der Google-Buchsuche zu laden. Bezüglich des Mais 2011 gab es mehr als 900,000 Google-digitalisierte Bücher in der Sammlung des Archivs aus insgesamt 2.8 Millionen Büchern. Die Bücher sind zu den Kopien identisch, die auf Google gefunden sind, außer ohne die Wasserzeichen von Google, und sind für den uneingeschränkten Gebrauch und das Download wie alle Internetarchiv-Materialien verfügbar.

Physische Medien

Wenn er

eine starke Reaktion zur Idee von Büchern einfach äußert, und begeistert durch Svalbard Globales Samen-Gewölbe weggeworfen, stellt sich Kahle jetzt das Sammeln einer Kopie jedes jemals veröffentlichten Buches vor. "Wir sind nicht dabei hierher zu kommen, aber es ist unsere Absicht," hat er gesagt. Neben den Büchern plant Kahle, die alten Server des Archivs des Internets zu versorgen, die gegen Ende letzten Jahres ersetzt wurden.

Meinungsverschiedenheiten und gesetzliche Streite

Hass-Rede-Server für Al Qaeda

Am 17. August 2011 hat Nahostmedienforschungsinstitut (MEMRI.org) "Al Qaeda veröffentlicht, Jihadis Suchen San Francisco, mit Sitz in Kalifornien '' Archiv-Internetbibliothek" Heim, die ausführlich berichtet hat, wie Mitglieder anonym dahineilen und freie unzensierte Bewirtung genießen können.

Staatssicherheitsbrief

Am 8. Mai 2008 wurde es offenbart, dass das Internetarchiv erfolgreich einen Staatssicherheitsbrief von FBI herausgefordert hat, um Anmeldungen eines geheim gehaltenen Benutzers bittend.

Scientology

Gegen Ende 2002 hat das Internetarchiv verschiedene Seiten entfernt, die gegenüber Scientology von der Wayback Maschine kritisch sind. Die Fehlermeldung hat festgestellt, dass das als Antwort auf eine "Bitte durch den Seite-Eigentümer war." Es wurde später geklärt, dass Rechtsanwälte von der Kirche von Scientology die Eliminierung gefordert hatten, und dass die wirklichen Seite-Eigentümer ihr entferntes Material nicht gewollt haben.

Healthcare Advocates, Inc.

2003 hat Harding Earley Follmer & Frailey einen Kunden gegen einen Handelsmarke-Streit mit der Wayback Maschine des Archivs verteidigt. Die Rechtsanwälte sind im Stande gewesen zu zeigen, dass die Ansprüche des Anklägers gestützt auf dem Inhalt ihrer Website von mehreren vorherigen Jahren ungültig waren. Der Ankläger, Gesundheitsfürsorge-Verfechter, hat dann ihre Beschwerde amendiert, um das Internetarchiv einzuschließen, die Organisation der Urheberrechtsverletzung sowie Übertretungen des DMCA und des Computerschwindel- und Missbrauch-Gesetzes anklagend. Gesundheitsfürsorge-Verfechter haben behauptet, dass, seitdem sie robots.txt Datei auf ihrer Website installiert hatten, selbst wenn nachdem die anfängliche Klage eingereicht wurde, das Archiv alle vorherigen Kopien der Ankläger-Website von der Wayback Maschine entfernt haben sollte. Die Rechtssache wurde aus dem Gericht gesetzt.

Robots.txt wird als ein Teil des Roboter-Ausschluss-Standards, ein freiwilliges Protokoll die Internetarchiv-Hinsicht verwendet, der Funktionseinheiten davon zurückweist, bestimmte Seiten mit einem Inhaltsverzeichnis zu versehen, die vom Schöpfer als skizziert sind, verboten. Infolgedessen hat das Internetarchiv nicht verfügbar mehrere Websites gemacht, die jetzt durch die Wayback Maschine unzugänglich sind. Zurzeit wendet das Internetarchiv robots.txt Regeln rückwirkend an; wenn eine Seite das Internetarchiv wie Gesundheitsfürsorge-Verfechter blockiert, werden irgendwelche vorher archivierten Seiten vom Gebiet auch nicht verfügbar gemacht. In Fällen von blockierten Seiten nur robots.txt wird Datei archiviert.

Jedoch setzt das Internetarchiv auch fest, "Manchmal wird sich ein Website-Eigentümer mit uns direkt in Verbindung setzen und uns bitten aufzuhören, zu kriechen oder eine Seite zu archivieren. Wir erfüllen diese Bitten." Außerdem sagt die Website: "Das Internetarchiv interessiert sich für die Bewahrung oder das Angebot des Zugangs zu Websites oder anderen Internetdokumenten von Personen nicht, die ihre Materialien in der Sammlung nicht wollen."

Suzanne Shell

Am 12. Dezember 2005 hat Aktivist Suzanne Shell gefordert, dass Internetarchiv ihre 100,000 US$ bezahlt, um ihre Website profane-justice.org zwischen 1999 und 2004 zu archivieren. Internetarchiv hat eine erklärende Urteil-Handlung im USA-Landgericht für den Nördlichen Bezirk Kaliforniens am 20. Januar 2006 abgelegt, einen gerichtlichen Entschluss suchend, dass Internetarchiv das Copyright von Shell nicht verletzt hat. Shell hat geantwortet und hat eine Gegenklage gegen das Internetarchiv gebracht, um ihre Seite zu archivieren, die sie behauptet, ist in der Übertretung ihrer Begriffe des Dienstes. Am 13. Februar 2007 hat ein Richter für das USA-Landgericht für den Bezirk Colorados alle Gegenforderungen außer dem Vertragsbruch abgewiesen. Das Internetarchiv hat sich nicht bewegt, um Urheberrechtsverletzung abzuweisen, behauptet, dass Shell das Entstehen aus seinem Kopieren von Tätigkeiten behauptet hat, die auch vorankommen werden.

Am 25. April 2007 haben Internetarchiv und Suzanne Shell gemeinsam die Ansiedlung ihrer Rechtssache bekannt gegeben. Das Internetarchiv hat gesagt, "Internetarchiv hat kein Interesse am Umfassen von Materialien in der Wayback Maschine von Personen, die ihren Webinhalt nicht archivieren lassen möchten. Wir erkennen an, dass Frau Shell ein gültiges und durchsetzbares Copyright in ihrer Website hat und wir bedauern, dass die Einschließung ihrer Website in der Wayback Maschine auf diese Streitigkeit hinausgelaufen ist. Wir sind glücklich, diesen Fall hinter uns zu haben." Shell hat gesagt, "Ich respektiere den historischen Wert der Internetarchiv-Absicht. Ich habe nie vorgehabt, diese Absicht zu stören noch sie jeder Schaden zu verursachen."

Dankbare Tote

Im November 2005 wurden kostenlose Downloads von Dankbaren Toten Konzerten von der Seite entfernt. John Perry Barlow hat Bob Weir, Mickey Hart und Bill Kreutzmann als die Anstifter der Änderung gemäß einem Artikel New York Times erkannt. Phil Lesh hat sich über die Änderung in am 30. November 2005 geäußert, zu seiner persönlichen Website dahineilend:

: Es wurde zu meiner Aufmerksamkeit gebracht, dass alle Dankbaren Toten Shows von Archive.org direkt vor dem Erntedankfest abgenommen wurden. Ich war nicht ein Teil dieses Entscheidungsprozesses und wurde nicht benachrichtigt, dass die Shows gezogen werden sollten. Ich finde wirklich, dass die Musik das Vermächtnis des Dankbaren Toten ist und ich hoffe, dass irgendwie alles davon für diejenigen verfügbar ist, die es wollen.

Ein Forum-Posten am 30. November von Brewster Kahle hat zusammengefasst, was geschienen ist, der unter den Band-Mitgliedern erreichte Kompromiss zu sein. Publikum-Aufnahmen konnten heruntergeladen oder verströmt werden, aber soundboard Aufnahmen sollten verfügbar sein, um nur zu strömen. Konzerte sind seitdem wiederhinzugefügt worden.

Die Opposition gegen Google bestellt Ansiedlung vor

Das Internetarchiv ist ein Mitglied der Offenen Buchverbindung, die unter den freimütigsten Kritikern der Google-Buchansiedlung gewesen ist. Das Archiv verteidigt ein alternatives Digitalbibliotheksprojekt.

Opposition gegen S.O.P.A. und P.I.P.A.

Das Internetarchiv hat seine Website seit zwölf Stunden am 18. Januar 2012 im Protest des Halts Online-Gesetz der Illegalen Vervielfältigung und das SCHÜTZEN des IP Gesetzes, der zwei Stücke während der Gesetzgebung im USA-Kongress verdunkelt, den sie fordern, wird das Ökosystem des Webs "negativ betreffen, das veröffentlicht, der zum Erscheinen des Internetarchivs geführt hat." Das ist in Verbindung mit, sowie viele andere Proteste über das Internet vorgekommen.

Siehe auch

Ähnliche Projekte

Anderer

  • Digitalbewahrung
  • Heritrix
  • Verbindungsfäule
  • Speicherloch
  • PetaBox
  • Web, archivierend
  • Webkettenfahrzeug
  • Archiv-Mannschaft
  • Dunkles Digitalalter

Weiterführende Literatur

Links


Philippinisch / Polikarpov I-16
Impressum & Datenschutz