Mai nella storia dell'umanità ci sono state così tante informazioni in merito Esplorare Wayback Machine nel 2023: una guida completa come c'è oggi grazie a internet. Tuttavia, questo accesso a tutto ciò che riguarda Esplorare Wayback Machine nel 2023: una guida completa non è sempre facile. Saturazione, scarsa usabilità e difficoltà a distinguere tra informazioni corrette e non corrette Esplorare Wayback Machine nel 2023: una guida completa sono spesso difficili da superare. Questo è ciò che ci ha motivato a creare un sito affidabile, sicuro ed efficace.
Ci era chiaro che per raggiungere il nostro obiettivo non bastava avere informazioni corrette e verificate in merito Esplorare Wayback Machine nel 2023: una guida completa . Tutto quello che avevamo raccolto Esplorare Wayback Machine nel 2023: una guida completa inoltre doveva essere presentato in modo chiaro e leggibile, in una struttura che facilitasse l'esperienza dell'utente, con un design pulito ed efficiente, e che privilegiasse la velocità di caricamento. Siamo fiduciosi di aver raggiunto questo obiettivo, anche se lavoriamo sempre per apportare piccoli miglioramenti. Se hai trovato ciò che hai trovato utile Esplorare Wayback Machine nel 2023: una guida completa e ti sei sentito a tuo agio, saremo molto felici se torni scientiaen.com ogni volta che vuoi e ne hai bisogno.
![]() | |
Tipo di sito | Archivia |
---|---|
Fondato |
|
Zona servita | In tutto il mondo (tranne la Cina e Bahrain) |
Proprietario | Internet Archive |
URL | sito web |
Commerciale | Non |
Iscrizione | Opzionale |
Stato attuale | Attivo |
Scritto in | HTML, CSS, JavaScript, Java, Python. |
Le Wayback Machine è un digitale archiviare della World Wide Web fondata dal Internet Archive, un'organizzazione no profit con sede a San Francisco, California. Creato nel 1996 e lanciato al pubblico nel 2001, consente all'utente di tornare "indietro nel tempo" e vedere come apparivano i siti Web in passato. I suoi fondatori, birraia kahle e Bruce Gilliat, ha sviluppato la Wayback Machine per fornire "l'accesso universale a tutta la conoscenza" conservando copie archiviate di pagine web defunte.
Lanciata il 10 maggio 1996, la Wayback Machine aveva salvato più di 38.2 milioni di pagine Web alla fine del 2009. Al 13 marzo 2023, la Wayback Machine ha archiviato più di 800 miliardi di pagine web.
La Wayback Machine ha iniziato l'archiviazione cache pagine web nel 1996. Una delle prime pagine conosciute è stata archiviata il 10 maggio 1996, a (UTC).
Internet Archive fondatori birraia kahle e Bruce Gilliat ha lanciato la Wayback Machine in San Francisco, California, nell'ottobre 2001, principalmente per affrontare il problema della scomparsa dei contenuti Web ogni volta che vengono modificati o quando un sito Web viene chiuso. Il servizio consente agli utenti di visualizzare le versioni archiviate di pagine web attraverso il tempo, che l'archivio chiama "indice tridimensionale". Kahle e Gilliat hanno creato la macchina sperando di archiviare l'intera Internet e fornire "l'accesso universale a tutta la conoscenza". Il nome "Wayback Machine" è un riferimento a un immaginario dispositivo di viaggio nel tempo e di traduzione, il "Wayback Machine", utilizzato dai personaggi Signor Peabody e Sherman nel cartone animato Le avventure di Rocky e Bullwinkle and Friends. In uno dei segmenti del cartone animato, "Peabody's Improbable History", i personaggi hanno utilizzato la macchina per assistere, partecipare e spesso alterare eventi famosi della storia.
Dal 1996 al 2001, le informazioni sono state conservate su nastro digitale, con Kahle che occasionalmente permetteva a ricercatori e scienziati di attingere al "goffo" banca dati. Quando l'archivio ha raggiunto il suo quinto anniversario nel 2001, è stato svelato e aperto al pubblico in una cerimonia presso il University of California, Berkeley. Al momento del lancio della Wayback Machine, conteneva già oltre 10 miliardi di pagine archiviate. I dati sono archiviati nel grande cluster di Internet Archive di Linux i nodi. Rivisita e archivia occasionalmente nuove versioni dei siti Web (vedere i dettagli tecnici di seguito). I siti possono anche essere catturati manualmente inserendo quelli di un sito web URL nella casella di ricerca, a condizione che il sito Web consenta alla Wayback Machine di "scansionarlo" e salvare i dati.
Il 30 ottobre 2020, Wayback Machine ha iniziato a verificare i contenuti. A partire da gennaio 2022, i domini di ad server sono disabilitati dall'acquisizione.
Nel maggio 2021, per il 25° anniversario di Internet Archive, la Wayback Machine ha introdotto la "Wayforward Machine" che consente agli utenti di "viaggiare su Internet nel 2046, dove la conoscenza è sotto assedio".
Il software della Wayback Machine è stato sviluppato per "strisciare" il Web e scaricare tutte le informazioni e i file di dati pubblicamente accessibili sulle pagine web, il citello gerarchia, il Netnews (Usenet) sistema di bacheca elettronica e software scaricabile. Le informazioni raccolte da questi "crawler" non includono tutte le informazioni disponibili su Internet, poiché gran parte dei dati è limitata dall'editore o archiviata in database non accessibili. Per superare le incoerenze nei siti Web parzialmente memorizzati nella cache, Archive-It.org è stato sviluppato nel 2005 da Internet Archive come mezzo per consentire alle istituzioni e ai creatori di contenuti di raccogliere e preservare volontariamente raccolte di contenuti digitali e creare archivi digitali.
I crawl sono forniti da varie fonti, alcune importate da terze parti e altre generate internamente dall'Archivio. Ad esempio, le ricerche per indicizzazione sono fornite dal Fondazione Sloan e Alexa, ricerche per indicizzazione eseguite da Internet Archive per conto di NARA e la Fondazione della memoria Internet, specchi di Scansione comune. I "Worldwide Web Crawls" sono in esecuzione dal 2010 e catturano il Web globale.
I documenti e le risorse vengono archiviati con URL timestamp come 20230528135735
. Le singole risorse delle pagine come immagini, fogli di stile e script, nonché collegamenti ipertestuali in uscita, sono collegate con il timestamp della pagina attualmente visualizzata, quindi vengono reindirizzate automaticamente alle singole acquisizioni che sono le più vicine nel tempo.
La frequenza delle acquisizioni di istantanee varia a seconda del sito web. I siti Web nelle "Scansioni Web in tutto il mondo" sono inclusi in un "elenco di scansione", con il sito archiviato una volta per scansione. Il completamento di una ricerca per indicizzazione può richiedere mesi o addirittura anni, a seconda delle dimensioni. Ad esempio, "Wide Crawl Number 13" è iniziato il 9 gennaio 2015 ed è stato completato l'11 luglio 2016. Tuttavia, potrebbero essere in corso più ricerche per indicizzazione contemporaneamente e un sito potrebbe essere incluso in più di un elenco di ricerca per indicizzazione, pertanto la frequenza con cui viene eseguita la scansione di un sito varia notevolmente.
A partire da ottobre 2019, gli utenti lo sono limitato a 15 richieste di archiviazione e recuperi al minuto.[come mai?]
Con lo sviluppo della tecnologia nel corso degli anni, la capacità di archiviazione della Wayback Machine è aumentata. Nel 2003, dopo soli due anni di accesso pubblico, la Wayback Machine cresceva a un ritmo di 12 terabyte al mese. I dati sono memorizzati su PetaBox sistemi rack progettati su misura dallo staff di Internet Archive. Il primo rack da 100 TB è diventato pienamente operativo nel giugno 2004, anche se è diventato subito chiaro che avrebbero avuto bisogno di molto più spazio di archiviazione.
Internet Archive ha migrato la sua architettura di archiviazione personalizzata a Deposito aperto al sole nel 2009, e ospita un nuovo data center in a Centro dati modulare Sun on Sun Microsystems' Campus californiano. A partire dal 2009, la Wayback Machine ne conteneva circa tre petabyte di dati e stava crescendo a un tasso di 100 terabyte ogni mese.
Una nuova versione migliorata della Wayback Machine, con un'interfaccia aggiornata e un indice più aggiornato dei contenuti archiviati, è stata resa disponibile per i test pubblici nel 2011, dove le acquisizioni vengono visualizzate in un layout di calendario con cerchi la cui larghezza visualizza il numero di ricerche per indicizzazione ogni giorno, ma nessuna marcatura di duplicati con asterischi o una pagina di ricerca avanzata. Un top barra degli strumenti è stato aggiunto per facilitare la navigazione tra le acquisizioni. Un grafico a barre visualizza la frequenza delle acquisizioni al mese nel corso degli anni. Funzionalità come "Modifiche", "Riepilogo" e una mappa grafica del sito sono state aggiunte successivamente.
Nel marzo dello stesso anno, sul forum di Wayback Machine è stato affermato che "la Beta della nuova Wayback Machine ha un indice più completo e aggiornato di tutti i materiali sottoposti a scansione fino al 2010 e continuerà ad essere aggiornata regolarmente. L'indice guidare la classica Wayback Machine ha solo un po' di materiale dopo il 2008, e non sono previsti ulteriori aggiornamenti dell'indice, in quanto sarà gradualmente eliminato quest'anno." Sempre nel 2011, Internet Archive ha installato la sesta coppia di rack PetaBox che hanno aumentato la capacità di archiviazione della Wayback Machine di 700 terabyte.
Nel gennaio 2013, la società ha annunciato un traguardo rivoluzionario di 240 miliardi di URL.
Nell'ottobre 2013, la società ha introdotto la funzione "Salva una pagina". che consente a qualsiasi utente di Internet di archiviare il contenuto di un URL e genera rapidamente un file collegamento permanente a differenza del precedente liveweb caratteristica.
Nel dicembre 2014, la Wayback Machine ne conteneva 435 miliardo pagine Web: quasi nove petabyte di dati e cresceva di circa 20 terabyte a settimana.
Nel marzo 2015, è stato pubblicato che i ricercatori di sicurezza si sono resi conto della minaccia rappresentata dall'involontaria attivazione del servizio hosting di binari dannosi dai siti archiviati.
Nel luglio 2016, secondo quanto riferito, la Wayback Machine conteneva circa 15 petabyte di dati.
A settembre 2018, la Wayback Machine conteneva oltre 25 petabyte di dati.
A dicembre 2020, la Wayback Machine conteneva oltre 70 petabyte di dati.
Il servizio Wayback Machine offre tre API pubbliche, SavePageNow, Availability e CDX. SavePageNow può essere utilizzato per archiviare le pagine web. API di disponibilità per controllare lo stato di disponibilità dell'archivio per una pagina Web, controllando se esiste o meno un archivio per la pagina web. L'API CDX è per query complesse, filtraggio e analisi dei dati acquisiti.
Storicamente, la Wayback Machine ha rispettato il standard di esclusione dei robot (robots.txt) per determinare se un sito Web verrà sottoposto a scansione o, se già sottoposto a scansione, se i suoi archivi saranno visibili pubblicamente. I proprietari di siti Web avevano la possibilità di rinunciare a Wayback Machine attraverso l'uso di robots.txt. Ha applicato retroattivamente le regole di robots.txt; se un sito bloccava Internet Archive, anche tutte le pagine precedentemente archiviate del dominio venivano immediatamente rese non disponibili. Inoltre, l'Internet Archive ha affermato che "a volte, il proprietario di un sito web ci contatterà direttamente e ci chiederà di interrompere la scansione o l'archiviazione di un sito. Rispettiamo queste richieste". Inoltre, il sito web afferma: "L'Internet Archive non è interessato a conservare o offrire l'accesso a siti Web o altri documenti Internet di persone che non vogliono i loro materiali nella raccolta".
Il 17 aprile 2017 sono emerse segnalazioni di siti che erano diventati defunti e diventati domini parcheggiati che utilizzavano robots.txt per autoescludersi dai motori di ricerca, risultando inavvertitamente esclusi dalla Wayback Machine. Internet Archive ha modificato la politica per richiedere ora una richiesta di esclusione esplicita per rimuoverlo dalla Wayback Machine.
La politica di esclusione retroattiva di Wayback si basa in parte su Raccomandazioni per la gestione delle richieste di rimozione e la conservazione dell'integrità dell'archivio pubblicato dalla School of Information Management and Systems at University of California, Berkeley nel 2002, che conferisce al proprietario di un sito web il diritto di bloccare l'accesso agli archivi del sito. Wayback ha rispettato questa politica per evitare costosi contenziosi.
La politica di esclusione retroattiva di Wayback ha iniziato ad allentarsi nel 2017, quando ha smesso di onorare i robot sui siti Web del governo e dell'esercito degli Stati Uniti sia per la scansione che per la visualizzazione di pagine Web. A partire da aprile 2017, Wayback ignora robots.txt in modo più ampio, non solo per i siti Web del governo degli Stati Uniti.
Dal suo lancio pubblico nel 2001, la Wayback Machine è stata studiata dagli studiosi sia per le modalità con cui memorizza e raccoglie i dati sia per le effettive pagine contenute nel suo archivio. Nel 2013, gli studiosi avevano scritto circa 350 articoli sulla Wayback Machine, principalmente dai campi della tecnologia dell'informazione, della scienza delle biblioteche e delle scienze sociali. Gli studiosi di scienze sociali hanno utilizzato la Wayback Machine per analizzare come lo sviluppo dei siti Web dalla metà degli anni '1990 ad oggi abbia influenzato la crescita dell'azienda.
Quando la Wayback Machine archivia una pagina, di solito include la maggior parte dei collegamenti ipertestuali, mantenendoli attivi quando altrettanto facilmente avrebbero potuto essere interrotti dall'instabilità di Internet. I ricercatori in India hanno studiato l'efficacia della capacità della Wayback Machine di salvare i collegamenti ipertestuali nelle pubblicazioni accademiche online e hanno scoperto che ne ha salvati poco più della metà.
"I giornalisti usano la Wayback Machine per visualizzare siti Web morti, notizie datate e modifiche ai contenuti dei siti Web. Il suo contenuto è stato utilizzato per ritenere i politici responsabili e smascherare bugie sul campo di battaglia". Nel 2014, una pagina di social media archiviata di Igor Girkin, un leader ribelle separatista in Ucraina, lo ha mostrato mentre si vantava del fatto che le sue truppe avessero abbattuto un sospetto aereo militare ucraino prima che si sapesse che l'aereo era in realtà un jet civile della Malaysian Airlines (Volo Malaysia Airlines 17), dopo di che ha cancellato il post e ha accusato l'esercito ucraino di aver abbattuto l'aereo. In 2017, l' March for Science nato da una discussione su Reddit che indicava che qualcuno aveva visitato Archive.org e scoperto che tutti i riferimenti a cambiamento climatico era stato cancellato dal sito web della Casa Bianca. In risposta, un utente ha commentato: "Ci deve essere una marcia degli scienziati su Washington".
Inoltre, il sito è ampiamente utilizzato per la verifica, fornendo accesso a riferimenti e creazione di contenuti da parte di Redattori di Wikipedia.
A settembre 2020 è stata annunciata una partnership con Cloudflare per archiviare automaticamente i siti Web serviti tramite il suo servizio "Always Online", che gli consentirà anche di indirizzare gli utenti alla sua copia del sito se non può raggiungere l'host originale.
Nel 2014 c'è stato un intervallo di sei mesi tra il momento in cui un sito Web è stato sottoposto a scansione e il momento in cui è diventato disponibile per la visualizzazione nella Wayback Machine. Attualmente, il tempo di ritardo è compreso tra 3 e 10 ore. La Wayback Machine offre solo funzioni di ricerca limitate. La sua funzione "Ricerca nel sito" consente agli utenti di trovare un sito in base alle parole che descrivono il sito, piuttosto che alle parole trovate nelle pagine web stesse.
La Wayback Machine non include tutte le pagine web mai realizzate a causa delle limitazioni del suo web crawler. La Wayback Machine non può archiviare completamente le pagine Web che contengono funzionalità interattive come piattaforme Flash e moduli scritti in JavaScript e applicazioni web progressive, perché tali funzioni richiedono l'interazione con il sito Web host. Ciò significa che, dal 9 luglio 2013 circa, la Wayback Machine non è stata in grado di visualizzare i commenti di YouTube durante il salvataggio delle pagine di visualizzazione dei video, poiché, secondo l'Archive Team, i commenti non vengono più "caricati all'interno della pagina stessa". Il web crawler di Wayback Machine ha difficoltà a estrarre qualsiasi cosa non codificata in HTML o in una delle sue varianti, il che spesso può causare collegamenti ipertestuali interrotti e immagini mancanti. Per questo motivo, il web crawler non può archiviare "pagine orfane" a cui non sono collegate altre pagine. Il crawler di Wayback Machine segue solo un numero predeterminato di collegamenti ipertestuali in base a un limite di profondità preimpostato, quindi non può archiviare ogni collegamento ipertestuale su ogni pagina.
In un caso del 2009, Netbula, LLC contro Chordiant Software Inc., l'imputato Chordiant ha presentato una mozione per costringere Netbula a disabilitare il robots.txt file sul suo sito Web che stava facendo sì che la Wayback Machine rimuovesse retroattivamente l'accesso alle versioni precedenti delle pagine che aveva archiviato dal sito di Netbula, pagine che Chordiant riteneva avrebbero supportato il suo caso.
Netbula si è opposta alla mozione sulla base del fatto che gli imputati chiedevano di modificare il sito Web di Netbula e che avrebbero dovuto citare in giudizio Internet Archive direttamente per le pagine. Tuttavia, un dipendente di Internet Archive ha presentato una dichiarazione giurata a sostegno della mozione di Chordiant, affermando che non poteva produrre le pagine Web con nessun altro mezzo "senza oneri, spese e interruzioni considerevoli delle sue operazioni".
Il magistrato giudice Howard Lloyd nel distretto settentrionale della California, divisione di San Jose, ha respinto le argomentazioni di Netbula e ha ordinato loro di disabilitare temporaneamente il blocco robots.txt per consentire a Chordiant di recuperare le pagine archiviate che cercavano.
In un caso dell'ottobre 2004, Telewizja Polska USA, Inc. v. Satellite Echostar, N. 02 C 3293, 65 Fed. R. Evid. Servizio 673 (ND Ill. 15 ottobre 2004), una parte in causa ha tentato di utilizzare gli archivi della Wayback Machine come fonte di prova ammissibile, forse per la prima volta. Telewizja Polska è il fornitore di PST Polonia e EchoStar gestisce il Dish Network. Prima del procedimento giudiziario, EchoStar ha indicato che intendeva offrire istantanee di Wayback Machine come prova del contenuto passato del sito web di Telewizja Polska. Telewizja Polska propone una mozione in limina per sopprimere le istantanee sulla base di diceria e fonte non autenticata, ma il magistrato giudice Arlander Keys ha respinto l'affermazione di Telewizja Polska per sentito dire e ha negato la mozione di TVP in limina escludere le prove al processo. Al processo, tuttavia, il giudice del tribunale distrettuale Ronald Guzman, il giudice del processo, ha annullato le conclusioni del magistrato Keys e ha ritenuto che né l'affidavit del dipendente di Internet Archive né le pagine sottostanti (ovvero il sito Web di Telewizja Polska) fossero ammissibili come prova. Il giudice Guzman ha affermato che l'affidavit del dipendente conteneva sia dicerie che dichiarazioni di supporto inconcludenti, e la presunta pagina web, le stampe non erano auto-autenticanti.
Le Ufficio brevetti degli Stati Uniti e la Ufficio europeo dei brevetti accetterà timbri di data dall'Internet Archive come prova di quando una determinata pagina Web è stata accessibile al pubblico. Queste date vengono utilizzate per determinare se una pagina Web è disponibile come arte preesistente ad esempio nell'esame di una domanda di brevetto.
Esistono limitazioni tecniche all'archiviazione di un sito Web e, di conseguenza, le parti in causa possono utilizzare in modo improprio i risultati forniti dagli archivi del sito Web. Questo problema può essere esacerbato dalla pratica di inviare screenshot di pagine web in reclami, risposte o perizie quando i collegamenti sottostanti non sono esposti e quindi possono contenere errori. Ad esempio, archivi come la Wayback Machine non compilano moduli e quindi non includono i contenuti di documenti nonRiposante database di e-commerce nei loro archivi.
In Europa, la Wayback Machine potrebbe essere interpretata come una violazione copyright legislazione. Solo il creatore del contenuto può decidere dove pubblicare o duplicare il proprio contenuto, quindi l'Archivio dovrebbe eliminare le pagine dal suo sistema su richiesta del creatore. Le politiche di esclusione per la Wayback Machine possono essere trovate nella sezione FAQ del sito.
Alcuni casi sono stati intentati contro Internet Archive appositamente per i suoi sforzi di archiviazione di Wayback Machine.
Alla fine del 2002, Internet Archive ha rimosso vari siti critici Scientology dalla Wayback Machine. Un messaggio di errore affermava che ciò era in risposta a una "richiesta del proprietario del sito". Successivamente, è stato chiarito che gli avvocati del Chiesa di Scientology aveva chiesto la rimozione e che i proprietari del sito non volevano che il loro materiale fosse rimosso.
Nel 2003, Harding Earley Follmer & Frailey ha difeso un cliente da una controversia sui marchi utilizzando la Wayback Machine dell'Archivio. Gli avvocati sono stati in grado di dimostrare che le affermazioni avanzate dall'attore non erano valide, sulla base del contenuto del loro sito Web di diversi anni prima. L'attore, Healthcare Advocates, ha quindi modificato la propria denuncia per includere l'Internet Archive, accusando l'organizzazione di violazione del copyright e violazioni del DMCA e la Computer fraudolento e abuso. Healthcare Advocates ha affermato che, dal momento che avevano installato a robots.txt file sul loro sito web, anche se dopo la presentazione della causa iniziale, l'Archivio avrebbe dovuto rimuovere tutte le copie precedenti del sito web dell'attore dalla Wayback Machine, tuttavia, parte del materiale continuava ad essere pubblicamente visibile su Wayback. La causa è stata risolta in via extragiudiziale dopo che Wayback ha risolto il problema.
Attivista Suzanne Shell ha intentato una causa nel dicembre 2005, chiedendo a Internet Archive di pagarle 100,000 dollari per l'archiviazione del suo sito web profane-justice.org tra il 1999 e il 2004. Internet Archive ha depositato a giudizio dichiarativo azione nel Tribunale distrettuale degli Stati Uniti per il distretto settentrionale della California il 20 gennaio 2006, chiedendo una determinazione giudiziaria secondo cui Internet Archive non ha violato Shell's copyright. Shell ha risposto e ha portato a controquerela contro Internet Archive per l'archiviazione del suo sito, che lei sostiene sia in violazione di lei termini di servizio. Il 13 febbraio 2007, un giudice per il Corte Distrettuale degli Stati Uniti per il Distretto del Colorado ha respinto tutte le domande riconvenzionali tranne violazione del contratto. L'Internet Archive non si è mosso per licenziare violazione del copyright rivendicazioni asserite da Shell derivanti dalle sue attività di copiatura, che andrebbero anche avanti.
Il 25 aprile 2007, Internet Archive e Suzanne Shell hanno annunciato congiuntamente la risoluzione della loro causa. L'Internet Archive ha affermato che "... non ha alcun interesse a includere materiali nella Wayback Machine di persone che non desiderano che i loro contenuti Web vengano archiviati. Riconosciamo che la signora Shell ha un copyright valido e applicabile nel suo sito Web e noi rammarico che l'inclusione del suo sito Web nella Wayback Machine abbia portato a questo contenzioso." Shell ha detto: "Rispetto il valore storico dell'obiettivo di Internet Archive. Non ho mai avuto intenzione di interferire con quell'obiettivo né di causargli alcun danno".
Tra il 2013 e il 2016, a attore pornografico di nome Daniel Davydiuk ha cercato di rimuovere le immagini archiviate di se stesso dall'archivio della Wayback Machine, prima inviando più immagini Richieste DMCA all'archivio, e poi appellandosi al Tribunale federale del Canada. Le immagini sono state poi finalmente rimosse dal sito web nel 2017.
Nel 2018, archivi di applicazione stalker FlexispyIl sito Web di è stato rimosso dalla Wayback Machine. La società ha affermato di aver contattato l'Internet Archive, presumibilmente per rimuovere gli archivi del suo sito web.
Archive.org è attualmente bloccato in Cina. Dopo che l'organizzazione terroristica dello Stato islamico è stata messa al bando, l'Internet Archive lo era stato bloccato nella sua interezza in Russia come ospite di un video di sensibilizzazione di quell'organizzazione, per un breve periodo nel 2015-16.[ha bisogno di aggiornamento] Dal 2016, il sito web è tornato, disponibile nella sua interezza, sebbene i lobbisti commerciali locali abbiano citato in giudizio l'Internet Archive in un tribunale locale per vietarlo per motivi di copyright.
Alison Macrina, direttore del Progetto Libreria Libertà, osserva che "mentre i bibliotecari apprezzano profondamente la privacy individuale, noi ci opponiamo fermamente anche alla censura".
C'è almeno un caso in cui un articolo è stato rimosso dall'archivio poco dopo essere stato rimosso dal suo sito web originale. UN Daily Beast Il giornalista aveva scritto un articolo che denunciava diversi atleti olimpionici gay nel 2016 dopo aver creato un profilo falso fingendosi un uomo gay su un'app di appuntamenti. The Daily Beast ha rimosso l'articolo dopo che è stato accolto con diffuso clamore; non molto tempo dopo, anche l'Internet Archive ha fatto altrettanto, ma ha affermato con enfasi di averlo fatto per nessun altro motivo se non quello di proteggere la sicurezza degli atleti eliminati.
Altre minacce includono disastri naturali, distruzione (remota o fisica), manipolazione del contenuto dell'archivio (vedi anche: attacco informatico, di riserva), leggi problematiche sul diritto d'autore e sorveglianza degli utenti del sito.
Alexander Rose, direttore esecutivo del Fondazione Long Now, sospetta che a lungo termine di più generazioni "quasi nulla" sopravviverà in modo utile, affermando: "Se abbiamo continuità nella nostra civiltà tecnologica, sospetto che molti dei dati nudi rimarranno trovabili e ricercabili. Ma io sospetto che quasi nulla del formato in cui è stato consegnato sarà riconoscibile" perché i siti "con profondi back-end di sistemi di gestione dei contenuti come Drupal, Ruby e Django" sono più difficili da archiviare.
In un articolo che riflette sulla conservazione della conoscenza umana, The Atlantic ha commentato che Internet Archive, che si descrive come costruito per il lungo termine, "sta lavorando furiosamente per acquisire dati prima che scompaiano senza alcuna infrastruttura a lungo termine di cui parlare".
{{cite web}}
: Manutenzione CS1: copia archiviata come titolo (collegamento)
Abbiamo aggiunto la possibilità di archiviare una pagina all'istante e recuperare un URL permanente per quella pagina nella Wayback Machine. Questo servizio consente a chiunque - redattori di wikipedia, studiosi, professionisti legali, studenti o cuochi casalinghi come me - di creare un URL stabile per citare, condividere o aggiungere ai segnalibri qualsiasi informazione a cui desiderano avere ancora accesso in futuro.
2015-03-25: Ultimi URL ospitati in questo indirizzo IP rilevati da almeno uno scanner di URL o set di dati di URL dannosi. ... 2/62 2015-03-25 16:14:12 /Rinegoziazione_TLS.pdf ... 1/62 2015-03-25 04:46:34 /CBLightSetup.exe
2015-03-25: una parte di questo sito è stata elencata per attività sospette 138 volte negli ultimi 90 giorni. ... Cosa è successo quando Google ha visitato questo sito? ... Delle 42410 pagine che abbiamo testato sul sito negli ultimi 90 giorni, 450 pagine hanno provocato il download e l'installazione di software dannoso senza il consenso dell'utente. L'ultima volta che Google ha visitato questo sito è stato il 2015-03-25 e l'ultima volta che sono stati trovati contenuti sospetti su questo sito è stato il 2015-03-25. ... Il software dannoso include 169 trojan(s), 126 virus, 43 backdoor(s).
1) L'istanza di Internet Archive di rigetto della domanda riconvenzionale di Shell per conversione e furto civile (Seconda causa di azione) è ACCOLTA, 2) L'istanza di Internet Archive di rigetto della domanda riconvenzionale di Shell per inadempimento contrattuale (Terza causa di azione) è NEGATA; 3) L'istanza di Internet Archive per respingere la domanda riconvenzionale della Shell per racket ai sensi di RICO e COCCA (quarta causa di azione) è ACCETTATA.
I computer possono stipulare contratti per conto di persone. L'Uniform Electronic Transactions Act (UETA) afferma che un "contratto può essere formato dall'interazione degli agenti elettronici delle parti, anche se nessun individuo era a conoscenza o ha esaminato le azioni degli agenti elettronici oi termini e gli accordi risultanti".
Ancora più importante, ha affermato il tribunale, la semplice copia del sito Shell da parte di Internet Archive e la sua visualizzazione nel suo database non costituivano l'esercizio richiesto del dominio e del controllo sulla proprietà dell'imputato. È importante sottolineare che, ha osservato la corte, l'imputato ha sempre posseduto e gestito il proprio sito. La Corte ha affermato: "Shell non ha addotto fatti che dimostrino che Internet Archive esercitasse il dominio o il controllo sul suo sito Web, poiché la denuncia di Shell afferma esplicitamente che ha continuato a possedere e gestire il sito Web mentre era archiviato sulla macchina Wayback". Shell non identifica alcuna autorità a sostegno dell'idea che la copia di documenti sia di per sé una privazione dell'uso sufficiente a supportare la conversione. Al contrario, numerosi circuiti hanno stabilito che non lo è.'
Entrambe le parti si rammaricano sinceramente di qualsiasi tumulto che la causa possa aver causato all'altra. Né Internet Archive né Ms. Shell condonano alcuna condotta che possa aver causato danni a entrambe le parti derivanti dall'attenzione del pubblico a questa causa. Le parti non si sono impegnate in tale condotta e chiedono che la risposta pubblica alla risoluzione amichevole di questo contenzioso sia coerente con i loro desideri che nessun ulteriore danno o tumulto sia causato a nessuna delle parti.
Die Betreiber des Archives fürchten neben Zensur und Manipulation der Digitalen Aufzeichnungen demnach auch die Überwachung der Archive-Nutzer. .