# Cassandra Crossing/ Archivismi: archiviamo Cassandra, parte seconda
(565) --- Dopo aver preparato i pdf non ci sono più scuse, dobbiamo archiviare il nostro primo articolo di Cassandra Crossing. ------------------------------------------------------------------------ ### Cassandra Crossing/ Archivismi: archiviamo Cassandra, parte seconda ![](https://cdn-images-1.medium.com/max/800/1*8cSHLCbycr_q0sNGCC1kxw.png){.graf-image image-id="1*8cSHLCbycr_q0sNGCC1kxw.png" data-width="600" data-height="338" is-featured="true"} *(565) --- Dopo aver preparato i pdf non ci sono più scuse, dobbiamo archiviare il nostro primo articolo di Cassandra Crossing.* **1 gennaio 2024** --- Nelle [precedenti puntate di *Archivismi*](https://calamarim.medium.com/list/archivismi-la-serie-689254e647ad){.markup--anchor .markup--p-anchor data-href="https://calamarim.medium.com/list/archivismi-la-serie-689254e647ad" rel="noopener" target="_blank"} abbiamo raccontato le caratteristiche principali di Internet Archive, e caricato un semplice documento di esempio. Successivamente ci siamo dati l'ambizioso obbiettivo di uploadare l'*opera omnia* di Cassandra, ed abbiamo faticosamente preparato il materiale necessario nei formati e struttura più opportuni. Non ci sono più scuse; è il momento di iniziare a caricare il primo documento di Cassandra Crossing, con tutte le cosette ed i metadati al posto giusto! Dobbiamo quindi cimentarci davvero con *ia* e, visto che dovremo caricare centinaia di documenti, non farlo direttamente con la linea comandi, caricando un file per volta e scrivendo tutti i parametri ed i metadati su una lunghissima linea comandi. Molto meglio impratichirsi fin da subito con i *bulk upload*, che si realizzano fornendo ad *ia* un unico parametro, cioè il nome di un foglio elettronico in formato CSV, in cui inseriremo i dati necessari (e li modificheremo tantissime volte per rimediare ad inevitabili errori). Il comando per fare ciò è semplicemente > ia upload --- spreadsheet=metadata.csv Il lavoro vero sarà riempire il foglio elettronico finale con migliaia di righe di dati, ma facciamo un passo alla volta e carichiamo un solo oggetto, per cui un file di tre righe basterà. Il nostro primo documento conterrà due file tra quelli generati per l'archiviazione, il *pdf* come documento principale e l'*html entrocontenuto* come secondo file; aggiungeremo anche un *minimo sindacale* di metadati, e l'identificativo verrà scelto uguale al nome dei file, tolta l'estensione. Insomma, dopo molti, molti tentativi ecco il foglio ... ![](https://cdn-images-1.medium.com/max/800/1*oZyri9qYiZzmtt-uSpW7AA.png){.graf-image image-id="1*oZyri9qYiZzmtt-uSpW7AA.png" data-width="1306" data-height="371"} Sembra facile, ma c'è voluta mezza giornata di lavoro, per avere il primo inserimento soddisfacente. Minuzie apparentemente insignificanti ma in realtà diaboliche hanno richiesto un sacco di tempo per prove e controprove. Ve ne racconto qualcuna qui, sperando così di farvi risparmiare tempo prezioso. **uno **--- quando salvate un foglio elettronico in formato CSV, che vuol dire "*valori separati da virgole*" non fidatevi della vostra applicazione. In certi casi, qui in Italia, l'applicazione potrebbe decidere di usare non la virgola ma il punto e virgola, e voi non ve ne accorgerete subito. Giuro, è successo! **due **--- disabilitate, nell'applicazione con cui state gestendo il foglio elettronico, tutti gli strumenti di autocorrezione; altrimenti il programma deciderà certamente di sostituire qualcosa per *il vostro bene*. Nel mio caso ha deciso di sostituire due segni meno consecutivi, presenti nei nomi di file, con un "*trattino lungo*", una modifica praticamente invisibile, anche da linea comandi. Questo ha portato all'inspiegabile messaggio di errore di *file non trovato*, ed ha rese necessarie alcune dozzine di prove, con relativi arrampicamenti sugli specchi. Non riferisco qui le parole che sono state pronunciate quando il problema è stato finalmente localizzato! **tre **--- state molto attenti quando inserite i valori nei campi. Un singolo spazio bianco prima o dopo il valore può non farlo interpretare, ed avere effetti imprevisti. Uno spazio all'inizio di " ***test_collection***" ha ad esempio impedito l'assegnazione corretta dell'oggetto alla *collection di test*, destinata, come già sapete, ad abilitare la cancellazione automatica dopo 30 giorni. In più considerate che non è possibile assegnare esplicitamente l'oggetto a collezioni pubbliche come "*opendata*", ma bisogna accettare la selezione automatica che verrà operata dal sistema. **quattro **--- inserite nel foglio la colonna *mediatype*, quando i documenti sono testuali (txt, html, pdf, etc.), ed usate il valore, "*texts*" altrimenti il sistema assegnerà automaticamente il valore "*data*" e questo avrà effetti collaterali insidiosi. Ad esempio il *browser di oggetti* non vi farà sfogliare le pagine, malgrado tutti i file derivati necessari siano stati creati correttamente. Il *mediatype*, contrariamente alla grande maggioranza dei parametri, non può più essere modificato, ma è necessario cancellare e rigenerare l'oggetto. **cinque **--- cancellare un oggetto non è un'operazione istantanea, ma richiede minuti o decine di minuti prima che l'effetto si propaghi in tutte la parti dell'interfaccia del sito. Non merita cancellare da linea comandi con *ia*; è decisamente più pratico farlo dalla pagina *My Upload*. Ricaricate spesso la pagina, e se notate cose strane, provate anche a svuotare la cache del browser. **sei **--- la comparsa di un oggetto appena creato nella finestra *My Upload* è, stranamente, abbastanza veloce, ma scatena tutte le operazioni "*derivative*", che a loro volta generano gli altri file in tempi variabili ma abbastanza lunghi. Questo vuol dire, ad esempio, che il *browser di oggetti* non sarà in grado di farvi sfogliare le pagine prima di una mezz'ora, e che la funzionalità di ricerca interna al *browser di oggetti* sarà attiva solo dopo parecchie ore. **Però, alla fine, che soddisfazione ...** ![](https://cdn-images-1.medium.com/max/800/1*ZeAO_D-SzIHRLYzadTs-GQ.png){.graf-image image-id="1*ZeAO_D-SzIHRLYzadTs-GQ.png" data-width="819" data-height="761"} Ed anche per oggi è tutto. *Stay tuned* per la prossima puntata di "*Archivismi*". [Scrivere a Cassandra](mailto:%20cassandra@cassandracrossing.org){.markup--anchor .markup--p-anchor data-href="mailto:%20cassandra@cassandracrossing.org" rel="noopener ugc nofollow" target="_blank"} --- [Twitter](https://twitter.com/calamarim){.markup--anchor .markup--p-anchor data-href="https://twitter.com/calamarim" rel="noopener ugc nofollow noopener noopener noopener noopener noopener noopener noopener noopener noopener noopener" target="_blank"} --- [Mastodon](https://mastodon.uno/@calamarim){.markup--anchor .markup--p-anchor data-href="https://mastodon.uno/@calamarim" rel="noopener ugc nofollow noopener noopener noopener noopener noopener noopener noopener noopener noopener noopener" target="_blank"}\ [Videorubrica "Quattro chiacchiere con Cassandra"](https://www.youtube.com/user/orogong/videos){.markup--anchor .markup--p-anchor data-href="https://www.youtube.com/user/orogong/videos" rel="noopener ugc nofollow noopener noopener noopener noopener noopener noopener noopener noopener noopener noopener" target="_blank"} tempo\ [Lo Slog (Static Blog) di Cassandra](http://www.cassandracrossing.org/){.markup--anchor .markup--p-anchor data-href="http://www.cassandracrossing.org/" rel="noopener ugc nofollow noopener noopener noopener noopener noopener noopener noopener noopener noopener noopener" target="_blank"} \ [L'archivio di Cassandra: scuola, formazione e pensiero](https://medium.com/@calamarim){.markup--anchor .markup--p-anchor data-href="https://medium.com/@calamarim" rel="noopener" target="_blank"} ***Licenza d'utilizzo****: i contenuti di questo articolo, dove non diversamente indicato, sono sotto licenza Creative Commons Attribuzione --- Condividi allo stesso modo 4.0 Internazionale (CC BY-SA 4.0),* tutte le informazioni di utilizzo del materiale sono disponibili a [questo link](https://creativecommons.org/licenses/by-sa/4.0/deed.it){.markup--anchor .markup--p-anchor data-href="https://creativecommons.org/licenses/by-sa/4.0/deed.it" rel="noopener ugc nofollow noopener noopener noopener noopener noopener noopener noopener noopener noopener noopener" target="_blank"}*.* By [Marco A. L. Calamari](https://medium.com/@calamarim){.p-author .h-card} on [January 3, 2024](https://medium.com/p/cafd4fb6566e). [Canonical link](https://medium.com/@calamarim/cassandra-crossing-archivismi-archiviamo-cassandra-parte-seconda-cafd4fb6566e){.p-canonical} Exported from [Medium](https://medium.com) on January 15, 2024.