Così canta la sua America Bruce Springsteen in una delle sue canzoni più famose, noi non ci siamo nati ma ci è più volte capitato di giungerci, almeno digitalmente, nelle pagine di questo blog. Abbiamo parlato in passato delle biblioteche americane e della loro predisposizione al digitale, biblioteche hub, biblioteche ludiche, biblioteche senza libri, bibliotecarie e bibliotecari creatori di app, tecnologie, codici, dati o metadati e andando piano piano a sbirciare nel grande mare della ricerca Internet abbiamo trovato una piccola notizia che potrebbe essere una grande fonte d’ispirazione. La Library of Congress lancia un nuovo strumento per la ricerca nelle immagini storiche di riviste e giornali. Più di 1,5 milioni di immagini di giornali storici sono ora reperibili online con Newspaper Navigator. I curiosi, gli appassionati, i ricercatori e gli utenti possono esplorare più di 1,5 milioni di immagini di giornali storici online gratuitamente. Newspaper Navigator è una grande esperienza di machine learning 1 dei Library of Congress Labs e grazie alle sue tecniche aiuta l’utente a ricercare immagini di giornali schedati e scannerizzati in un grandissimo arco temporale che va dal 1789 al 1963. La ricerca basata sull’utilizzo di tag, soggetti e parole chiave permette all’utente, come nella ricerca internet, di navigare in una moltitudine di risultati restituiti. L’utente dalla prima immagine selezionata può muoversi liberamente nei risultati e in una serie d’immagini correlate consentendo la scoperta di immagini correlate che in precedenza non erano rilevabili dai motori di ricerca. Grazie all’ingegnosità creativa di Innovator in Residence 2 Benjamin Lee e ai progressi nell’apprendimento automatico, Newspaper Navigator ora rende le immagini nei giornali ricercabili consentendo agli utenti di cercare per somiglianza visiva. Per creare Newspaper Navigator, Lee ha programmato dati ed algoritmi informatici per ordinare 16 milioni di pagine di giornale e una mole enorme di fotografie, illustrazioni, mappe, cartoni animati, fumetti, titoli e pubblicità. L’idea per il progetto è nato in maniera collettiva attraverso un esperimento di crowdsourcing della biblioteca condotto da Innovator in Residence Tong Wang nel 2017 chiamato Beyond Words, che invitava i membri del pubblico ad aiutare a identificare cartoni animati, illustrazioni, fotografie e pubblicità sui giornali dell’era della prima guerra mondiale.
1 L’apprendimento automatico (noto anche come machine learning) è una branca dell’intelligenza artificiale che raccoglie metodi sviluppati negli ultimi decenni del XX secolo in varie comunità scientifiche, sotto diversi nomi quali: statistica computazionale, riconoscimento di pattern, reti neurali artificiali, filtraggio adattivo, teoria dei sistemi dinamici, elaborazione delle immagini, data mining, algoritmi adattivi, ecc; che utilizza metodi statistici per migliorare la performance di un algoritmo nell’identificare pattern nei dati. Nell’ambito dell’informatica, l’apprendimento automatico è una variante alla programmazione tradizionale nella quale in una macchina si predispone l’abilità di apprendere qualcosa dai dati in maniera autonoma, senza istruzioni esplicite.
2 Innovator-in-Residence Program. La Library of Congress ha avviato un programma speciale per unire al meglio cultura umanistica e cultura digitale. Un ampio programma per supportare, stimolare e favorire gli usi innovativi e creativi delle collezioni per mostrare agli utenti come una Biblioteca può arricchire il lavoro, la vita e donare una nuova prospettiva alle proprie collezioni. Questo programma è alla ricerca di artisti, giornalisti, ricercatori, insegnanti e altri che desiderano immaginare e prototipare nuove idee e nuove visioni per la biblioteca utilizzando idee e abilità innovative e e al passo con i tempi.
Luca Valenza, bibliotecario errante