4000 bibliotekarier är samlade i Lyon för att diskutera idéer, erfarenheter, utvecklingslinjer, framtidsfrågor. Tänk om alla dessa kvalificerade yrkesmänniskor kunde kopplas samman i ett enda medvetande, som drar nytta av sammanlagt kanske 15 miljoner arbetsdagar i världens bibliotek. Så lätt det då skulle vara att peka ut branschens heta ämnen, utveckla strategier och undvika fallgropar.

Det är ungefär detta TDM handlar om.

Uttrycket ”text and data mining” har varit på alla bibliotekariers läppar under de sista två åren, och det rör sig alltså om en teknik för analys och utvinnande av nya insikter/kunskaper ur väldiga samlingar digital data.  Den analysbara datamängden är verkligen oerhörd och växer kraftigt hela tiden. Gruvdriftsmetaforen är på sin plats. Det krävs avancerad teknik men här finns guld att bryta.

Peter Leonard från Yale (tidigare Fulbrightforskare i Uppsala) talade på IFLA-konferensen idag om humanisternas nytta av TDM. Han vittnade om forskarnas stora intresse, men också om att kunskaperna om metoderna ännu inte är lika stora. Här, menade Leonard, finns en självklar möjlighet för biblioteken att spela en roll.

Ännu är TDM i sin linda, men redan de pedagogiska exempel som Leonard presenterades väckte nyfikenhet. En körning efter orden ”lady”, ”woman” and ”girl” i samtliga texter av drygt hundra årgångar av Vogue gav fascinerande grafiska kurvor, liksom nyckelord inom hälsofrågor. Mer sofistikerade modeller ger förstås ännu intressantare resultat.  För en forskare med lång erfarenhet av mödosam och tidsödande litteratursökning inför ett nytt projekt öppnar sig nu fantastiska möjligheter att samla primär- och sekundärmaterial. Här finns också helt nya sätt att verifiera hypoteser; ofta har forskaren på känn att något finns i ett stort material men har  saknat möjligheter att verkligen visa det.

Tekniken finns, men också en snårig juridik. I den traditionella bokvärlden kunde inget förlag invända mot att en mänsklig snabbläsare – på jakt efter nyckelfraser – kursivt gick igenom volym efter volym i bibliotekets bokhyllor. Numera lägger ofta upphovsrättslagstiftning, databasskydd, kontraktsöverenskommelser och tekniska säkerhetsmurar hinder på den digitala vägen. Elsevier hör till de förlag som inte tillåter TDM. Föga överraskande, eftersom just den kunskap som kan utvinnas ur de stora datamängderna är så kommersiellt värdefull.

Biblioteken världen över hör till de öppna och framstegsvänliga, inte minst genom att man gör sin metadata tillgänglig. Det är därför inte överraskande att den europeiska föreningen av forskningsbibliotek, LIBER, engagerat sig kraftigt i frågan om copyright och TDM. Susan Reilly från LIBER beskrev situationen och underströk att det handlar om mycket mer än man först tror. Genom att Europa har strängare juridiska regler än USA (och numera även Storbritannien) hamnar den europeiska forskningen i bakvattnet. Därmed försvåras samhällsutvecklingen. Och det handlar nu verkligen inte bara om hum-samforskning utan ännu mer om naturvetenskap och medicin. Medan 1100 TDM-relaterade patent tagits ut i USA ligger den europeiska siffran på 39. När man inser teknikens möjligheter inom de datastinna empiriska vetenskaperna förstår man situationens allvar.

Juridiken har tillsammans med den digitala tekniken flyttat in i biblioteken. TDM är ett exempel. Fler finns. Frågorna är verkligen inte enkla, men i botten finns ett behov av att balansera en rad rättmätiga krav och anspråk mot varandra. Inte minst handlar det om samhällsintressen. Därför blir frågorna även politik.