Bortom siffrorna

För drygt en vecka sedan var jag på altmetri-konferens, 3:AM Bucharest. Själva konferensen pågick två dagar, en dag innan hölls en workshop med mer fokus på diskussioner och dagen efter en hackdag då vi arbetade med data.

När det kommer till data ser jag tydligare och tydligare uppdelningen i två spår: Utvärdering och Upptäckt. Väljer vi spår 1: Utvärdering hamnar fokus på datakvalitet och möjligheten att jämföra data mellan ämnen, tidsperioder, forskare etc. Och på den stora frågan om det går att kvantitativt utvärdera mänskliga aktiviteter. Där verkar de flesta landa i att det går att ta fram kvantitativa underlag som hjälp till de människor som är satta att utvärdera andras aktiviteter. Hursomhelst ger arbetet ofta en känsla av tvångströja; data är ofta inte tillräckligt fullständigt, skevt åt något håll och inte objektivt. Det är också relativt lätt att manipulera och inte lätt att bestämma vad data representerar (en citering är inte ett mått på vetenskaplig kvalitet men väl vetenskapligt genomslag, eller?).

Om vi väljer det andra spåret, Upptäckt, sitter koftan genast mycket lösare. Kan vi använda data för att upptäcka ställen på nätet vi inte visste om, men skulle kunna ha nytta av? Finns möjligheten att kategorisera användare efter deras beteende, till exempel på Twitter? Om en tillräckligt stor datamängd vänds och vrids på olika håll, går det att skönja trender och samband som inte var de på förhand uppenbara att söka efter?

Jag hade ett bidrag med på workshopen, om lokala förutsättningar. Dels vill vi följa publikationer publicerade i Skandinavien på ett bra sätt och så vill vi söka dem i skandinaviska datakällor som nyhetssajter, bloggar och svenskspråkiga Wikipedia. Min fundering var vad vi bör fokusera på då det finns mycket att förbättra. Det allra första svaret jag fick var att fråga forskarna, vad tycker de är viktigast att spåra lokalt? Därefter pratade vi om vikten av identifierare, att sätta t ex DOIs på skandinaviska publikationer. Att spåra publikationer i lokala källor bör vara relativt enkelt, menade flera av altmetriföretagen på plats. Det är ju såklart av intresse för dem att kunna erbjuda en anpassad tjänst.

Konferensen inleddes med en bred överblick av Dan Penny från Springer Nature. Bland annat var det intressant att se det senaste inom bokspårning, och vad bokförfattare värderade som intressant data att få ta del av. Rodrigo Costas och Zohreh Zahedi, båda från Leiden, gör en hel del intressant kring altmetri tillsammans med Stephanie Haustein i Montreal. Rodrigo visade fördelningar för altmetridata: t ex följer Mendeleyläsare samma skeva fördelning som citeringar visar upp. Många läser en och samma artiklar, och många artiklar har få eller inga läsare. De har också analyserat Twitterdata ur olika vinklar,bl a olika typer av konton: Är jag en mumbler eller orator? Den här och flera andra presentationer hade också använt VOSviewer för att visualisera Twitterdata (se exempel).

CrossRef återkom till sitt nya initiativ: CrossRef Event Data. En event (händelse) är när någon refererar till en DOI på Wikipedia, delar den på Twitter etc. Genom att spara dessa händelser kan även raderade händelser analyseras, t ex vid så kallade Wikipedia Edit wars. Joe Wass från CrossRef menade att även borttagna händelser kan vara av intresse. Det är de säkert, men just nu känns det överkurs när vi kämpar med att överhuvudtaget spåra publikationerna. Men det gör ju inget att några rör sig i frontlinjen (och bara behöver bry sig om DOIs)!

Elsevier & Insight presenterade ett projekt där referenser till forskning i så kallad grey literature (myndighetsrapporter och liknande) letades upp. Projektet bygger en prototyp: Sophia, som är ett textmining-verktyg. Eftersom det ofta inte handlar om formella referenser letar Sophia på forskar- och organisationsnamn.

Något som ska bli intressant att följa är om altmetri kommer användas i impact case studies i kommande REF (den natioenlla forskningsutvärderingen) i Storbritannien. Lauren Cadwallader från Cambridge hade fått stipendium från Altmetric.com för att studera om det fanns mönster i vilken typ av uppmärksamhet de artiklar som refereras i myndighetsdokument (policy papers, inte den bästa översättningen) fick. Bland annat visade det sig att forskningen verkar uppmärksammas allt tidigare (hon började med ett mindre urval).

Något som uppmärksammades flertalet gånger är geografiska skillnader. Vi använder inte samma social media-plattformar i olika länder, Ryssland har t ex sin version av Facebook, VK.com (påfallande lik sin kusin). Zohreh Zahedi har skrivit en intressant bloggpost om “the altmetric divide”.

Kim Holmberg med kollegor arbetar med finska lärosätens altmetri- och forskningsprofiler. Bland annat funderar de över skillnader i altmetridata mellan olika forskningsämnen.

Research data and software hade sitt eget spår, som vanligt nuförtiden. Daniel S Katz från Illinois pratade om citeringar för program. Jag drar paralleller till metodartiklar, som t ex de välciterade för PCR-teknikerna. Samtidigt sker så mycket av programutveckling på nätet, och når förmodligen inte in i traditionella vetenskapliga tidskrifter. Några tidskrifter har startats enbart för detta, bland annat JOSS, Journal of Open Source Software.

Två riktlinjedokument som återkom under dagarna var Metric Tide-rapporten och NISO:s arbete med altmetri-standarder. Bra att återvända till när begreppsförvirringen tenderar att ta över.

Alla presentationer kommer att finnas i en särskild samling på Figshare: https://dx.doi.org/10.6084/m9.figshare.c.3488817.v1

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s