Registrace

Od utajovaných dat ke sdíleným znalostem: Jak WorldFAIR utváří budoucnost výzkumu

Vědci často čelí problémům při přístupu a používání výzkumných dat kvůli nejednotné terminologii, nestrukturovaným formátům a chybějícím detailům. Projekt WorldFAIR řeší tyto problémy podporou principů FAIR (Findable, Accessible, Interoperable, Reusable) s cílem zlepšit dostupnost dat a podpořit spolupráci napříč obory. Jádrem projektu je 11 případových studií pokrývajících širokou škálu vědeckých oborů a globálních komunit.

Digitální nástroje nabízejí stále rostoucí příležitosti pro kolaborativní vědu, která čelí globálním výzvám – ale příliš často jsou cenná data potřebná k informování o tom, že práce zůstává pro výzkumníky mimo dosah.

Data mohou být pohřbena v neprohledatelné sbírce, zakódována idiosynkratickou terminologií nebo způsobem, který nelze snadno přimět k práci s jinými daty – nebo nejsou snadno použitelná, protože vědci nemohou ověřit podrobnosti o samotných datech, jako je jejich původ nebo podmínky použití.

"Toto je problém, který je ve skutečnosti starý jako věda sama," vysvětluje Simon Hodson, výkonný ředitel společnosti Výbor pro data (CODATA) Mezinárodní vědecké rady (ISC), která pracuje na zlepšení dostupnosti a použitelnosti dat.

Tyto problémy s daty mohou omezit možnosti výzkumu a plýtvat časem a penězi. Podle výzkum zveřejněné Evropskou komisí v roce 2018, čištění nekvalitních dat, aby byla použitelná, je zdaleka nejnáročnějším úkolem pro průměrný projekt analýzy dat a může činit až 80 % celkového úsilí.

Jedno WorldFAIR Projekt, spolupráce mezi CODATA a Mezinárodní vědeckou radou (ISC), se tohoto problému ujal. Projekt měl za cíl „zprovoznit data“ podporou přijetí VELETRH (Findable, Accessible, Interoperable, Reusable) principy dat, které podporují lepší správu dat a výzkum podporovaný strojově podporovanou analýzou. 

Po dokončení projektu se CODATA snaží pokračovat a rozšiřovat iniciativu WorldFAIR+, která bude zahrnovat nové partnery a mezinárodní případové studie uvádějící do praxe poznatky získané během dvouletého projektu WorldFAIR. 

Nová fáze bude strukturována jako „federace“ projektů, která poskytne rámec pro spolupráci, kde vědci mohou sdílet technické znalosti a stavět na práci ostatních. CODATA zve potenciální partnery, aby navrhli případové studie a zapojili se.

Případové studie datové interoperability

Počáteční práce CODATA, která poskytla základ pro WorldFAIR, začala v roce 2017 s podporou ISC a financováním z Čínská asociace pro vědu a technologii. Tato formativní práce zahrnovala workshopy, které vedly k vypracování tří případových studií, z nichž každá se zaměřila na využití dat ve specifické oblasti: infekční nemoci, urbanismus a snižování rizika katastrof. V počátečních fázích projektu CODATA také rozvinula klíčové partnerství s iniciativou Data Documentation Initiative (IDD).

Na základě těchto snah zajistila CODATA financování z Evropské komise pro WorldFAIR. Projekt podpořil 11 případových studií zkoumajících využití dat v celé řadě oblastí – včetně kulturního dědictví, nanomateriálů a vědy o oceánech. Případové studie zahrnovaly 13 zemí, včetně Brazílie, Keni, Nového Zélandu a USA

Poznatky získané z projektu tvořily základ 11 politická doporučení zlepšit využití a dostupnost dat pro vědu a vedlo k rozvoji Rámec interoperability mezi doménami (CDIF), jehož cílem je zajistit větší interoperabilitu dat z různých vědeckých oblastí. 

CODATA zároveň zveřejnila nové Terminologie správy dat výzkumu, který poskytuje jasné definice pojmů používaných v oboru; tyto podmínky byly nyní publikovány jako strojově čitelné „FÉROVÁ slovní zásoba“ a brzy bude k dispozici online ve snáze čitelném formátu. 

Každá z 11 případových studií také vytvořila svou vlastní zprávy a pokyny pro využití dat s cílem vytvořit doporučení relevantní v různých oblastech vědy. 

Jedna z případových studií, na kterou se zaměřila zemědělská biodiverzita, se zaměřením na opylování – obor, kde se model pro popis a kategorizaci dat teprve definuje. Na základě údajů a vstupů od kolegů z celého světa vyvinuli výzkumníci z půl tuctu zemí – Brazílie, Keni, Argentiny, USA, Spojeného království a Nizozemska komplexní průvodce a sada nástrojů pro data související s tím, jak rostliny a opylovači interagují. 

Je to extrémně specifické téma, které je však relevantní téměř všude, pro vědce v mnoha různých oblastech – kteří nyní mohou těžit z jednotného standardního způsobu přístupu k datům, což usnadňuje stavět na práci kolegů a urychlit jejich práci. vlastní výzkum. 

„Přechod od různých přístupů a umlčených iniciativ k široce dostupným údajům o interakcích mezi rostlinami a opylením FAIR pro vědce a osoby s rozhodovací pravomocí umožní vývoj integrativních studií, které zlepší naše chápání biologie druhů, chování, ekologie, fenologie a evoluce,“ píší výzkumníci, kteří na případové studii pracovali

V jiné případové studii se výzkumníci podívali na snižování rizika katastrof. „Vzhledem k tomu, že změna klimatu a rostoucí populace pravděpodobně zvýší jak závažnost, tak frekvenci katastrof, potřeba spolehlivých údajů, které by informovaly o našich reakcích, se stává stále důležitější,“ píší. 

Vědci a národní a mezinárodní agentury, které se zabývají rizikem katastrof, se dívají do minulosti, aby odhadli dopad možných budoucích událostí a pochopili, jak je následně zmírnit a zotavit. Čerpají také z dat, která neustále chrlí senzory na Zemi a na satelitech provozovaných veřejnými a soukromými zdroji.

V případové studii však výzkumníci zjistili, že je obtížné získat informace potřebné k přesnému hodnocení, protože mnoho relevantních údajů neodpovídá principům FAIR údajů. Často chybí důležité informace – například počet zraněných při katastrofě nebo jak rychle se událost rozvinula. V jiných případech vnitrostátní orgány používají své vlastní metody pro výpočet klíčových datových bodů, aniž by ukázaly svou práci, což ostatním ztěžuje srovnání.

Na základě svého rozsáhlého výzkumu vytvořil tým případových studií řadu doporučení pro postupy, které by měly usnadnit přijímání politických rozhodnutí založených na důkazech v této stále naléhavější oblasti – „základní krok k budování bezpečnějších a odolnějších komunit a národů“. píšou. 

Výzkumníci z Mezinárodní unie čisté a aplikované chemie (IUPAC) přijal případovou studii, která se zabývala tím, jak lze data a terminologii související s chemickými látkami snáze učinit použitelnými jak pro lidi, tak pro stroje. 

IUPAC má více než stoletou zkušeností svolávání chemiků, aby definovali a standardizovali způsob, jakým vědci v oboru pracují s chemikáliemi a mluví o nich. Ale protože digitální nástroje – a stále více AI a související technologie – nabízejí nové způsoby práce, případová studie IUPAC se zabývala tím, jak by tyto standardy mohly být efektivnější a jak usnadnit dalším vědcům opětovné použití chemických dat. 

Jedním z produktů případové studie byl „kuchařka“, otevřený zdroj pokynů, které pomáhají vědcům – včetně studentů, učitelů a pracujících profesionálů – pochopit, jak pracovat s chemickými daty a jak zpřístupnit svá vlastní data ostatním. 

Projekt také popsal ambiciózní nový otevřený digitální protokol, který by mohl propojit mnoho různých globálních chemických databází dohromady a umožnit vědcům najít a získat přístup k datům pomocí jediného dotazu – a stejně tak zkontrolovat, zda jsou jejich vlastní data strojově čitelná. 

Vytváření sdíleného jazyka pro vědecká data

Spojení vědců, aby mluvili o datech, která produkují, a pokoušeli se pochopit, jak ostatní pracují se svými vlastními daty, bylo otevření očí, vysvětluje Hodson. 

A stanovením jasných standardů a definic vědci nejen pomáhají současnému výzkumu, ale také usnadňují dalším generacím stavět na jejich práci – možná způsoby, o kterých původní autoři možná nikdy neuvažovali, dodává. 

„Na WorldFAIR jsme našli něco, jak fascinující a užitečné bylo jednoduše vést tyto rozhovory, dostat všechny případové studie do místnosti a nechat je mluvit o svých datech a o tom, co dělají, jak to funguje a jak to popisují. – a v některých případech identifikování spojení, která jsme si předem nezbytně nepředstavovali,“ říká. 


Můžete také zajímat

blog
24 July 2024 - 5 min čtení

WorldFAIR: Pokračování v transformaci dat pro řešení složitých výzev v navazujícím projektu

Zjistit více Zjistěte více o WorldFAIR: Pokračování v transformaci dat pro řešení složitých výzev v navazujícím projektu
Datová věda blog
07 června 2022 - 11 min čtení

Implementace principů FAIR dat – co se skrývá za zkratkou?

Zjistit více Zjistěte více o implementaci principů FAIR dat – co se skrývá za zkratkou?

Obrázek by Taylor Vick on Unsplash.


Odmítnutí odpovědnosti
Informace, názory a doporučení prezentované v našich hostujících blozích jsou názory jednotlivých přispěvatelů a nemusí nutně odrážet hodnoty a přesvědčení Mezinárodní vědecké rady.


Zůstaňte v obraze s našimi zpravodaji