A nyílt hozzáférésről
Holl András

A természettudományos kutatás egyik alapvető követelménye az ellenőrizhetőség, megismételhetőség. Egy másik fontos tulajdonság az építőkocka-elv: a kutatás korábbi eredményekre épít, és az eredményeire később újabb vizsgálatokat alapoznak. Mindehhez szükség van arra, hogy az eredmények hozzáférhetőek legyenek, és azok is maradjanak hosszú időn keresztül. Másfél évtizeddel ezelőtt a tudomány gyakorlata az volt, hogy a kutatások eredményeit folyóiratcikkekben (könyvekben, egyéb kiadványokban) foglalták össze, és megjelentették. A kiadványokat széles körben terjesztették, és a könyvtárak polcai akár több száz évig biztonságban megőrizték őket. A megfigyelési, mérési adatok – ameddig csekély terjedelműek voltak – megjelentek a cikk táblázataiban, vaskos katalógusokban láttak napvilágot, később a szakfolyóiratok kiegészítő folyamai adtak teret a sok adatot felvonultató közleményeknek. Azokhoz az adatokhoz, amelyek kinyomtatására nem volt lehetőség, csupán korlátozottan férhettek hozzá a kutató vagy intézménye archívumában.

A számítástechnika és a számítógép-hálózatok megjelenése mindent megváltoztatott. Az Internet lehetőséget adott a nyomtatással és postai terjesztéssel együtt járó költségek és idő megtakarítására, lehetővé tette az információ olcsó sokszorosítását és potenciálisan torzítás, veszteség nélküli megőrzését – ugyanakkor súlyos problémákat is felvetett a megőrzés terén. Mind az információhordozó, mind a technológia rövid életű: a digitális állományokat újra meg újra át kell másolni (amit viszont, mint már említettük, veszteség nélkül és olcsón lehet). Nagyobb gondot jelent a tárolási formátumok változása: a megújítás ebben az esetben már könnyen járhat információvesztéssel.

Az 1990-es évek elején a Los Alamos-i Nemzeti Laborató-
riumban Paul Ginsparg által felállított elektronikus  különlenyomat-szolgáltató rendszer, az xxx (ma a Cornell Egyetemen arXiv néven működik) az információáramlást kívánta felgyorsítani és olcsóbbá tenni: a rendszer segítségével lerövidíthették a folyóiratok hosszú átfutási idejét, sőt még a különlenyomatok (pontosabban preprintek) postázására fordított időt és pénzt is meg lehetett takarítani. A nagyenergiájú fizika után az xxx gyorsan más tudományágak felé is nyitott, megnyílt például az asztrofizikai gyűjtemény is.

Nem csak az információáramlás sebessége jelent gondot a tudományos életben. A szakfolyóiratok ára általában igen magas, és drasztikusan emelkedett az elmúlt évtizedek során. A kiadók többsége üzleti alapon áll, ám versenyhelyzet nincsen: a fejlett országok gazdag egyetemeinek, kutatóintézeteinek könyvtárai magától értetődően minden folyóiratot meg akarnak venni, nem csupán az egységnyi áron legtöbb információt kínálót. A kutatást jelentős részben az adófizetők pénzéből támogatják szerte a világon, és a közpénzen létrehozott eredményeket az intézményeknek magáncégektől kell visszavásárolniuk folyóiratok formájában. A szegényebb országok, intézmények esetében a magas költségek már az információhoz való hozzáférés gátjává váltak.

1994-ben Stevan Harnad közzétette „felforgató javaslatát” a tudományos közlemények Interneten keresztül történő szabad terjesztéséről. A 90-es évek legvégén az Open Archives Initiative mozgalom keretében (többek között az arXiv-ot létrehozó Ginsparg, valamint Herbert van de Sompel kezdeményezésével) indult meg a repozitóriumok (elektronikus cikk-lerakatok) technológiájának fejlesztése. Budapesten kelt szárnyra a nyílt hozzáférés mozgalma (Budapest Open Access Initiative) 2002-ben az Open Society Institute támogatásával, majd másfél évvel később kiadták a Berlini Deklarációt.

A nyílt hozzáférésnek többféle módja van. A legegyszerűbb megoldás a cikkek hagyományos módon való megjelentetése, majd repozitóriumban való elhelyezése. Vannak Open Access (OA) folyóiratok, melyek cikkei az Interneten keresztül szabadon letölthetők (a költségeket nem az olvasók fizetik), és a kiadóvállalatok is lehetővé teszik újabban, hogy az elmaradó bevételt előre megfizetve a szerzők az adott cikkhez szabad hozzáférést vásároljanak a leendő olvasóknak.

Nem csak a szerzők hozzáállásán múlik a cikkek szabad elérhetősége. A szcientometriai vizsgálatok azt mutatják, hogy a szabadon hozzáférhető, repozitóriumban elhelyezett cikkek hamarabb kezdik az idézeteket gyűjteni, és több idézetet is kapnak – így a szerzők érdekeltek az Open Accessben. De egyre gyakrabban kötelességük is a szabad hozzáférés megteremtése: munkáltatójuk vagy a kutatás finanszírozója megköveteli ezt. Egyre több egyetem, kutatóintézet, kutatási alap szabályozza a szabad hozzáférést, kötelezi a cikkek OA elhelyezését. Az Egyesült Államokban a legnagyobb tudományfinanszírozó, az NIH már kötelezővé tette az OA-t, és a törvényhozás előtt van a szélesebb körű szabályozás is.

A kereskedelmi kiadóvállalatok kénytelenek lenyelni a békát. Bár saját, fizetett OA megoldásukat ajánlják, nem zárkózhatnak el a repozitóriumi elhelyezés engedélyezése elől sem. Gyakran feltételeket támasztanak, ilyen például a megjelenéstől számított embargó-időszak (gyakorta egy év), vagy a kiadói, műszaki és nyelvi szerkesztett változat elhelyezésének tilalma – de ez nem akadályozza a javított (lektorálás utáni) kézirat elhelyezését, késleltetett hozzáférhetőséggel, ha kell.

Mi a helyzet Magyarországon, milyen kötelezettségeik lehetnek a hazai kutatóknak? Az OTKA 2008 óta megköveteli az általa támogatott kutatóprogramok keretében született cikkek szabad hozzáférhetőségét. A követelmény az OA, de a szabad hozzáférés módját a szerzők választhatják meg: választhatnak tudományterületi, intézményi vagy finanszírozói repozitóriumot, OA folyóiratot, de akár fizetett OA-t is a kiadónál. Előfordulhat, hogy egy kiadóvállalat csak a kutatástámogató szervezet által megjelölt repozitóriumban való elhelyezést engedélyezi – ebben az esetben az MTA Könyvtárának Repozitóriumát, a REAL-t lehet használni csakúgy, mint amikor nem áll rendelkezésre más repozitórium.

Nem csak az OTKA követeli meg Magyarországon az OA-t, ilyen kötelezettsége van a Debreceni Egyetem kutatóinak is (melyhez természetesen rendelkezésre áll az intézményi repozitórium).  Nem csupán hazai kötelezettségek hárulnak e téren a magyar kutatókra: például azok, akik az EU 7-es keretprogramjából kapnak támogatást a hét kiemelt területen, szintén kötelesek publikációikat szabadon hozzáférhetővé tenni (amit megtehetnek a REAL-ban való elhelyezéssel is). Ahogy növekszik azon kutatási alapok, egyetemek száma, amelyek megkövetelik a szabad hozzáférést, úgy lesz egyre valószínűbb, hogy a sokszerzős, nemzetközi együttműködés keretében született cikkeknek valamelyik társszerző miatt OA-t kell biztosítani.

A repozitóriumok (és sokszor az OA folyóiratok is) az OAI–PMH protokoll alkalmazásával biztosítják a cikkek metaadatainak – a cikk „katalóguscédulájának” – láthatóságát (a különböző helyen elhelyezett cikkeket így egyetlen kereső segítségével megtalálhatja az olvasó, mondjuk, a Google Scholarral vagy az NDA@sztaki-val). Fontos követelmény persze magának a repozitóriumnak az állandósága, illetve az egyes cikkek állandó címeken való elérhetősége is. A publikációk esetében viszonylag könnyű időtálló formátumot választani a tárolásra: ilyen lehet például a PDF/A. 

Végül nem szabad megfeledkezni a tartalékolásról sem: a nyomtatott folyóiratok sok száz vagy ezer példánya található meg elszórva a világban, a digitális archívumokat is több példányban, különböző helyeken kell elhelyezni.
Láthattuk, hogy a tudományos szakirodalom (folyóiratcikkek) elérhetővé tételére és megőrzésére rendelkezésre állnak a megfelelő megoldások – csak használni kell azokat. A mérési, megfigyelési adatok esetében nem ilyen könnyű a helyzet. A legnagyobb problémát az jelenti, hogy az adatok megosztása és megőrzése gondos dokumentálást (más szóval metaadatokkal való ellátást) igényel. Bár az ellenőrizhetőség szempontjából kívánatos az adatok hozzáférhetősége, a dokumentáció gyakran nem teszi lehetővé, hogy a „tulajdonoson” kívül más is felhasználhassa az adatokat. Az igen drága kutatóprogramok esetében – mint a Hubble űrteleszkóp vagy a Human Genome Project – az adatok másodlagos hasznosításának lehetővé tételére, közreadására eleve figyelmet fordítanak, ám ez a kisebb programoknál nem jellemző. A csillagászat területén a Virtuális Obszervatórium program keretében nagy erőfeszítéseket tesznek az adatformátumok és metaadatok szabványosítására, de ez sem jellemző még más tudományokban. A Nagy-Britanniában és Hollandiában létesített elektronikus régészeti adattárak is inkább kivételt képviselnek, mint nemzetközi gyakorlatot.

Az adatok esetében a szükséges formátumok is területenként különbözőek. A hosszú távú megőrzés tekintetében nem lehet olyan sommás tanácsot adni, mint a publikációknál. Csupán annyit lehet ajánlani, hogy az adatok megőrzését és közzétételét előre meg kell tervezni, és be kell építeni a költségvetésbe. A hosszú távú archiválást utólag megoldani sokkal nehezebb. A tekintélyes Nature megköveteli, hogy a szerző nyilatkozzon az adatok elérhetőségéről. A tudományos adatok hozzáférhetősége és archiválása terén általánosságban ma annál többet nemigen lehet tenni, mint valamilyen tervet, elképzelést elvárni – a konkrét megoldás tudományterületenként és esetenként különböző lehet.

De valamit mindenképpen tenni kell, különben a nem is olyan távoli jövőben előállhat az a helyzet, hogy a száz-kétszáz éves mérési adatokat könnyebben el lehet érni, mint az egy-két évtizeddel korábbi, már digitálisan születetteket. A régi adatokat viszont digitalizálni kell a könnyebb hozzáférés, ugyanakkor a nagyobb biztonság érdekében: hiszen a papír is elporladhat, az üveglemez is eltörhet. A digitális öröklét nem csak ábránd, még ha sokat kell is dolgozni az érdekében.

A repozitóriumban elhelyezett cikkek nagyobb figyelmet kapnak, a nyilvános archívumokban elhelyezett adatok újrahasznosíthatók: növelik a kutatás hatásfokát, a kutató elismertségét. Publikálni szükséges, archiválni érdemes is! 


Természet Világa, 142. évfolyam, 1. szám, 2011. január
http://www.termeszetvilaga.hu/ 
http://www.chemonet.hu/TermVil/