İçeriğe atla

FAIR Veri

FAIR İlkeleri

FAIR Veri (Fair Data), bulunabilirlik (findability), erişilebilirlik (accessibility), birlikte çalışabilirlik  (interoperability),  yeniden kullanılabilirlik (reusability) ilkelerini karşılayan araştırma verilerdir. Bu dört başlığın birleşiminden oluşan “fair”, İngilizcede adil,makul anlamlarına gelmektedir . Her biri birer ilke olan bu başlıklar, bilim adamları ve kuruluşlardan oluşan bir konsorsiyum tarafından Scientific Data dergisinde Mart 2016'da yayınlanan bir makalede tanımlanmıştır.[1] Araştırmacılar, dijital varlıkların bulunabilirlik, erişilebilirlik, birlikte çalışabilirlik ve yeniden kullanımını iyileştirmek için yönergeler sağlamayı amaçlamıştır. Araştırma ve Geliştirme (Ar-Ge) söz konusu olduğunda, her yıl dünya çapında 2 trilyon Euro'nun üzerinde harcama yapılmaktadır.[2] Her geçen gün sayısı giderek artan Ar-Ge çalışmaları sonucunda milyonlarca veri kümesi oluşmaktadır. Oluşan bu verilerin FAIR ilkelerine uygun olarak yapılandırılmamış olması, hem mali kayıp hem de bilimsel ilerlemenin sekteye uğraması olarak sonuçlanacaktır.

İlkeler, sistemlerin en az insan ile çalışabilmesini mümkün kılacak uygun veri modelini tanımlamaktadır. Bireysel seviyede, araştırmacıların veri varlıklarını yönetmelerine yardımcı olacak bir veri yönetimi çerçevesi sağlar. Bilimsel verimlilik açısından ise, veri kümeleri açık bir şekilde erişilebilir olduğunda belirli bir araştırma alanının daha eksiksiz bir resmini oluşturmak için kullanılabilir olmaktadır. Bulguların altında yatan veriler erişilebilir olduğunda, araştırmacılar birbirlerinin çalışmalarını kontrol edebilir ve sonuçların sağlam bir temel üzerine inşa edilmesini sağlayabilirler.2016 yılından beri tüm ülkeler ulusal ve uluslararası çalışmalarda FAIR ilkelerinin uygulanması ve benimsenmesinin gerekliliğini vurgulamaktadır. 2016 yılında gerçekleştirilen G20 zirvesinde ülke liderleri tarafından, açık bilimin ve FAIR ilkelerinin önemli dile getirilmiştir[3].  Buna rağmen Digital Science'ın 2021 “Açık Verinin Durumu” (State of Open Data) raporuna göre, araştırmacıların %66'sı FAIR ilkelerinin varlığından haberdar ancak yalnızca %28'i FAIR ilkelere aşinadır.[4]

FAIR/O, sık kullanılmamakla birlikte verinin açık lisans taşıdığını belirtmek için kullanılır.

FAIR İlkeleri

"Bulunabilir

Verileri (yeniden) kullanmanın ilk adımı onları bulmaktır. Üst veri ve verilerin hem insanlar hem de bilgisayarlar tarafından bulması kolay olmalıdır. Makine tarafından okunabilen üst veriler, veri kümelerinin ve hizmetlerin otomatik olarak keşfedilmesi için gereklidir, bu nedenle bu, FAIRification (adilleştirme) sürecinin önemli bir bileşenidir.

F1. (Üst)verilere genel olarak benzersiz ve kalıcı bir tanımlayıcı atanır

F2. Veriler zengin üst verilerle açıklanmıştır (aşağıda R1 ile tanımlanmıştır)

F3. Üst veriler açık ve net bir şekilde tanımladıkları verilerin tanımlayıcısını içerir

F4. (Üst)veriler aranabilir bir kaynağa kaydedilir veya dizine eklenir

Erişilebilir

Kullanıcı gerekli verileri bulduğunda, muhtemelen kimlik doğrulama ve yetkilendirme dahil olmak üzere bunlara nasıl erişilebileceğini bilmelidir.

A1. (Üst) veriler, standartlaştırılmış bir iletişim protokolü kullanılarak tanımlayıcıları tarafından alınabilir

A1.1 Protokol açık, ücretsiz ve evrensel olarak uygulanabilir

A1.2 Protokol, gerektiğinde bir kimlik doğrulama ve yetkilendirme prosedürüne izin verir

A2. Veriler artık mevcut olmadığında bile üst verilere erişilebilir

Birlikte Çalışabilirlik

Verilerin genellikle diğer verilerle entegre edilmesi gerekir. Ayrıca verilerin analiz, depolama ve işleme için uygulamalarla veya iş akışlarıyla birlikte çalışması gerekir.

I1. (Üst) veri, bilgi temsili için resmi, erişilebilir, paylaşılan ve geniş çapta uygulanabilir bir dil kullanır.

I2. (Üst) veri, FAIR ilkelerini izleyen sözlükleri kullanır

I3. (Üst) veri, diğer (meta) verilere nitelikli referansları içerir

Yeniden Kullanılabilirlik

FAIR'in nihai amacı, verilerin yeniden kullanımını optimize etmektir. Bunu başarmak için meta veriler ve veriler, farklı ayarlarda çoğaltılabilmeleri ve/veya birleştirilebilmeleri için iyi tanımlanmalıdır.

R1. (Üst) veriler, çok sayıda doğru ve ilgili niteliklerle zengin bir şekilde tanımlanır

R1.1. (Üst) veriler, açık ve erişilebilir bir veri kullanım lisansı ile yayınlanır

R1.2. (Üst) veriler ayrıntılı kaynak ile ilişkilendirilir

R1.3. (Üst) veri, alanla ilgili topluluk standartlarını karşılar"

İlkeler üç tür varlığa atıfta bulunur: veri (veya herhangi bir dijital nesne), üst veri (o dijital nesne hakkında bilgi) ve altyapı. Örneğin, F4 ilkesi, hem üst verilerin hem de verilerin aranabilir bir kaynakta (altyapı bileşeni) kaydedildiğini veya dizine alındığını tanımlar.[5]

FAIR ilkeleri, araştırma çıktılarının daha kolay erişilebilmeleri, anlaşılabilmeleri, değiş tokuş edilebilmeleri ve yeniden kullanılabilmeleri için nasıl organize edilmesi gerektiğini tanımlar. Avrupa Komisyonu da dahil olmak üzere büyük finansman kuruluşları, araştırma yatırımlarının bütünlüğünü ve etkisini en üst düzeye çıkarmak için FAIR verilerini teşvik eder.[6]

Kütüphanelerde Uygulama

Implementing FAIR Data Principles: The Role of Libraries
FAIR Veri İlkelerini Uygulamak: Kütüphanelerin Rolü

Kütüphaneler, kaynakları tanımlama, erişim sağlama,  koleksiyon oluşturma ve dijital kaynakların uzun vadeli yönetimi için destek sağlama konusunda güçlü bir geleneğe sahiptir. Kendi özel bilgi ve uzmanlıklarını temel alan kütüphaneler, araştırma verilerini FAIR ilkelerine uygun yapma konusunda kendisine güvenmelidir[7]. Kütüphanelerin gerçekleştirebileceği uygulamalar, LIBER’in yayınladığı “FAIR Veri İlkelerini Uygulamak: Kütüphanelerin Rolü” başlıklı rehberde belirtilmiştir. FAIR verilerin kütüphanelerde kullanımı LIBER (Avrupa Araştırma Kütüphaneleri Birliği) tarafından tasviye edilmektedir.

• FAIR ilkelerini  araştırma ve BT (bilgi teknolojileri) personeline tanıtın;

• FAIR ilkelerini Veri Yönetim Planlarınıza ve dijital korumanıza dahil eden uygulamalar ve politikalar geliştirin;

• Verileri bulunabilir, erişilebilir, birlikte çalışabilir ve yeniden kullanılabilir hale getirmeye yardımcı araştırma verilerini düzenlemek, zenginleştirmek, yakalamak ve korumak için fırsatlar arayın. Bu konuda iyi başlangıç noktası, bireysel araştırmacıların koleksiyonları veya bir araştırma grubunun veri koleksiyonudur.

• Konu ve veri kütüphanecilerini, verileri adil (FAIR) yapmak için alan üst verileri, sözlükler ve araçlar konusunda eğitin;

• Araştırmacıları, FAIR ilkelerini içeren arşivlerle veri depolamaya teşvik edin;

• Kurumunuzdaki veri toplama ve veri yönetimi uygulamalarını FAIR ilkelerine göre değerlendirin.[8]

Kaynakça

  1. ^ The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data. 15 Mart 2016. 9 Haziran 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 Mayıs 2022. 
  2. ^ "Why is FAIR Data important in 2022 ?". EUDAT. 28 Şubat 2022. 22 Mayıs 2022 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 Mayıs 2022. 
  3. ^ "G20 Leaders' Communique Hangzhou Summit (2016)". 2016. 22 Mayıs 2022 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Mayıs 2022. 
  4. ^ "The State of Open Data 2021 - Global Attitudes towards Open Data" (İngilizce). Digital Science. 2021. 22 Mayıs 2022 tarihinde kaynağından arşivlendi. 
  5. ^ "FAIR Principles" (İngilizce). GO FAIR. 22 Mayıs 2022 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 Mayıs 2022. 
  6. ^ "How to make your data FAIR" (İngilizce). OpenAIRE. 22 Mayıs 2022 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 Mayıs 2022. 
  7. ^ Association of European Research Libraries (13 July 2018). "Open Consultation on FAIR Data Action Plan – LIBER". LIBER.
  8. ^ "Implementing FAIR Data Principles : The Role of Library". LIBER. 22 Mayıs 2022 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 1 Mayıs 2022. 

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Açık kaynak</span> ücretsiz dağıtım ve ürüne erişim hakkında felsefe

Açık kaynak, kaynak kodun; kopyalanması, değiştirilebilmesi ve yeniden dağıtım için serbestçe kullanıma sunulmasıdır. Açık kaynak yalnızca kaynak koda erişim anlamına gelmez. Kodların başkaları tarafından herhangi bir telif ücreti ödemeden kullanılabilmesi, değiştirilmesi ve yeniden dağıtımı gibi çeşitli haklar vermesi gerekir. Bunun için ürün, açık kaynak tanımına uyan bir lisans kullanmalıdır.

Açık içerik, insanların önceden oluşturulmuş ücretsiz bir içeriğe erişerek bu içeriğe atıfta bulunarak, içeriği izinsiz bir şekilde kopyalaması, yayınlaması ve değiştirebileceği ve kullanabileceği bir çalışmayı tanımlar. Ayrıca "serbestçe kullanılabilir" olarak da tanımlanır. İçeriğin tamamını ya da dilediği bir kısmını kullanmak kullanıcıya kalmıştır.

<span class="mw-page-title-main">Açık kaynak istihbaratı</span>

Açık Kaynak İstihbaratı, halka açık kaynaklardan veri toplayarak istihbarat elde etme methodlarından biridir. Genel olarak,

Dijitalleştirme, özellikle eski yazılı kaynakların OCR ve benzeri uygulamalarla dijital ortama aktarılma işlemidir. Dijitalleştirme görsel veya işitsel ögelerin bilgisayara tanımlanabilmesi, işlenebilmesi ve saklanabilmesi amacıyla sayısal kodlara dönüştürülmesidir. Bu işlemin amacı belgenin bütünlüğünü, içeriğini ve fiziksel özelliklerini koruyarak gelecek nesillere aktarmaktır.

Veri, ham (işlenmemiş) gerçek enformasyon parçacığına verilen addır. Veriler ölçüm, sayım, deney, gözlem ya da araştırma yolu ile elde edilmektedir. Ölçüm ya da sayım yolu ile toplanan ve sayısal bir değer bildiren veriler nicel veriler, sayısal bir değer bildirmeyen veriler de nitel veriler olarak adlandırılmaktadır. Her sembolik gösterim gibi, veri de belirli bir nesne, birey ya da olguya ilişkin bir soyutlamadır. Ancak enformasyon ve bilginin soyutluk düzeyleri ile karşılaştırıldığında, verilerin soyutluk düzeyi daha düşüktür. Bir verinin tek başına bir anlamı ve işlevi bulunmamaktadır. Veriler toplandıktan sonra gruplanarak, sıralanarak ve özetlenerek, elle ya da bilgisayarla işlenip enformasyona dönüştürüldüklerinde anlam kazanmakta; ait oldukları bağlamı açıklama gücüne kavuşmaktadır. Problem çözme ya da karar verme gibi bir amaca hizmet edebilecek duruma gelmektedir.

<span class="mw-page-title-main">Open Archives Initiative Protocol for Metadata Harvesting</span>

Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) Açık Arşivler Girişimi tarafından geliştirilen bir protokoldür. Bu protokol bir arşivdeki metadata tanımlarını harmanlamak için kullanılır. Böylece birçok arşivden metadata kullanılarak servisler oluşturulabilir. OAI-PMH'nin bir uygulamasının, Dublin Core'da onu temsil eden metadatayı desteklemesi gerekir, ama ayrıca ek temsilleri de destekleyebilir.

<span class="mw-page-title-main">Bilimsel Yayıncılık ve Akademik Kaynaklar Koalisyonu</span>

Bilimsel Yayıncılık ve Akademik Kaynaklar Koalisyonu, Bilimsel Araştırma Kütüphaneleri Birliği tarafından 1998 yılında geliştirilen, bilime açık erişim sağlayan, akademik ve bilimsel araştırma kütüphanelerinin uluslararası bir anlaşmasıdır. Şu anda Kuzey Amerika, Avrupa, Japonya, Çin ve Avustralya' da 800' den fazla enstitüleri bulunmaktadır. SPARC Avrupa, 2001 yılında LIBER(Avrupa Bilimsel Araştırma Kütüphaneleri Birliği) ile birlikte kurulmuştur.

Açık Arşiv Girişimi yazılı arşiv bilgilerinin teknik birliktelik standartlarını geliştiren ve paylaşımların artmasını hedefleyen bir organizasyondur. Bu dijital içerik içeren arşivler için bir "düşük bariyer birlikte çalışabilirlik çerçevesi" inşa etmeye çalışır. Bu, servis sağlayıcılarının veri sağlayıcılarından metadata sağlamasını kolaylaştırır. Bu meta çoğunlukla farklı veri setleri birleştirerek, "katma değerli hizmetler" sağlamak için kullanılır

Açık bilim, araştırmacıların ortaya koyduğu çalışmaları; geliştirmeye, katkı sağlamaya, eklemelere, çıkarmalara açık halde bilim dünyasına sunmasıdır. Böylece bu çalışmalar, araştırmacılara, dolayısıyla bilimin ilerlemesine katkı sağlamaktadır. “Açık bilim, araştırma bulgularının yeniden üretilmesine izin verir, araştırma metodolojisinde şeffaflığı sağlar, araştırmacının toplumsal etkisini artırır ve hem araştırmacılar hem de araştırma kurumları için para ve zamandan tasarruf sağlar.” Açık bilim dendiğinde burada kullanılan açıklık kelimesinin ne anlamda kullanıldığını ifade etmek gerekir. “Açıklık herkesin özgürce erişebileceği, kullanabileceği ve paylaşabileceği anlamına gelir.” Açık bilim kamuya ait olan bilimsel çıktıların, toplanan verilerin ve yöntemlerin kısıtlanmadan ya da en az kısıtlamayla kamuya tekrar sunulması gerektiğini savunur. “Bilgi kullanılması ya da paylaşılması sonucu azalmaz.” Kullanıldıkça ve insanlar bilgiye ulaştıkça yeni bilgiler ortaya çıkar. Açıklık bilimin ilerleyebilmesi için son derece gereklidir. Araştırmacıların daha önceden yapılmış olan çalışmalara ulaşabilmesi, eksiklikler ya da yanlışları fark ederek yeni çalışmalar ortaya koyabilmesi için bilimsel kaynaklara ulaşması gerekir. Ulaşabilmeleri için de açık bilimin desteklenmesi ve bu yönde çalışmalar yapılması gerekir.

<span class="mw-page-title-main">Küresel Biyoçeşitlilik Danışma Tesisi</span> biyoçeşitlilik üzerine bilimsel verilerin toplayıcısı; veri portalı

Global Biodiversity Information Facility (GBIF) ya da Türkçe çevirisiyle Küresel Biyoçeşitlilik Danışma Tesisi, biyolojik çeşitlilik hakkında bilimsel veri sağlamak amacıyla İnternet üzerinden web hizmeti kullanmaya odaklanmış uluslararası organizasyon. Veriler dünya çapında birçok kurum tarafından sağlanmakta olup; GBIF'in bilgi mimarisi, bu verileri tek bir portal üzerinden erişilebilir ve aranabilir hale getirir. GBIF portalindan elde edilebilecek veriler öncelikle bitkiler, hayvanlar, mantarlar ve dünyadaki mikropların yanı sıra canlıların bilimsel isim verileri ile ilgili dağılım verileridir.

Carbon, Macintosh bilgisayarları çalıştıran işletim sistemi olan Mac OS X için Apple'ın C tabanlı uygulama programlama arayüzlerinden (API) biridir. Carbon, Mac OS 8 ve Mac OS 9 işletim sistemlerinde çalışan programlar için iyi bir geriye dönük uyumluluk sağlamıştır. Geliştiriciler, “klasik” Mac OS ve Macintosh işletim sistemleri yazılımlarını OS X platformuna taşımak için uygulamayı azami çaba harcayarak çok az bir çaba ile kullanabilirler. OpenStep'te ortaya çıkan tamamen farklı Cocoa API sistemidir.

<span class="mw-page-title-main">Açık veri</span>

Açık veriler, bazı verilerin telif hakkı, patent veya diğer kontrol mekanizmaları kısıtlaması olmaksızın herkesin istediği gibi kullanması ve yeniden yayınlaması için serbestçe erişilebilir olması gerektiği fikridir. Açık kaynaklı veri hareketinin amaçları, açık kaynaklı yazılım, donanım, açık içerik, açık eğitim, açık eğitim kaynakları, açık hükûmet, açık bilgi, açık erişim, açık bilim ve açık web gibi diğer "açık (-kaynak)" hareketlerininkine benzerdir. Paradoksal olarak, açık veri hareketinin büyümesi, fikrî mülkiyet haklarındaki artışla paraleldir. Açık verinin arkasındaki felsefe uzun süredir kurulmuştur, ancak internet ve World Wide Web'in yükselişi ve özellikle Data.gov, Data.gov.uk ve Data.gov.in gibi açık veri yönetimi girişimlerinin lansmanları ile popülerlik kazanan "açık veri" terimi günceldir.

<span class="mw-page-title-main">WorldCat</span> 17.900 kütüphanenin arşivini listeleyen toplu katalog

WorldCat, OCLC küresel kooperatifine katılım sağlayan 123 ülke ve bölgeden 17.900 kütüphanenin arşivini listeleyen bir toplu katalogdur. OCLC, Inc. tarafından işletilmektedir. Dünyanın en büyük bibliyografik veritabanıdır ve üye olan kütüphaneler toplu olarak bu veritabanının bakımını üstlenmektedir.

<span class="mw-page-title-main">Bibsys</span>

BIBSYS, Norveç Eğitim ve Araştırma Bakanlığı tarafından kurulan ve düzenlenen bir idari kurumdur. Araştırma, öğretim ve öğrenmeyle ilgili verilerin - tarihsel olarak kütüphane kaynaklarıyla ilgili meta veri alışverişi, depolanması ve alınması üzerine odaklanan bir hizmet sağlayıcısıdır.

Birlikte çalışabilir bilgi sistemleri her yöne akan bilgiye erişim imkânı sağlamak üzere tasarlanmış yapıdır. Sistemlerin kendi içinde ve birlikte çalışarak gerçekleştirdiği etkileşimle bilgiye erişim imkânı sağlar.

<span class="mw-page-title-main">Açık arşiv</span> araştırma yayınları ve verilerinin serbestçe erişilebilen deposu

Açık arşiv, bir kurum ya da kuruluşta; kitapların, makalelerin, dergilerin, raporların, elektronik kaynakların ve daha birçok bunlar gibi belgelerin depolandığı, bu belgeleri kullanmak isteyen öğretmen ve öğrenci gibi birçok kişinin hizmetine açık bir şekilde sunulduğu kurumdur.

Araştırma verisi yönetimi, yapılan araştırmada elde dilen ve kullanılan verilerin plan yapılmasını ve sunulmasını ister. Kısaca veri ile ilgili tüm süreç ve işlemlerdir.

Dijital dünya, 1998 yılında eski ABD başkan yardımcısı Al Gore tarafından, coğrafi referanslı ve dünyanın dijital bilgi arşivlerine bağlanan sanal bir dünya temsilini tanımlayan bir konsepte verilen isimdir.

Açık kaynak yazılım hareketi, daha geniş açık işbirliği kavramının bir parçası olarak, yazılımların bir kısmı veya tamamı için açık kaynak lisanslarının kullanımını destekleyen bir harekettir. Açık kaynak hareketi, açık kaynak yazılım kavramını/fikrini yaymaya başlamıştır. Açık kaynak hareketi felsefesini destekleyen programcılar, yazılım geliştirme için gönüllü olarak programlama kodu yazarak ve değiş tokuş ederek açık kaynak topluluğuna katkıda bulunurlar. "Açık kaynak" terimi, hiç kimsenin düzenlenmiş kodu paylaşmayan bir gruba karşı ayrımcılık yapmamasını veya başkalarının önceden düzenlenmiş çalışmalarını düzenlemesini engellememesini gerektirir. Yazılım geliştirmeye yönelik bu yaklaşım, herkesin açık kaynak kodunu almasına ve değiştirmesine olanak tanır. Bu değişiklikler, yazılımla çalışan kişilerden oluşan açık kaynak topluluğu içindeki geliştiricilere geri dağıtılır. Bu sayede kod değişikliğine katılan tüm bireylerin kimlikleri ortaya çıkarılmakta ve kodun zaman içinde dönüşümü belgelenmektedir. Bu yöntem, belirli bir kod parçasının sahipliğini oluşturmayı zorlaştırır, ancak açık kaynak hareketi felsefesiyle uyumludur. Bu hedefler, yüksek kaliteli programların üretimini ve açık kaynak teknolojisini geliştirmek için benzer düşünceye sahip diğer insanlarla işbirliği içinde çalışmayı teşvik eder.

Sarmalayıcı kütüphaneler, bir kütüphanenin mevcut arayüzünü uyumlu bir arayüze çeviren ince bir kod katmanından oluşur. Bu, çeşitli nedenlerle yapılır: