Свежие данные GBIF (7 сентября 2021 г.)

Дорогие друзья!

Постепенно к сообществу проекта "Флора России" присоединяются всё новые пользователи. Изредка мы рассказываем о том, как взаимодействуют iNaturalist и GBIF. Пост месячной давности тут: https://www.inaturalist.org/projects/flora-of-russia/journal/54285-svezhie-dannye-gbif-10-avgusta-2021-g-rossiya-uzhe-na-vtorom-meste

Итак, Global Biodiversity Information Facility (https://www.gbif.org/) - это глобальная платформа-агрегатор данных о биоразнообразии. Их здесь очень много: 1 891 669 564 фактов присутствия того или иного вида в той или иной точке. Это и наблюдения, и образцы, и окаменелости, и данные литературы. Чтобы все эти данные оказались доступны в одном месте, 1728 организаций по всему миру объединили здесь свои 62 158 баз данных - больших и малых. Российские организации (университеты, академические институты, музеи, ООПТ) опубликовали в GBIF 515 баз данных.

Любой пользователь может освоить несложную поисковую систему GBIF (https://www.gbif.org/occurrence/search) и найти то, что ему интересно. Система поисковых фильтров GBIF отличается богатым выбором настроек и стремительным отображением результатов, несмотря на гигантские объемы данных. Мой опыт показывает, что искать здесь отдельные наблюдения гораздо быстрее, чем на iNaturalist. Кроме того, удобно, следуя гиперссылкам, исправлять определение какой-нибудь случайной ошибки из числа наблюдений iNat, прошедших в GBIF.

Конечно, среди баз данных о биоразнообразии есть очень большие массивы! Вот, как выглядит сейчас десятка самых больших:

1) EOD – eBird Observation Dataset 872 206 403
2) Artportalen (Swedish Species Observation System) 82 017 115
3) Observation.org, Nature data from around the World 39 969 765
4) iNaturalist Research-grade Observations 33 164 781
5) DOF - Observations from the Danish Ornithological Society 27 299 760
6) Norwegian Species Observation Service 25 804 122
7) INPN - Données flore des CBN agrégées par la FCBN 20 999 334
8) Southern African Bird Atlas Project 2 17 692 560
9) Waarnemingen.be - Bird occurrences in Flanders and the Brussels Capital Region, Belgium 12 811 851
10) NSW BioNet Atlas 12 642 938

А вот как выглядит другая десятка - с данными по сосудистым растениям.

1) INPN - Données flore des CBN agrégées par la FCBN 20 960 245
2) Artportalen (Swedish Species Observation System) 14 230 807
3) iNaturalist Research-grade Observations 12 635 392
4) Dutch Vegetation Database 11 108 843
5) The Danish Environmental Portal, species and habitats-database "Danmarks Miljøportals Naturdatabase" 10 817 674
6) Pl@ntNet automatically identified occurrences 9 634 639
7) Flora von Deutschland (Phanerogamen) 9 197 488
8) BSBI data from several English counties, up to 2015 8 158 299
9) Flore du Bassin parisien (CBNBP) 7 781 816
10) Floristic records from survey studies of the Bayerisches Landesamt für Umwelt 7 112 618

Как видно из обоих списков, данные из iNaturalist являются одним из ведущих источников данных в GBIF - как по всем группам живых организмов (4-е место), так и по сосудистым растениям (3-е место). И эти данные постоянно растут. По прогнозам и динамике, iNat выйдет на второе место по сосудистым растениям уже в этом году, а в следующем году станет первым.

На iNaturalist 79,5 млн наблюдений, а в GBIF попадает лишь 33,2 млн (https://doi.org/10.15468/ab3s5x). Почему? Дело в том, что одновременно:

  • наблюдение должно иметь исследовательский статус;
  • наблюдение должно иметь открытую лицензию (CC0, CC-BY, CC-BY-NC);
  • а сами данные при этом публикуются с задержкой (сейчас данные от 27.08.2021).

Давайте сравним две ссылки на одно и то же наблюдение:

https://www.gbif.org/occurrence/3017963860
https://www.inaturalist.org/observations/67518248

Автор не указал своего полного имени в профиле, поэтому в GBIF он числится как "Denis". Так что стоит указать полное имя в профиле в соответствующем разделе (лучше латиницей!). Автором определения значится в GBIF Игорь Поспелов, поскольку он первый указал правильное название вида. Ссылка на автора определения нормируется с помощью номера ORCID, который каждый пользователь может привязать в своем личном кабинете. В паспорте наблюдения на iNaturalist есть ссылка на GBIF ("Это наблюдение размещено на 1 сайте: GBIF"), обратная ссылка на сайте GBIF имеется с момента заливки.

У GBIF своя номенклатура, которая автоматически стыкуется с названиями iNat, а также имеется в расширенном поиске фильтр по автору находки, так что можете выбрать и посмотреть, какие ваши наблюдения попали в GBIF. Недавно там появился поиск по административным единицам (правда, карта заложена 10-летней давности, так что границы Москвы и Подмосковья, например, старые).

Если вы хотите, чтобы ваши наблюдения попали в GBIF, то необходимо удостовериться, что у вас выставлена открытая лицензия. Это можно сделать только через сайт (в приложении поменять лицензию нельзя). О том, как это сделать написано с иллюстрацией в этом посте: https://www.inaturalist.org/projects/flora-of-russia/journal/39331-obnovlen-massiv-dannyh-inaturalist-v-gbif-11-avgusta . Если у вас не проставлена лицензия, то в карточке каждого наблюдения у вас в правом нижнем углу написано "Все права защищены", если проставлена, то, как правило, - "Некоторые права защищены".

Отдельно отметим, что все топ-100 наблюдателей проекта "Флора России" перешли на свободные лицензии. Доля наблюдений проекта, заблокированных жёсткими лицензиями, сократилась сейчас до рекордной отметки в 10,5%! Это наше большое общее достижение в деле открытого доступа к данным о биоразнообразии. Большое спасибо, что не оставили без внимания предыдущие посты о GBIF. Возможно, в этот раз отклик будет еще шире.

Зачем всё это нужно?

Самый простой ответ заключается в том, что именно из GBIF исследователи выгружают данные о растениях, грибах и животных в удобном виде (csv-выгрузки). Каждая такая выгрузка получает doi, с помощью которого отслеживаются цитирования в научных исследованиях. Так, массив данных iNaturalist (https://doi.org/10.15468/ab3s5x ) процитирован через GBIF уже 1865 раз! Это рекорд среди всех участников GBIF.


ДОГОНЯЛКИ

Традиционно летом мы устраиваем догонялки с разными странами мира, глядя на оперативно обновляемые данные GBIF. В этом году по разным поводам мы догоняем Мексику и США.

= Цель 1: догнать Мексику по числу наблюдений сосудистых растений в GBIF (из всех баз) =

11) Belgium 9,784,254
12) Switzerland 7,279,677
13) Finland 7,231,233
14) Norway 6,335,460
15) Mexico 5,281,995
16) Russian Federation 3,462,863
17) Japan 3,230,672
18) Canada 3,000,314
19) Portugal 2,804,643
20) Colombia 2,504,699

Здесь отрывы гигантские, но отставание от Мексики неуклонно сокращается. Пока наше отставание 1,82 млн записей (месяц назад было 1,96 млн). В этом зачёте участвуют все источники информации, поступающие в GBIF. Российские учреждения регулярно публикуют новые данные по флоре России (прежде всего, оцифрованные гербарные коллекции), поэтому смотрим с надеждой на будущее.

= Цель 2: догнать США по числу наблюдений сосудистых растений из iNaturalist в GBIF на месячных отсечках =

Вот, что у нас получается за август 2021 г.:

1) United States of America 106 408
2) Russian Federation 59 111
3) Canada 31 048
4) United Kingdom 11 688
5) Australia 11 321

Пока отставание в 1,8 раза. В прошлом году мы сокращали его в некоторые месяцы до отметки в 1,6 раз. Посмотрим, что будет в сентябре.


На данный момент в GBIF индексируется уже 7,35 млн записей о биоразнообразии России - 7,17 млн с основной территории и 0,18 млн из Крыма. При этом, iNaturalist является самым большим по объему источником данных о природе России (занимает долю 25,4% по основной территории и 51,3% по Крыму). Эта доля постоянно растёт благодаря нашим усилиям.

Вот, какие массивы данных по биоразнообразию России являются крупнейшими сегодня:

1) iNaturalist Research-grade Observations 1 822 227
2) Moscow University Herbarium (MW) 659 566
3) RU-BIRDS.RU, Birds observations database from Russia and neighboring regions. Zoological Museum of M.V. Lomonosov Moscow State University. 488 907
4) EOD – eBird Observation Dataset 387 883
5) Geographically tagged INSDC sequences 195 451
6) Locations of plants on dot distribution maps in the Flora of Siberia (Flora Sibiraea, 1987–1997) 169 854
7) Flora of Vladimir Oblast, Russia: an updated grid dataset (1867–2020) 130 054
8) Finnish Floristic Database (Finnish Museum of Natural History Collections) 106 396
9) Birds of Northern Eurasia 86 992
10) L. IS dataset. Cyanoprocaryota, Lichens, Bryophyte 86 579

А вот, что есть в GBIF по сосудистым растениям России:

1) iNaturalist Research-grade Observations 1 178 912
2) Moscow University Herbarium (MW) 587 567
3) Locations of plants on dot distribution maps in the Flora of Siberia (Flora Sibiraea, 1987–1997) 169 854
4) Flora of Vladimir Oblast, Russia: an updated grid dataset (1867–2020) 130 054
5) Finnish Floristic Database (Finnish Museum of Natural History Collections) 106 082
6) Chronicle of Nature - Phenology of Plants of Zhiguli Nature Reserve 86 524
7) MHA Herbarium: collections of vascular plants 72 381
8) Pl@ntNet automatically identified occurrences 71 567
9) A global database for the distributions of crop wild relatives 69 255
10) Chronicle of Nature - Phenology of Plants of FSE Zapovednoe Podlemorye 54 792

P.S. Если у кого-то есть электронные таблицы с надёжными данными о встречах живых организмов, которые не пронзают на iNaturalist, то в принципе мы можем помочь с их публикацией в GBIF. Это могут быть данные геоботанических описаний, каталоги коллекций, флористические списки и проч. Пишите на почту botanik.seregin@gmail.com

Publicado el 10 de septiembre de 2021 10:15 por apseregin apseregin

Comentarios

что такое Подлеморье?

Publicado por oleg_kosterin hace alrededor de 2 años
Publicado por apseregin hace alrededor de 2 años

oleg_kosterin, Заповедное Подлеморье- это учреждение, которое управляет несколькими особо охраняемыми природными территориями: Баргузинский заповедник, Забайкальский национальный парк и государственный природный заказник федерального значения «Фролихинский».

Publicado por natalya_vilyaeva hace alrededor de 2 años

Добрый день!
Есть проблемка, касающаяся некоторых моих наблюдений, уже размещённых в GBIF. По не очень понятным мне причинам GPS в моём телефоне очень любит промахиваться метров на 200-1000 - лягушки из пруда то в соседний населённый пункт мигрируют, то в военкомат... Не обратила внимание при заливке, а сейчас смотрю - водные растения торчат на асфальте среди многоэтажек... :((( Отсюда вопрос: GBIF хранит только ссылки и можно спокойно изменить место наблюдения и оно автоматически будет верным везде или уже закрыть глаза на такую погрешность?

Publicado por naturalist58000_n... hace alrededor de 2 años

Наталья, спасибо за вопрос: данные в GBIF целиком и полностью перезаливаются, а значит можно смело исправлять только в одном месте - внутри наблюдений. Как правило, в течение 1-2 недель всё синхронизируется.

Publicado por apseregin hace alrededor de 2 años

Спасибо! Значит займусь перепроверкой координат!

Publicado por naturalist58000_n... hace alrededor de 2 años

А я вручную на спутниковой карте выставляю место на телефоне, а потом на десктопном спутнике все сьезжает на 5-10м. или такая точность не нужна?

Publicado por pratvmvmbrosvm hace casi 2 años

Agregar un comentario

Acceder o Crear una cuenta para agregar comentarios.