Нужна помощь сообщества для Цифрового гербария МГУ (образцы ГБС РАН): коллектор и дата

Дорогие друзья!

Если у вас есть время, силы и желание, то нам снова нужна ваша помощь во вводе простых данных для Цифрового гербария МГУ (https://plant.depo.msu.ru/). Сегодня Цифровой гербарий МГУ - это консорциум девяти организаций, публикующих на единой платформе изображения своих гербарных материалов в виде базы данных.

Примерно две недели назад некоторые из вас уже участвовали в подобной работе: https://www.inaturalist.org/posts/56470-nuzhna-pomosch-soobschestva-vo-vvode-prostyh-dannyh-dlya-tsifrovogo-gerbariya-mgu-obraztsy-gbs-ran . Общими усилиями мы проиндексировали по регионам 10 000 образцов. Низкий поклон всем участникам этого процесса! Можно начать следующий этап.

Итак, начинаем второй этап: ввод даты сбора и коллектора. Исходники: 10 048 сканов отдела Восточной Европы Гербария ГБС РАН (MHA), доступных в интернете (например, такой: https://plant.depo.msu.ru/public/scan.jpg?pcode=MHA0044114). Залиты в Цифровой гербарий МГУ 13.09.2021. Есть сборы из всех регионов Восточной Европы (Европейская Россия и страны ближнего зарубежья).

Задача этапа - открывая изображение по гиперссылке, в простую xlsx-таблицу с пустыми столбиками напротив каждого образца написать:

1) Дату сбора (вводится в отдельные поля: день, месяц, год). Если указан диапазон (например, 6-8.07.2012), то вводим целочисленную часть (ММ = 7, ГГГГ = 2012), а в примечаниях пишем "Дата дана диапазоном: 6-8.07.2012".

2) Коллектор вводится только первый (если их несколько). Именно так, как в этикетке - инициалы могут быть до фамилии, после фамилии, с одной буквой или с двумя. Ровно как в этикетке. (Подсказка: коллектор сопровождается словами: Leg., Coll., собр. и проч. (это и означает "коллектор") или просто написана фамилия). Главное не спутать с тем, кто определял.

3) Если сначала у коллектора идут инициалы, то перед фамилией всегда ставим пробел, а между инициалами - нет (например, "А.П. Хохряков", а не "А.П.Хохряков" и не "А. П. Хохряков"). Если сбор анонимный, пишем "anonymous", если подпись плохо читается, то пишем "[неразборчиво]".

4) Также для свежих образцов, в которых указаны географические координаты, мы пишем слово "да" в столбике "Координаты?", если они указаны (таких образцов будет немного).

На этом этапе можно заказать любую область Европейской России или соседние страны (Прибалтика, Белоруссия, Украина, Молдавия). Если по ошибке вам случайно попадутся образцы из другого региона (мы их частично вводили автоматически по результатам OCR), то мы также вводим коллектора и дату, но в примечаниях пишем настоящий регион.

Ввод пары коллектор-дата для новых сканов позволит автоматически снабдить геопривязками (точкой с географическими координатами) большинство образцов благодаря алгоритму ИСТРА, реализованному в Цифровом гербарии МГУ.

Задание большое, поэтому легко делится по частям между желающими. Минимальная партия - всего 200 образцов (т.е. есть около 50 файлов). Сканы качественные, а потому могут загружаться небыстро. Впрочем, есть вторая гиперссылка на более лёгкий скан. Соответственно, скорость ввода данных отчасти зависит от скорости интернета.

Если вы готовы помочь, то пишите, пожалуйста, на почту botanik.seregin@gmail.com и выбирайте регион по своему вкусу.


Всем большое спасибо!

Publicado el septiembre 30, 2021 12:19 TARDE por apseregin apseregin

Comentarios

No hay comentarios todavía.

Agregar un comentario

Acceder o Crear una cuenta para agregar comentarios.