Миллионы образцов растений и других природных объектов хранятся в коллекциях по всему миру, но большинство из них остаются без внимания десятилетиями. Эти коллекции содержат важные данные для научных исследований, однако многие образцы долгое время не изучались или даже не осматривались. В связи с этим в музеях и ботанических садах активно реализуются программы масштабной цифровизации, позволяющие оцифровывать и хранить коллекции в электронном виде.
Цифровизация и новые возможности для исследований
Объединив усилия биологов, кураторов и волонтёров, такие инициативы уже создали огромные базы данных, открывающие новые горизонты для науки. Теперь учёные могут анализировать оцифрованные образцы без необходимости физического доступа к коллекциям, что значительно ускоряет исследования и повышает их точность.
Использование машинного обучения для идентификации образцов
Недавнее исследование, опубликованное в открытом журнале о биологическом разнообразии, демонстрирует, как современные технологии могут помочь в управлении и изучении таких коллекций. В частности, команда исследователей из Национального музея естественной истории и центра данных Smithsonian создала пилотный проект, использующий методы глубокого обучения для анализа оцифрованных гербарных образцов.
-
- Премьера сериала «Wayward» с Тони Коллетт на Netflix уже в сентябре: тревожный триллер о темных тайнах маленького городка
- В Национальном музее естественной истории представили «Короля динозавров» — Т. rex
-
Применение нейронных сетей для распознавания растений
В рамках проекта была создана и обучена система на базе сверточных нейронных сетей (CNN), которая способна точно и быстро различать схожие виды растений. Одной из задач было определить, какие образцы были окрашены ртутью — популярным в прошлом средством для защиты растений от вредителей. Другая задача — отличить семейства растений, например, клубномыши и спикмоши, внешний вид которых очень похож.
Высокая точность и перспективы применения
Обученные нейросети показали впечатляющую точность — 90 и 96 процентов для различных задач, а при исключении сложных образцов точность достигала почти 99 процентов. Это подтверждает, что технологии глубокого обучения могут стать важной частью работы с музейными коллекциями в будущем.
Потенциал для развития и практического применения
Авторы исследования предполагают, что система для выявления ртутных загрязнений может быть использована в других музеях и гербариях для определения участков с загрязнением, требующих обработки. А алгоритмы для определения видов растений могут стать универсальным инструментом для автоматической идентификации образцов и выявления неопознанных экземпляров.
Что дальше?
Руководитель проекта отметил, что подобные технологии уже показывают свою эффективность и открывают новые возможности для биологических и экологических исследований. В будущем использование машинного обучения вместе с большими наборами данных поможет ученым лучше понять эволюцию и распространение видов растений и животных.