Практически все современные поисковые системы выполняют свою работу путем сравнения подобных признаков. К примеру, сравнивая две песни разных исполнителей, компьютер оценивает жанр музыки, темп, пол певца, набор музыкальных инструментов и множество других отличительных признаков. Всем этим признакам присваивается значение от 0 до 10, к примеру, и на основе числовых значений высчитывается некое усредненное число, именуемое хэш-суммой. И когда компьютер ищет что-либо, он делает это путем сравнения хэш-сумм, а не каждого признака по отдельности. Это является одновременно и сильной и слабой стороной поисковых систем. За счет упрощения процедуры сравнения системы выполняют поиск очень быстро, но за счет этого же самого упрощения в результатах поиска могут появляться вещи, не имеющие ни малейшего отношении к запрашиваемой информации.
Исследования, проведенные учеными из Института биологических исследований Солка (Salk Institute for Biological Studies), показали, что мозг мушки-дрозофилы так же использует процедуры индексации и поиска для того, чтобы мушка могла выжить в разных условиях окружающей среды. Если, к примеру, мушка узнала, что запах апельсина связан с едой, то она в будущем всегда будет лететь на этот запах. А процессы, которые происходят при этом в мозге мушки-дрозофилы, кардинально отличаются от того, что делают алгоритмы поисковых систем. И принципы работы мозга дрозофил можно будет использовать для создания более совершенных поисковых систем и алгоритмов.
Когда мушка ощущает новый для нее запах, в ее могу активируется уникальная комбинация из 50 нейронов. Вместо того, чтобы уменьшить количество нейронов, запоминающих запах, до 10, как это делают компьютерные алгоритмы, мозг мушки на следующем этапе активирует 2 тысячи нейронов, связанных с первыми 50.
Почему такой подход работает лучше в случае идентификации запахов? Представьте себе, что имеется 50 человек (как 50 активных нейронов в мозге мушки-дрозофилы), и вам надо найти их общие черты. Если вы поместите этих людей в одно небольшое помещение, то вряд ли можно будет качественно определить различия между отдельными людьми. Но если расположить всех этих людей на большей площади, то задача идентификации упростится во много раз. Точно так же распределение информации по всему мозгу мушки-дрозофилы позволяет мозгу сделать выбор наиболее качественный выбор отличительных особенностей того или иного запаха и выбрать 5 процентов наиболее значимых в данной ситуации нейронов для дальнейшего запоминания информации.
Исследователи проверили работоспособность такого поиска к индексации и поиску данных на трех различных наборах. Искусственно поддерживая затраты вычислительных ресурсов на одном и том же уровне, исследователи выяснили, что новый метод индексации обеспечивает поиск данных на 30-50 процентов более быстрый и точный, нежели традиционные методы, на базе которых строятся современные поисковые системы.
“Данные исследования показывают нам то, как можно использовать современные достижения в области нейробиологии для создания более эффективных компьютерных алгоритмов” – рассказывает Кристин Брэнсон (Kristin Branson), ученая в области биологический информатики из Медицинского института имени Говарда Хьюза, – “Именно для этого мы самым тщательным образом изучаем работу мозга человека, ведь в нем скрыто огромное количество алгоритмов, отладкой и совершенствованием которых занималась сама природа на протяжении многих тысячелетий”.
Следует отметить, что на свете существуют и другие алгоритмы индексации и поиска, работающие на схожих с описанным выше принципом работы мозга мушки-дрозофилы, но эти алгоритмы не демонстрируют столь высокой точности и эффективности, как алгоритм, разработанный группой из Института биологических исследований Солка. И в самом скором времени ученые собираются проверить работу их нового алгоритма на нескольких наборах данных совершенно разной природы, после чего можно будет привлекать к этому делу потенциальных партнеров из промышленного сектора.