По версии Google в мировых библиотеках хранится 129 864 880 книг

Раздел — За рубежом Опубликовано 9 августа 2010 —
По версии Google в мировых библиотеках хранится 129 864 880 книг

Сотрудники проекта Google Book Search попытались подсчитать печатные издания, которые можно найти в книгохранилищах по всему миру.

Как сообщил в официальном блоге Google Book Search один из технических специалистов сервиса Леонид Тейчер (Leonid Taycher), работая в компании, которая взялась оцифровать все книги в мире, сложно не задаться вопросом: сколько же всего на свете книг? Исследовательская группа проекта Google Books предприняла попытку их пересчитать.

В ходе работы учитывалась каждая печатная книга в переплете. Как отдельные единицы фиксировались различные издания одного произведения, а также издания в твердой и мягкой обложке. Но в силу специфики подхода, например, брошюры, переплетенные сотрудниками библиотеки, также рассматривались как одна книга.

Существующие каталоги и идентификационные системы, по мнению специалистов Google, далеки от того, чтобы дать даже примерный ответ на вопрос о реальном количестве книг, выпущенных на сегодняшний день. Как отмечает Тейчер, опираться только на сведения, собранные системой ISBN, например, невозможно, поскольку она существует лишь с 60-х годов, широко используется – с 70-х, и при этом распространена преимущественно на Западе. Более того, в базе были неоднократно зафиксированы разные книги с одним идентификационным номером. Наконец, номер ISBN время от времени присваивается не только книгам, но и различным видам «печатной продукции» - от наклеек на CD-диски до бирок для одежды.

Исследователей также не удовлетворили идентификаторы, которые используются для библиографических записей Библиотеки Конгресса (LCCN, Library of Congress Control Numbers) или известной некоммерческой библиотечной системы Online Computer Library Center (каталог WorldCat). Идентификационные номера тут тоже дублируются, к тому же библиографическому описанию подлежат не только интересующие Google Books «тома в переплете», но и другие разновидности документов.

Соответственно, специалистам проекта ничего не оставалось, как разрабатывать собственную стратегию работы. Они проанализировали данные, собранные из более 150 различных источников, включая вышеназванные, а также менее крупные национальные каталоги и коммерческие сервисы. По результатам сбора всех библиотечных и каталожных записей число зафиксированных книг приблизилось к миллиарду. После первоначальной обработки и удаления очевидных дублей оно сократилось почти вдвое и составило около 600 миллионов. Дальше последовала более тонкая работа с использованием специально разработанных алгоритмов фильтрации, в результате чего исследователи остановились на 129 864 880 книгах. По словам Тейчера, по состоянию на 7 августа, это число может считаться наиболее точным.

Исследовательская деятельность вокруг проекта Google Books в последнее время активизировалась. Ранее, напомним, сообщалось о том, что Интернет-гигант окажет финансовую поддержку двум десяткам ученых, которые в своей исследовательской работе будут использовать ресурсы «книжного проекта» Google.


map1map2map3map4map5map6map7map8map9map10map11map12map13map14map15map16map17map18map19map20map21map22map23map24map25map26map27map28map29map30map31map32map33map34map35map36map37map38map39map40map41map42map43map44map45map46map47map48map49map50map51map52map53map54map55map56map57map58map59map60map61map62map63map64map65map66map67map68map69map70map71map72map73map74map75map76