Игорь Петров (labas) wrote,
Игорь Петров
labas

Categories:

google books: что произошло и что делать?

1. Что такое Google Books?

Google Books (books.google.com) - предоставляемый компанией Google сервис полнотекстового поиска по (предварительно оцифрованным) книгам.
Для книг в Google Books существует четыре режима доступа.
Full view: полный показ книги (в-основном, для книг, копирайт на которые истек).
Preview: полный показ ограниченного числа страниц книги.
Snippet view: показ двух-четырех строчного отрывка (сниппета), который содержит искомое слово или последовательность слов.
No preview: книга еще не оцифрована или доступ к ней закрыт по каким-то иным причинам. В этом случае можно увидеть только описание книги, но не ее содержание.
Наиболее распространенный вид доступа - snippet view.

Google Books предоставляет возможности как для макро-поиска (по всему массиву книг), так и для микро-поиска (внутри одной книги). Для поиска определенной последовательности слов ее нужно закавычить.

Иллюстрация: сниппет с подсвеченными желтым цветом словом, по которому велся поиск.


Фактически Google Books предоставляет сервис суперкаталога (именного, предметного и пр.) для мегабиблиотеки (общее количество оцифрованных книг превышает 25 миллионов): с его помощью можно мгновенно, и не выходя из дома, получить общее (хотя и не полное) представление о том, в каких книгах использовалось определенное слово, последовательность слов, имя собственное, цитата и пр.

2. Что произошло с Google Books?

По всей видимости, около 4 недель назад разработчики внесли в код поисковой машины изменения, которые затронули определенные функции поиска. После этого количество результатов поиска (при неизменных запросах) уменьшилось в разы, или даже на порядки. В выдачу попадают, в основном, недавно изданные книги в режиме доступа preview.
Книги в режиме доступа snippet view в выдачу попадают в крайне ограниченном (по сравнению с ситуацией до октября 2016 года) количестве.

На микро-уровне проблема в том, что существенно ухудшился поиск внутри книг.
Иллюстрация: сама книга доступна по прежнему адресу.
Но поиск по большинству "часто встречающихся слов и выражений" в ней дает нулевой результат: 1, 2, 3 и т.д.
Запрос на имя автора неожиданно дает несколько случайных сниппетов, но поиск на встречающиеся в них слова (1, 2) снова дает пустой результат.

На макро-уровне это означает, что данная книга не попадет в поисковую выдачу при запросе по этим словам и последовательностям слов.

Отмечу, что изредка поиск по отдельным "часто встречающимся словам и выражениям" работает, но при этом возникает другой феномен: например, микро-поиск внутри книги по определенному выражению работает, а макро-поиск по нему же дает пустой ответ.

В целом, это означает, что на данный момент сервис Google Books вместо полной поисковой выдачи выдает какое-то незначительное и непредсказуемое подмножество результатов, что делает его практически бесполезным.

3. Что делать?

Насколько можно судить, попытки жаловаться на поломку уже неоднократно предпринимались: 1; 2; 3.

Как нетрудно видеть, работники сервиса просто не понимают, в чем проблема, считают ее частным случаем, возникшим у единичного пользователя, и вместо сообщения разработчикам о неправильной работе сервиса, пытаются перекладывать ответственность или учить пользователей азам поиска.
Конечно, играет свою роль и то, что Google Books это не Google Mail и не YouTube, это (к сожалению) не продукт массового пользования, поэтому нет массовых жалоб.

Следовательно, необходимо как-то довести информацию о поломке до разработчиков сервиса. Пользователи Google Books будут крайне благодарны за это, каким бы путем это ни было сделано: частным, официальным или даже с использованием СМИ (на мой взгляд, информация о том, что крупнейшая библиотека мира, мягко говоря, сломалась, вполне является новостным поводом).

Update. Меня попросили описать проблему на английском. За поправки и уточнения буду признателен.


To whom it may concern,

Recently I have noticed two (independent?) issues.

1. "Search inside the book" function does NOT work properly for the books with snippet view.

The problem seems to be that search queries containing infrequent proper nouns are returning no matches/no snippets, even if these proper nouns are on the list of "common terms and phrases" for these books.

Example No 1. (English)

No matches for John Boker
No matches for Oberursel
No matches for Critchfield

All these names are on the list of "common terms and phrases".

Example No 2. (Russian)

No matches for Травин
No matches for Вайгач
No matches for Галим

All these names are on the list of "common terms and phrases". Previously all these requests had returned snippets.

It seems that some sort of a "dictionary" is in use. If a search query contains a word from a "dictionary", request returns snippet(s). For the "unknown" words though request returns nothing.

The consequence for the global Google Books search is that the book CANNOT be found if such an infrequent proper noun is used as a keyword for the search (however, this book contains this proper noun).
For example, the word "Травин" occurs several times in a book "Снег и солнце", but one cannot find this book using "Травин" as a search query.

This is total nonsense, because people don't put frequently used words in a search bar, neither they are looking for them. Instead they are usually searching using names, places, geographic location, i.e. proper nouns.

2. Global Google Books search for the exact sequence of words (enclosed within double quotes) does NOT work properly at least for the books with snippet view.

The exact sequence of words can be found inside the book, but just the same sequence of words returns no matches for this book in the global Google Books search.

Example No 3. (English)

Search inside the book:

Global search.

Example No 4. (Russian)

Search inside the book:


Global search.

The search for the exact sequence of words (enclosed within double quotes) is an important search tool and it CANNOT be deprecated.

Thanks a lot for your time concerning this matter.
Tags: блггг
Subscribe
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 58 comments