Игорь Петров (labas) wrote,
Игорь Петров
labas

Categories:

холодный отжим текста

diesell попросил меня рассказать, как я вытаскиваю тексты из гугльбукса. Никакой хитрости тут нет, более того, возможно, есть более эффективный способ, тем не менее, если нужно посмотреть небольшой кусок (максимум 2-3 страницы), то это, конечно, удобнее, чем специально ходить в библиотеку.

Текст вытаскивается по методу коромысла, когда с помощью текстовых кусков вытаскиваются картинки-«папирусы» и наоборот. В случае, когда следующий кусок текста попадает в «мертвую зону», не выдаваемую ни как текст, ни как «папирус», к текстовому запросу присоединяется простейшее короткое слово (союз, предлог, местоимение), либо ключевое слово, о котором известно, что оно встречается в дальнейшем.

Разберем на конкретном примере: книга Викторина Попова «Снег и солнце», меня интересует страница 28.

Для удобства я использую два таба браузера: один для запросов по books.google.com (верхнее окошко), далее таб 1, а второй для запросов по книге (нижнее окошко), далее таб 2.

запростабвыдачакомментарий
"Травин"2начало страницы
"путешественник вокруг света на"1- Я - Травин, путешественник вокруг света на велосипеде.
- На велосипеде?!
- Помогите снять одежду, - не отвечая, попросил Травин. - Сейчас я с Печоры, ...
"Сейчас я с Печоры"1Сейчас я с Печоры, переход ужасный, заблудился... Чувствую, отморозил ноги.
"Чувствую, отморозил ноги"2"мертвая зона"
"Чувствую, отморозил ноги" и1попросил Травин. Гостя уложили в постель, и в ту же минуту безмятежноотсюда идем сначала вверх
"Гостя уложили в постель"1Внесите, пожалуйста, его, он у сеней, - попросил Травин. Гостя уложили в постель, и в ту же минуту безмятежно, словно новорожденный, он заснул.
"Внесите, пожалуйста"2.
"в ледяную воду пальцы "1ноги спустили в ледяную воду; пальцы действительно оказались
"ноги спустили"2выдается ложный "папирус", такое порой случается
"Чувствую, отморозил ноги" "ноги спустили"1Чувствую, отморозил ноги...
Костюм разрезали сухарным ножом, ноги спустили в ледяную воду; пальцы действительно оказались
смычка! теперь идем вниз
"он заснул"2
"на лампу, на бодрствовавшего"1на лампу, на бодрствовавшего пекаря. Травин сказал слово, и началась у них беседа, в которой удивительный велосипедист поведал
"велосипедист поведал" о1велосипедист поведал пекарю о своей затее. Около трех лет назад выехал он на велосипеде из Пскова на
"он на велосипеде из Пскова на" 1он на велосипеде из Пскова на Ленинград, Вятку, Владивосток, Камчатку, вдоль китайской границы на Монголию, по Сибири,
"на Монголию, по Сибири" Кавказ 1на Монголию, по Сибири, Туркестану на Каспий, Кавказ, в Крым; Украину, Белоруссию, Карелию, Лапландию, использовал в запросе слово "Кавказ", потому что знал маршрут Травина
"Лапландию "2
"человека пекарь" с1человека пекарь.
Велосипедист развернул тетрадь с сотнями регистрационных печатей, подтверждающих путь следования
"подтверждающих путь "2
"японцев в Хакодате"1японцев в Хакодате.
— Метели, туманы... — рассказывал Травин про поход с Печоры.
"поход с Печоры"2конец страницы


Итог:
— Я — Травин, путешественник вокруг света на велосипеде.
— На велосипеде?!
— Помогите снять одежду, — не отвечая, попросил Травин. — Сейчас я с Печоры, переход ужасный, заблудился... Чувствую, отморозил ноги.
Костюм разрезали сухарным ножом, ноги спустили в ледяную воду; пальцы действительно оказались обморожены.
— На велосипеде?! - не мог притти в себя пекарь.
— Внесите, пожалуйста, его, он у сеней, — попросил Травин.
Гостя уложили в постель, и в ту же минуту безмятежно, словно новорожденный, он заснул.
Ночь. За стенами посвистывает стихающий ветер. Травин промычал во сне, полуоткрыл глаза на лампу, на бодрствующего пекаря. Травин сказал слово, и началась у них беседа, в которой удивительный велосипедист поведал пекарю о своей затее.
Около трех лет назад выехал он на велосипеде из Пскова на Ленинград, Вятку, Владивосток, Камчатку, вдоль китайской границы на Монголию, по Сибири, Туркестану на Каспий, Кавказ, в Крым; Украину, Белоруссию, Карелию, Лапландию, оттуда в Архангельск, Пинегу, Вайгач и теперь Хабарово.
— Вот какие дела! - потирал руки обрадованный появлением человека пекарь. Велосипедист развернул тетрадь с сотнями регистрационных печатей - огромные печати Циков нацреспублик, скромные — окружных и волостных исполкомов, иероглифическая надпись японцев в Хакодате.
— Метели, туманы... — рассказывал Травин про поход с Печоры. Продвигался не более пятнадцати километров в сутки. Пришлось выйти на лед и двигаться вблизи берега по компасу. У острова Пе


Upd: kcmamu подсказал гораздо более простой и рациональный способ.
Subscribe

  • заметки на полях

    1. M.Kellogg "The Russian Roots of Nazism" In August 1912, Dubrovin renamed the organization the Vserossiiskogo Dubrinskogo soiuza russkoga…

  • чтение: мемуары социал-демократов и пр.

    Пытался поискать следы Харитона Шавишвили в мемуарной литературе, первый заброс невода результатов не принес, тем не менее фиксирую для памяти. 1)…

  • все наши фиоритуры

    Интервью Терехова в Огоньке: — Вы пришли в журналистику и литературу в перестроечное время. Можно ли сегодня говорить о массовом развенчании…

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 49 comments

  • заметки на полях

    1. M.Kellogg "The Russian Roots of Nazism" In August 1912, Dubrovin renamed the organization the Vserossiiskogo Dubrinskogo soiuza russkoga…

  • чтение: мемуары социал-демократов и пр.

    Пытался поискать следы Харитона Шавишвили в мемуарной литературе, первый заброс невода результатов не принес, тем не менее фиксирую для памяти. 1)…

  • все наши фиоритуры

    Интервью Терехова в Огоньке: — Вы пришли в журналистику и литературу в перестроечное время. Можно ли сегодня говорить о массовом развенчании…