February 26th, 2010

l

холодный отжим текста

diesell попросил меня рассказать, как я вытаскиваю тексты из гугльбукса. Никакой хитрости тут нет, более того, возможно, есть более эффективный способ, тем не менее, если нужно посмотреть небольшой кусок (максимум 2-3 страницы), то это, конечно, удобнее, чем специально ходить в библиотеку.

Текст вытаскивается по методу коромысла, когда с помощью текстовых кусков вытаскиваются картинки-«папирусы» и наоборот. В случае, когда следующий кусок текста попадает в «мертвую зону», не выдаваемую ни как текст, ни как «папирус», к текстовому запросу присоединяется простейшее короткое слово (союз, предлог, местоимение), либо ключевое слово, о котором известно, что оно встречается в дальнейшем.

Разберем на конкретном примере: книга Викторина Попова «Снег и солнце», меня интересует страница 28.
Collapse )

Upd: kcmamu подсказал гораздо более простой и рациональный способ.
l

коротко о спорте

Все началось с того, что призер соревнований по полутрубе стал героем неприличной фотосессии с медалью. Узнав об этом, голландский конькобежец назвал телекорреспондентку дурой. В отместку его тренер нюхнул неправильную дорожку, а хоккеистки сборной Канады обкурились и заблевали лед шампанским. В ответ Александр Овечкин нанес непоправимый ущерб РИА "Новости", уничтожив одной аппаратуры на 24 млн. долларов, не считая зарядных устройств и двух мотков USB-кабеля. Поэтому финским хоккейным болельщикам пришлось труднее, чем русским: в полдесятого вечера заснуть не так просто, как в четыре утра. Неудивительно, что на церемонии закрытия игр крещеный было чебурашка передумал и принял ислам.