Google сообщает о новой инициативе - на сей раз компания намерена
разместить в интернете тысячи оцифрованных снимков старых газет и
журналов. В компании отмечают, что все печатные издания, которые
планируется отсканировать и разместить в сети, были выпущены еще до
эпохи расцвета интернета.
В компании говорят о подписании
партнерских соглашений с примерно сотней западных издательств на
сканирование и публикацию их архива. По условиям соглашения, Google
будет сканировать старые издания полностью, без каких-либо сокращений и
вырезок.
"Это огромный объем контента. Мы приводим его в качественно новый формат", - говорит вице-президент Google Марисса Меер.
О
новой инициативе компании было объявлено на бизнес-конференции
TechCrunch50, ориентированной на начинающий бизнес. Здесь собираются
представители стартапов с одной стороны и инвесторы с другой.
По
словам Меер, работа по оцифровке газет уже началась и на конференции
были показаны снимки из газеты Rome News Tribune, где публиковалась
статья о высадке американских астронавтов на Луну. "Можно отследить,
как тот или иной момент или событие освещались различными изданиями,
кроме того, при изучении таких материалов прекрасно ощущается дух того
времени", - говорит она.
Для работы с архивами Google создала
несколько модифицированный поисковый алгоритм, который оптимизирован
для поиска по заголовкам, авторам и изданиям. Кроме того, алгоритм при
нахождении требуемого материала работает таким образом, что в боковом
окне отражаются схожие статьи из других газет.
Меер рассказала,
что для "газетного проекта" используется алгоритм, схожий с тем, что
был применен при работе проекта Google Books.
Напомним, что
ранее Google заключила соглашения с наиболее крупными американскими
изданиями - New York Times и Washington Post. Однако теперь список
издателей был расширен и в него также вошли европейские газеты.
"Такой
подход даст нам возможность находить более разнообразные материалы из
крупных и небольших газет", пишет в блоге менеджер Google Панит Сони.
"Эта инициатива только что стартовала, мы постоянно подключаем все
новых и новых издателей. Наша конечная цель заключается в создании
цифрового архива с несколькими миллиардами страниц".
Для того,
чтобы как-то заинтересовать газетчиков поделиться своими архивами,
Google будет размещать в проекте рекламу, часть прибыли с которой будет
получать то или иное издание.
На сегодня самая старая газета,
присутствующая в архиве, относится к газете Quebec Chronicle-Telegraph
и датирована 1764 годом. Российская тематика в западных СМИ обсуждается
также довольно активно. Например, одна из наиболее старых записей,
касающаяся России, датирована 1903 годом и относится к реформам
министра Керенского. Статья была написана 1 ноября 1903 года в
Петрограде корреспондентом NY Times.
|