Время 14:37  Дата 26.01.2010

Google Reader покажет новости сайтов без RSS


В Google Reader можно подписаться на новости сайтов, на которых нет RSS.


Для этого необходимо переключиться на английский язык интерфейса и попытаться подписаться на любой сайт. Google Reader сообщит, что RSS-фида на странице не содержится, и предложит его самостоятельно создать. После чего Google периодически будет проверять обновления страницы и сообщать о них пользователю Reader.

Для импорта RSS Google пользуется простейшей технологией - смотрит, меняется ли страница, и если она изменилась – сообщает об этих изменениях. Так же работают такие веб-проекты, как Page2rss или Femtoo. Эта технология имеет очевидные недостатки - если на странице есть новостные и неновостные блоки, будут ретранслироваться в том числе и изменения последних, что создаст ненужный шум. Кроме того, новости передаются достаточно неаккуратно - может быть ошибочно заполнено поле даты или заголовка.

По другой технологии работает «Скиур». Главное отличие «Скиура», рассказал его создатель Иван Бегтин, в том, что он анализирует страницу и выявляет там новостные ленты, а далее новостная лента «восстанавливается» из новостей сайта.

Это менее универсально, чем мониторинг каждой отдельной страницы, но более точно, поскольку воспроизводит дату, заголовок, текст и ссылку, ассоциированные с данной новостью на сайте. Отслеживание изменений на странице (как в Google Reader), сообщил г-н Бегтин, работает практически с любой веб-cтраницей, за исключением страниц слишком большого размера или тех где при изменении меняется структура страницы. Восстановление новостей, как это сделано в «Скиуре», будет работать во всех случаях, когда на сайте есть последовательность новостных записей как минимум с заголовком и датой публикации.



Адрес новости: http://siteua.org/n/125002