среда, 23 ноября 2011 г.

R.I.P. прямой эфир яндекса


Есть у яндекса замечательный сервис прямой эфир, который показывает 20 последних пользовательских запросов.


Ну не совсем конечно "прямой", адалт например там фильтруется (а иначе его бы была большая часть, лол), хотя все отфильтровать конечно невозможно и проскакивает иногда.

Сервис так и просится, чтобы его парсили в автоматическом режиме, да во много потоков и с проксями. Что я собственно раньше и делал, но потом как-то забросил, а сейчас вот хотел снова начать, но получил внезапно хуй.

Дело было так: запустил я парсер, он проработал 5 суток и на выходе получилось 5 файликов по 700 с чем-то тысяч уникальных кеев в каждом. Ну думаю - охуенчик, сейчас вот только в один файлик объеденю все и удалю повторы, там конечно не 3.5 миллиона получится, а 2 например, учитывая мой прошлый опыт, но это тоже нормально.

Объединяю значит, удаляю, иии, блять, получаю все те же 700 с хуем тысяч кеев. Я сначала подумал что это у меня кейворд кипер сломался, которым я повторы удалял. Но нихуя. Реально каждый день ебаный прямой эфир выдает одни и те же кеи. Я думал, может он меня забанил так жестоко, но тоже нихуя, это просто невозможно, хоть и некоторые мои прокси прозрачные, но не все же. Получается, ебаные яндексоиды целенаправленно отключили мой любимый прямой эфир и он выдает одну и ту же несвежую хуйню.

А сервис был очень пиздат, поднимал настроение, показывал новые тренды, давал свежие и настоящие кеи в конце-концов. И выдает он эту одну и ту же хуйню уже месяца 2 как минимум, то есть обратно запускать они его и не собираются. Печально.

Вот те самые последние 700k кеев, и если кто-нибудь найдет в прямом эфире кей, которого нет в этом файлике, то дайте знать.

Комментариев нет:

Отправить комментарий