Я бы мог написать целую книгу о вчерашнем дне, однако времени мало, поэтому постараюсь побыстрее. Кстати я первый раз меняюсь постовыми, мне написала одна девушка, которая судя по всему тоже пытается заработать в инете. Вот ее блог.
Ну а теперь ход событий:
1. Я выбирал либо мне напарсить Акков с Тицем с LJ для тестовой перекупки, либо поковырять тему какие бэки принесут Тиц10
2. Второе победило и я пошел искать все сайты Рунета
3. Чудом на серче нашел ссылку на все сайты Рунета
4. Слил базу, и припупел, такой объем мне на предмет Тиц10 неотжать
5. Взял на заметку, отжать Тиц10 можно на Reg.ru, только надо бумаги им отправлять разные
6. Короче нашел на серче продавца, тот продал мне свежую базу сайтов которые в последний Ап получили Тиц10
7. Договорился, купил (недешево, но хотелка была сильной)
8. ~28000 сайтов.. тоже вам не в пуп дудеть, надо собрать кол-во бэков для каждого
9. Почесал репу и понял что самым верным способом будет парсинг самого Yandex на предмет упоминаний, тупо: “jkeks.ru”
10. Написал 2кб тестовины на PHP, начал парсить
11. На 541 сайте Yandex заблокировал, точнее стал извиняться и просить капчи
12. Пошел к Бобуку, Саппорт Яши и серч, помогли первый и послоедний
13. Переписал все под XML.yandex
14. Пропарсил еще 1000 результатов, больше не дают сегодня, завтра смогу еще 1000
15. Результаты кинул в OpenOffice Calc, отсортировал и О ! Чудо !
16. 6 сайтов с Тиц10 и всего 1 !!!! упоминанием в интернете и это из ~1500 сайтов
17. Беглый анализ сайтов показал, что Яндекс показывает мне далеко не все, но это мои домыслы
18. Вот эти чудо сайты:
У кого есть какие идеи, почему так поизошло ? Почему всего 1 упоминание(это даже не ссылка) дало Тиц10 ?
Эта строчка ради того чтобы попасть на topsape