Дима Рубинштейн ([info]dimrub) wrote,
@ 2008-04-29 15:36:00
Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Entry tags:lj

Stats
Один из источников радужной статистики использования ЖЖ, о которой регулярно рапортует главный блогер всея ЖЖ А.Б. Носик.



(Post a new comment)


[info]yanek
2008-04-29 12:46 pm UTC (link)
Так эта, известная фича.

Большинство из них зарегено 20 января, если я не ошибаюсь и в количестве нескольких десятков тысяч.

Ходил даже график количества новых аккаунтов.

Сие явление обсуждалось в свое время.

(Reply to this)(Thread)


[info]dimrub
2008-04-29 12:47 pm UTC (link)
Первые три наугад выбранные зарегистрированы:

2 - 12-го января
1 - 8-го января

Впрочем, может быть, это они и есть.

(Reply to this)(Parent)(Thread)


[info]yanek
2008-04-29 01:49 pm UTC (link)
у меня такая же статистика.

Видать мы оба брали верхних 3-4-х ботов.

(Reply to this)(Parent)


[info]gingema
2008-04-29 03:45 pm UTC (link)
Вот в сумме как раз 20 и выходит ;)

(Reply to this)(Parent)


[info]dimrub
2008-04-29 12:57 pm UTC (link)
Ага:

http://pyrop.livejournal.com/782464.html

28-го января был пик, так что это другие роботы.

(Reply to this)(Parent)(Thread)


[info]yanek
2008-04-29 01:48 pm UTC (link)
Я именно єтот график имел ввиду.

Кроме того, что это был пререлиз ботогенератора у меня других версий нет.

(Reply to this)(Parent)(Thread)


[info]dimrub
2008-04-29 01:49 pm UTC (link)
Разумная версия (объясняет близость по времени).

(Reply to this)(Parent)


[info]shufel
2008-04-29 02:17 pm UTC (link)
очень странно, совсем разные паттерны - единовременное создание (?) огромной кучи юзеров, которых нигде не видно (может, они "англоязычные");
и растянутое на весь январь-месяц (а часть этих ботов и в марте вылупилась) создание активно френдящего улья.
лично меня впечатляет еще индивидуализация, особенно естественно выглядещие ники вместо обычных "sf67srt76".

(Reply to this)(Parent)(Thread)


[info]yanek
2008-04-29 02:42 pm UTC (link)
Ну, ники создать это просто вторая итерация генерации ботов.

Не вижу ничего сложного в использовании словаря, хотя проще юзать базу зарегистрированых доменов, там уже всю работу по натуральности названия выполнили люди.

(Reply to this)(Parent)


[info]catpad
2008-04-29 01:02 pm UTC (link)
Какая, однако, мерзость. Это они рекламодателей так, наверное, привлекают.

(Reply to this)(Thread)


[info]anjey
2008-04-29 01:13 pm UTC (link)
В нужный момент эти человекоподобные будут обеспечивать ссылками и поднимать в топ Яндекса то, что прикажут.

(Reply to this)(Parent)


[info]mopexod
2008-04-29 01:17 pm UTC (link)
Купили крутые пацаны сервис, почему бы самим не использовать? Не самим же писать - роботов посадили...

(Reply to this)(Parent)(Thread)


[info]dimrub
2008-04-29 01:50 pm UTC (link)
Я, кстати, не уверен, что эти роботы - дело рук СУПа. Но что в СУПе о них знают - тут к бабке не ходи.

(Reply to this)(Parent)


[info]shufel
2008-04-29 02:19 pm UTC (link)
как бы оценить сколько их?
тот улей, который я заметил, он для рекламодателей слишком мелкий - что такое 500 журналов; тем более, за три месяца (там даты регистрации - январь/март)

(Reply to this)(Parent)(Thread)


[info]dimrub
2008-04-29 02:20 pm UTC (link)
Я бы написал скрипт, который их отлавливает, но времени нет.

(Reply to this)(Parent)(Thread)


[info]shufel
2008-04-29 02:37 pm UTC (link)
по какому признаку отлавливать?!

(Reply to this)(Parent)(Thread)


[info]dimrub
2008-04-29 02:43 pm UTC (link)
Берешь фразу из верхнего поста, и ищешь ее, допустим, в гугле. Если точно такая же фраза есть еще в как минимум десяти журналах - это робот (добавляешь заодно и остальных). Это основная идея, ее можно немного уточнить, чтобы отсечь случайные совпадения.

(Reply to this)(Parent)(Thread)


[info]shufel
2008-04-29 03:06 pm UTC (link)
это если они все "пишут" выборку из одного и того же пула, а если, например, есть несколько десятков/сотен групп, каждая со своими источниками?

пока что вижу одну отлавливаемую черту - изобилие ссылок на библиотеки и просто сайты в домейне info. но а) это не оченьто спецефично б)кто сказал, что они все ракламиручт одно и тоже? может, большинство вообще "спит"

(Reply to this)(Parent)


[info]stas
2008-04-30 12:02 am UTC (link)
Суп может и по базе искать. Они-то точно знают, кто первый запостил (он может быть не бот, другие практически точно боты). Конечно, они могут контент и с других сайтов заливать, хоть ленту с google news перепечатывать.

(Reply to this)(Parent)


[info]yanek
2008-04-29 01:50 pm UTC (link)
Кстати судя по ссылке, раскручивают в поисковиках врангель.нет.

(Reply to this)


[info]romanklimenko
2008-04-29 03:29 pm UTC (link)
Агент Смит :-)

(Reply to this)(Thread)


[info]wildernesscat
2008-04-29 05:32 pm UTC (link)
Точно!

(Reply to this)(Parent)


Create an Account
Forgot your login?
Login w/ OpenID
English • Español • Deutsch • Русский…