Нередко на посещаемых веб-страницах под заголовками «Популярные записи», «Featured articles» или даже «Cool stuff» публикуются списки лучших материалов. Идея отличная, но есть и обратная сторона: существует проблема отбора действительно стоящего контента.
Предположим, запущен новый сайт. На нем ежедневно публикуются материалы, собирается статистика посещений. Уже через пару недель можно заняться составлением первых рейтингов. Позиция ссылки в топе будет определяться, например, количеством просмотров страницы.
Проходит месяц, в рейтинге не наблюдается значительных перестановок из-за банально временного фактора: чем старше статья, тем больше людей ее видели. Но необязательно читали. Можно попробовать учитывать только просмотры дольше минуты. В любом случае количество читателей не является показателем качества материала. Связь, конечно, есть, но от ситуации может зависеть очень многое.
Если лидеры вашего топа остаются неизменными, постоянным посетителям от него будет мало толку, поэтому разумно желание как-то стимулировать ротацию ссылок. Сразу приходит в голову идея ограничить участников рейтинга временными рамками: либо совсем отсекать старые материалы, либо давать новым какие-то бонусы.
Совершенствование алгоритмов поисковых систем похоже на эволюцию механизмов формирования рейтингов. Рамблеровская «примесь», «эффект новичка» Яндекса, Google page rank — всё может найти отражение в вашем алгоритме. Разработка формул, по которым рассчитываются позиции в топах мне кажется очень интересным занятием. В случаях с поисковыми системами это может быть головной болью для разработчиков, а для создателей небольшого сайта — это fun.
Важно понять, что алгоритмы должны совершенствоваться постоянно, хотя и не так интенсивно, как у поисковых систем.
При формировании локального рейтинга можно учитывать
* количество комментариев,
* пользовательские оценки (нужна система голосования),
* авторские оценки,
* количество внешних ссылок.
В правой колонке этого блога тоже есть блок «Популярные записи». Изначально туда попадали, на мой взгляд, не самые лучшие посты. Я немного изменил алгоритм, и теперь там появляются самые читаемые материалы за последние две недели. Так обеспечивается ротация. Через месяц я планирую усложнить механизм. Есть предложения, в какую сторону его развивать? Предлагаю поиграть в инженеров Гугла :)
Дмитрий Сергеев, 22 года. Разрабатываю сайты на Drupal.
Фрукт, 15.12.2006 07:46
Конечно нельзя говорить что самая популярная новость на сайте есть самая интересная, или лучшая. Я соглашусь с вами по поводу критериев отбора, ибо Новость заточенная под поисковики сразу станет самой "лучшей"