Как выбирать лучшие материалы сайта

07.12.2006

Нередко на посещаемых веб-страницах под заголовками «Популярные записи», «Featured articles» или даже «Cool stuff» публикуются списки лучших материалов. Идея отличная, но есть и обратная сторона: существует проблема отбора действительно стоящего контента.

Предположим, запущен новый сайт. На нем ежедневно публикуются материалы, собирается статистика посещений. Уже через пару недель можно заняться составлением первых рейтингов. Позиция ссылки в топе будет определяться, например, количеством просмотров страницы.

Проходит месяц, в рейтинге не наблюдается значительных перестановок из-за банально временного фактора: чем старше статья, тем больше людей ее видели. Но необязательно читали. Можно попробовать учитывать только просмотры дольше минуты. В любом случае количество читателей не является показателем качества материала. Связь, конечно, есть, но от ситуации может зависеть очень многое.

Если лидеры вашего топа остаются неизменными, постоянным посетителям от него будет мало толку, поэтому разумно желание как-то стимулировать ротацию ссылок. Сразу приходит в голову идея ограничить участников рейтинга временными рамками: либо совсем отсекать старые материалы, либо давать новым какие-то бонусы.

Совершенствование алгоритмов поисковых систем похоже на эволюцию механизмов формирования рейтингов. Рамблеровская «примесь», «эффект новичка» Яндекса, Google page rank — всё может найти отражение в вашем алгоритме. Разработка формул, по которым рассчитываются позиции в топах мне кажется очень интересным занятием. В случаях с поисковыми системами это может быть головной болью для разработчиков, а для создателей небольшого сайта — это fun.

Важно понять, что алгоритмы должны совершенствоваться постоянно, хотя и не так интенсивно, как у поисковых систем.

При формировании локального рейтинга можно учитывать
* количество комментариев,
* пользовательские оценки (нужна система голосования),
* авторские оценки,
* количество внешних ссылок.

В правой колонке этого блога тоже есть блок «Популярные записи». Изначально туда попадали, на мой взгляд, не самые лучшие посты. Я немного изменил алгоритм, и теперь там появляются самые читаемые материалы за последние две недели. Так обеспечивается ротация. Через месяц я планирую усложнить механизм. Есть предложения, в какую сторону его развивать? Предлагаю поиграть в инженеров Гугла :)

Комментарии

Фрукт, 15.12.2006 07:46

Конечно нельзя говорить что самая популярная новость на сайте есть самая интересная, или лучшая. Я соглашусь с вами по поводу критериев отбора, ибо Новость заточенная под поисковики сразу станет самой "лучшей"

afriki, 16.12.2006 18:26

я почему-то последнее время не верю в атоматические системы ранжирования.

объясню почему:
1. количество комментариев к материалу
как правило, к полезным статьям, фактически верным, интересным, хорошо написанным, очень мало комментариев.
ну действительно, что тут напишешь? спасибо? этот материал мне очень помог? афтор пеши есчо?

а вот к материалам, в которых допущены какие-то ошибки, ну или автор просто не очень хорошо разобрался в теме, каментов очень много. и все они про то, что автору нужно учить матчасть, а лучше выпить йаду.

согласитесь, для вновь прибывших пользователей большую ценность представляют материалы из первой категории.

2. пользовательские оценки
более-менее правильно отражают действительность и, возможно, вместе с авторскими оценками датут какой-то объективный срез.

*
я, в общем, за то, чтобы первое место занимал блок, сформированный редакторами, ну и где-то обязательно присутствовал блок вроде "выбор пользователей"

потому что есть такие материалы, которые интересны, ценны, но знает о них только редакция

а вообще тема очень интересная
я тоже об этом часто думаю

Дмитрий Сергеев, 18.12.2006 11:52

2 afriki: Редакция тоже не всегда знает, какие материалы являются самыми ценными. Думаю, механизм отбора должен основываться на экспертных оценках, но и статистику разную тоже должен учитывать. Человек проверяется машиной, а машина -- человеком.

Sergeev Dmitry, 27.12.2006 16:17

Возможно к самым читаемым за последние две недели добавлять несколько "топовых" материалов из "архива", устанавливать им срок жизни в те же 2 недели. а затем заменять их в каком-то (случайном?) порядке на другие архивные материалы, которые в свое время были высоко оценены. Так наряду с ротацией будут "всплывать" интересные материалы более чем 2-х недельной давности. Данный метод конечно надо усложнять. если мы говорим о сайтах, например, новостных, для которых важна актуальность информации..

Дмитрий Сергеев, 27.12.2006 19:16

2 Sergeev Dmitry: Да, хороший вариант.

Я же, пожалуй, попробую составлять список вручную: материалов здесь немного, автоматизировать пока особенно нечего.