Автоматическое формирование облака тегов на основе частоты употребления слов в текстах на сайте — идея, которая лежит на поверхности. Сложности в реализации: «шум», создаваемый незначащими словами вроде союзов и предлогов, и осмысленное объединение разных словоформ. Впрочем, при относительно небольшом объеме текста проблему можно решить, внося коррективы вручную.
Чираг Мехта (Chirag Mehta), судя по зоне «ag» из Антигуа и Барбуда, написал такой скрипт для английского языка. Традиционно, чем чаще используется слово, тем крупнее оно выводится. Необычно добавление в облако параметра «свежесть» тега. Слова, популярные в последнее время, выводятся ярким цветом, тусклым — слова, употреблявшиеся давно.
Алгоритмы вычисления «свежести» тега можно посмотреть в коде. Интересна сама идея добавления второго смыслового измерения в облако. Так «восходящая звезда» (средний шрифт, яркий цвет) будет выглядеть заметнее «древнего мастодонта» (огромный шрифт, тусклый цвет). Думаю, этому эффекту можно найти применение.
Но и это не всё. Чираг сгенерировал облака для каждого месяца, начиная с ноября 2001 года. Он приделал к конструкции слайдер (ползунок) на JavaScript, и теперь можно смотреть, как изменялось употребление слов в динамике.
Что рассказывать, смотрите и сами всё поймете.
Дмитрий Сергеев, 22 года. Разрабатываю сайты на Drupal.
Blixx, 16.02.2007 00:10
Круто. Только не удобно следить за словом в динамике, когда оно скачет со строчки на строчку из-за изменения размеров.