Что такое счётчик слов и символов?
Этот инструмент анализирует любой фрагмент текста и показывает количество слов, число различных (уникальных) слов, общее число символов с учётом пробелов, число видимых символов (без пробельных) и количество собственно пробелов. Кроме того, он строит таблицу плотности слов, в которой видно, как часто встречается каждое слово и какой процент текста оно занимает, — это удобно при SEO-копирайтинге, написании эссе, контроле лимитов в соцсетях и проверке читабельности. Это простой инструмент обработки текста, который работает одинаково в любой точке мира.
Как пользоваться
Вставьте или введите текст в поле и отправьте. Оставьте флажок «Не учитывать стоп-слова в таблице плотности», чтобы скрыть из таблицы частые служебные слова (the, a, is, and и т. п.), при этом они по-прежнему будут учитываться в общем количестве слов. Снимите флажок, чтобы увидеть в таблице плотности все слова без исключения.
Правила подсчёта
Словом считается максимальная последовательность букв или цифр, которая может содержать внутренние дефисы или апострофы, поэтому «up-to-date», «don't» и «sister-in-law» — это по одному слову. «Все символы» учитывают каждый символ, включая пробелы, табуляции и переносы строк. «Видимые символы» учитывают только непробельные символы:
$$\text{visibleCharacters} = \text{allCharacters} - \text{whitespace}$$
«Пробелы» считают только сам символ пробела (U+0020).
Плотность слова — это число его вхождений, делённое на общее количество слов и умноженное на 100, показывается с двумя знаками после запятой:
$$\text{density}(w) = \frac{\text{count}(w)}{\text{allWords}} \times 100$$
Если слов нет, любая плотность равна 0,00 %.
Разбор на примере
Для фразы «The quick brown fox. The fox is up-to-date.» получаем 8 слов, 6 уникальных слов, 44 символа, 7 пробелов и 37 видимых символов. Если исключить стоп-слова, таблица плотности покажет: fox — 2 (\(\frac{2}{8} \times 100 = 25{,}00\,\%\)), quick — 1 (\(\frac{1}{8} \times 100 = 12{,}50\,\%\)), brown — 1 (12,50 %) и up-to-date — 1 (12,50 %), а итог составит 8 слов и 100,00 %.
Частые вопросы
Считаются ли пробелы за символы? Да — «Все символы» включают пробелы; «Видимые символы» их исключают.
Убираются ли стоп-слова из подсчёта слов? Нет. Отключение стоп-слов лишь скрывает их из таблицы плотности; в показателе «Все слова» они по-прежнему учитываются.
Поддерживается ли текст с диакритикой или на нелатинских алфавитах? Да, при разборе слов используются классы букв и цифр стандарта Unicode.