什么是字数与字符统计工具?
这款工具可以分析任意一段文本,并给出字数、不重复(去重)词数、含空格的字符总数、可见字符数(不计空白符)以及空格字符的数量。它还会生成一张词频密度表,展示每个词出现的次数及其在全文中所占的百分比——无论是写 SEO 文章、写论文、控制社交媒体字数上限,还是检查可读性,都非常实用。它是一款纯粹的文本处理工具,在世界任何地方使用结果都完全一致。
如何使用
把文本粘贴或输入到文本框中,然后提交。保持勾选「密度表中忽略停用词」,可在密度表里隐藏常见的虚词(如 the、a、is、and 等),但这些词仍会计入总字数。取消勾选后,密度表会列出每一个词。
统计规则
一个「词」是指由字母或数字组成的最长连续片段,其中可以包含连字符或撇号,因此「up-to-date」「don't」和「sister-in-law」都各算作一个词。「全部字符」会统计包括空格、制表符和换行符在内的每一个字符;「可见字符」只统计非空白字符;「空格」仅统计字面意义上的空格字符(U+0020)。
某个词的密度等于它出现的次数除以总词数,再乘以 100,结果保留两位小数。如果文本中没有任何词,所有密度均显示为 0.00%。
$$\text{density}(w) = \frac{\text{count}(w)}{\text{allWords}} \times 100$$$$\text{visibleCharacters} = \text{allCharacters} - \text{whitespace}$$
实例演示
以「The quick brown fox. The fox is up-to-date.」为例,共有 8 个词、6 个不重复词、44 个字符、7 个空格和 37 个可见字符。在忽略停用词的情况下,密度表会显示:fox 2 次(\(\frac{2}{8} \times 100 = 25.00\%\))、quick 1 次(\(12.50\%\))、brown 1 次(\(12.50\%\))、up-to-date 1 次(\(12.50\%\)),合计 8 个词、\(100.00\%\)。
常见问题
空格算字符吗? 算——「全部字符」包含空格,而「可见字符」不包含空格。
停用词会从字数里去掉吗? 不会。忽略停用词只是把它们从密度表中隐藏,它们仍然计入「全部字数」。
支持带重音符号或非拉丁文字的文本吗? 支持。词语匹配使用 Unicode 字母和数字类别,因此中文、日文、带重音的欧洲语言等都能正确处理。