文字数・単語数カウンターとは?
このツールは、入力した文章を解析し、単語数、異なる(ユニークな)単語の数、スペースを含む総文字数、スペースなしの表示文字数(空白以外の文字数)、そしてスペース文字の数を一覧で表示します。さらに、各単語の出現回数と全体に占める割合(%)を示す「単語密度表」も自動で作成。SEOライティングや小論文、SNSの文字数制限のチェック、読みやすさの確認などに役立ちます。純粋なテキスト処理ツールなので、言語や地域を問わず世界中どこでも同じように使えます。
使い方
テキストボックスに文章を貼り付ける(または直接入力する)だけ。「密度表からストップワードを除外する」にチェックを入れたままにすると、よく使われる機能語(英語の the、a、is、and など)を密度表から非表示にできます。ただし、これらの語も総単語数にはきちんとカウントされます。チェックを外せば、すべての単語が密度表に表示されます。
カウントのルール
「単語」とは、文字または数字が連続したまとまりのことで、途中にハイフンやアポストロフィを含んでも構いません。そのため「up-to-date」「don't」「sister-in-law」はそれぞれ1単語として数えます。「総文字数」はスペース・タブ・改行を含むすべての文字を数えます。「表示文字数」は空白以外の文字だけを数えます。\(\text{visibleCharacters} = \text{allCharacters} - \text{whitespace}\)。「スペース数」は半角スペース(U+0020)のみをカウントします。
各単語の密度は「出現回数 ÷ 総単語数 × 100」で求め、小数第2位まで表示します。
$$\text{density}(w) = \frac{\text{count}(w)}{\text{allWords}} \times 100$$
単語が1つもない場合は、すべての密度が0.00%になります。
計算例
「The quick brown fox. The fox is up-to-date.」の場合、単語数は8、ユニークな単語は6、文字数は44、スペースは7、表示文字数は37になります。ストップワードを除外すると、密度表には fox 2回(25.00%)、quick 1回(12.50%)、brown 1回(12.50%)、up-to-date 1回(12.50%)が表示され、合計は8単語・100.00%となります。
$$\text{density}(\text{fox}) = \frac{2}{8} \times 100 = 25.00\%$$
よくある質問
スペースは文字数に含まれますか? はい。「総文字数」にはスペースが含まれ、「表示文字数」には含まれません。
ストップワードは単語数から除外されますか? いいえ。ストップワードの除外は密度表から非表示にするだけで、総単語数(All Words)にはそのままカウントされます。
アクセント付き文字や非ラテン文字(日本語など)にも対応していますか? はい。単語の判定にUnicodeの文字・数字クラスを使用しているため対応しています。