テキストマイニング(テキストを分析し必要な情報を取り出すこと)の進化によって脚光を浴びつつあるのが、文章要約ツールだ。フォームに文章を貼り付けてクリックするだけで内容を解析し、必要な文字数に収まるように文章を要約してくれる。多くは商用ツールだが、ウェブ上で無料で使える日本語対応のツールも、ここ1~2年で多数登場している。

技術的にはまだまだ発展途上であり、そのまま利用可能な文章を出力できることは稀だが、文章を書いた本人では考えもしなかったような省略を行う特性がある。それを利用して若干短めに要約した上で意味が通るように補足し、文章を条件に合った文字数に仕上げたり、あるいは口コミやレビュー、長文の商品紹介などでキーワードの抽出に用いるなど、現時点でも実用的な用途はいくつもある。

今回は、そうした文章の要約に役立つ日本語対応の無料ツール3つを紹介する。指定できるオプションおよび出力結果がそれぞれまったく異なるので、同じ文章をそれぞれのツールで要約してみると面白いだろう。

テキストのアップロードにも対応した「ユーザーローカル自動要約ツール」

ユーザーローカル自動要約ツール」は、ユーザーローカルが提供する、文書要約アルゴリズムのひとつLexRankを利用した文章要約サービス。最大1万文字の文章の要約が可能で、テキストをペーストする以外にテキストファイルのアップロードにも対応している。文章の重要な部分をマーカー表示やヒートマップ表示によって可視化できるほか、出力結果を3行、5行、10行のいずれかから選択できる。対応言語は明記されていないが、試したところ英語でも問題なく機能する。

  • ユーザーローカル自動要約ツール

  • ユーザーローカル自動要約ツールの要約結果

Chrome拡張機能も提供する「IMAKITA Document Squeezer」

IMAKITA Document Squeezer」は、「長文を3行くらいでまとめる」ことを目的とした要約サービスで、日本語や英語をはじめ計8カ国語に対応する。センテンスの最大数および最小数を指定できるほか、キーワードを抽出する機能も備える。今回紹介する中で唯一Chrome拡張機能が提供されており、コピペ不要でウェブページ上のテキストを要約することが可能。具体的なアルゴリズムは不明だが、Chrome拡張機能のソースコードはGitHubeにて公開されている。

  • IMAKITA Document Squeezer

  • IMAKITA Document Squeezerの要約結果

オプションが豊富、文字数もカウントされる「テキスト自動要約」

テキスト自動要約」は、eF-4が公開している、文書要約アルゴリズムLexRankを利用した要約サービス。文単位もしくは文節単位の要約のいずれかを選択できるほか、文字数または圧縮率、文の数を指定できるなど、今回紹介する中ではオプションが豊富なことが特徴。出力前後の文字数も自動的にカウントされるのでわかりやすい。対応言語は明記されていないが、英語はスペースを除外した結果が返されることから、実質的に日本語専用となるようだ。

  • テキスト自動要約

  • テキスト自動要約の要約結果