WEBサイト記事の自動生成は可能なのか?

技術コラム

どうも、ぶんたくです。

今日は、



ブログ記事の自動生成は可能なのか?

という疑問にお答えしたいと思います。

ニュースやインターネットなどでAIの技術進歩が騒がれる中、
このような疑問を思いついた方は少なくないでしょう。

結論から述べると、「2019年現在、ブロガーが書くような記事を作成するのは難しい」です。
この記事も人が手入力でタイピングすることで書かれています 笑

ただし、いくつかのジャンルの記事は自動生成が可能だと思います。

以下、詳しく説明していきます。

ブログ記事の自動生成をする意味

私のような弱小ブロガーのWEBサイトを訪問してもらうにはどうすればいいか?
Twitterも開設まもないので、SNS経由の流入は見込めません。

なので当たり前ですが、
ニッチなキーワードを狙った記事を多く公開していけば、
自然と人が集まってくると予想されます。

では、一体何回その作業を行えばよいでしょうか?

私もプログラマーの端くれなので、
繰り返し同じ作業をすることが基本的に嫌いです。

仮にもし、
指定キーワードを入力すると、
文章を自動で生成し、
自動で記事をポストしてくれれば。。。

楽ちんですよね?

そこで、調査したのがブログ記事の自動生成でした。

自動生成に適したWEBサイトジャンルとは?

指定キーワードだけで、数千文字の文章を生成するのは現実的ではありません。
なので、ハードルを一つ下げます。

ここで候補に上がったのが、業界ニュースの要約サイトです。

最新のニュースを検索し、その内容を要約、それを5つくらい集めれば、有益なまとめ記事と言えるのではないでしょうか?

要約の実装

実装方法としてすぐに頭に浮かんだのは、Pythonによる記事の要約のニュースでした。
どこかで見たことがあったのでしょう。

少しググってみて、以下のサイトに目を通してみると、、、

  • https://recruit-tech.co.jp/blog/2015/10/30/summpy-released/
  • http://www.itmedia.co.jp/news/articles/1807/25/news086.html
  • https://text-summary.userlocal.jp/
  • https://akituki.hatenablog.com/entry/2018/07/26/230000
  • https://qiita.com/riverwell/items/310e0a31f2e5097df7ff
  • https://qiita.com/takumi_TKHS/items/4a56ac151c60da8bde4b
  • https://gukouhikkoshi.com/lifehack20180920/

ここで重大な問題を発見します。

要約の種類

機械による要約には、「抽出型」と「抽象型」の2つに分類されます。

前者の「抽出型」は、その名の通り、要約したい文章の中から重要だと推定される文を、そのままコピーして要約文に使います。

一方、後者の「抽象型」は機械が文の内容を理解し、自分の言葉に置き換えて説明します。

現在開発されて世の中に普及している技術レベルは、前者の「抽出型」がほとんどです。
「抽出型」を利用してはただの”引用”になってしまい、オリジナルの記事として世の中に公開するには問題有りでしょう。

後者の「抽象型」は専門の研究者達がいまこぞって研究論文を発表している段階で、普及には時間がかかりそうな状況です。

「抽出型」要約を利用したWEBサイトは作れる?

重要な文を抽出するWEBサイトと聞いて何か心当たりはありませんか?

私の場合、2chのまとめサイトでした。
サイトの管理者が面白いと思う文をピックアップし、
主題とは無駄なレスは削除し、
ハイライトなどで該当文を強調して綺麗にまとめてアップします。

人が作る例としては以下が詳しいです↓

この2chまとめサイトの作成は、「抽象型」要約でも十分達成可能だと私は考えます。

ただ、まとめサイトはレッドオーシャンなので今から作っても旨みは少ないかも。。?

まとめ

当記事では、現代の技術の中で、一般的なエンジニアが実装できる抽出型の要約技術、世の中の需要で既に成り立っているWEBサイトの交差点は、2chのまとめサイトと結論付けました。

もしかしたら、我々は気づかないうちに、プログラマーが作成した自動化したサイトを毎日見続けているのかもしれませんねw

ちなみに、この話と関連して、PythonからWordPressに投稿するのは過去にやったことあるので、またいつか紹介できたらと思います。

おしまい。

※今回の記事は条件付き。技術革新が速い業界なので、今後の動向を常に追っていく必要があります。