文章要約ソフトで遊ぼう | ケアマネくんのブログ

ケアマネくんのブログ

最新でない情報を何となくお送りしたり、人気バラエティ番組をパクってみたり、サッカーの勝敗に一喜一憂したり、クオリティの低い創作物をアップしたりしてます。
ルールはただ一つ。仕事の話はしない(笑)





どんな文章でも3行にできるという ”ELYZA DIGEST”を試してみました。

▮要約AI “ELYZA DIGEST” とは
 “ELYZA DIGEST” は当社が2021年8月26日に一般公開※した、入力したテキストデータを3行に要約するAIです。「生成型」の要約モデルであり、読み込んだテキストを元にAIが一から要約文を生成します。ニュース記事のような誤字脱字の少ない綺麗な文章だけでなく、議事録・対話テキストのような乱雑な文章・文字列であっても対応可能です。テキストの直接入力以外にもURLを張り付けることで該当ページ内の全テキストから要約文を作成できます。
 当AIモデルは、NLP(自然言語処理)の最先端技術を活用し開発され、2021年7月1日より東証一部上場企業であるSOMPOホールディングス株式会社と開始した実証実験※でも利用されています。

下記URLより、登録不要でご利用いただけます。
https://www.digest.elyza.ai/


▮株式会社ELYZAとは
 当社は、AI領域に強みを持つ東京大学・松尾研究室出身のメンバーで創立された会社です。私たちは「未踏の領域であたりまえを創る」をミッションに掲げ、技術領域では自然言語処理・マルチモーダルに、市場領域ではリテールテック、リーガルテックに焦点を当てて研究開発に取り組んでいます。


というわけでね。

東大の松尾研が作ったAIによる長文を要約するソフトになります。

上のURLからページに飛んで登録なしに利用できます。

要約には数秒かかりますが精度は高いと感じました。

議事録や会話形式の文章まで、文章全体を短くまとめてくれます。うん。いやこれ凄いぞ。

逆に短い文章だと受け付けてもらえません。


大学の研究室の研究の一環なので、自分が張り付けたテキストが東大生に見られる可能性があります。

ですんで、個人情報には十分気を付けて利用しましょう。

試しにいくつかやった原文と変換された要約文、俺的に成功か失敗かの結果を乗せときます。

参考にどうぞ。



【メガドラのクソゲー、ソードオブソダンのレビュー】


(原文)

『とにかく操作性が悪い。これに加えて、汚いグラフィックやイヤな方向に力の入った演出、雑魚の波状攻撃や即死トラップを始めとするストレスフルな難度調整など、問題点がこれでもかとばかりに押し寄せる。クリアには並々ならぬ忍耐力が必要である。サターンにデス様が現れるまで、本作は「帝王ソダン」としてセガのクソゲー王座に君臨していた。
ただし、斬りと突きの使い分けや薬の運用方法、敵との間合いの取り方など、我慢して噛んでみればアクションゲームとしての味は出る。その食べ辛さは「スルメ」などという単語ではとても言い表せないものの、単につまらないだけのゲームと本作の格の違いはそこにある。』


(要約)

セガのクソゲー王座に君臨していた「帝王ソダン」を筆者がレビューしている。汚いグラフィックやイヤな方向に力の入った演出など、問題点が押し寄せる。ただ、単につまらないだけのゲームと本作の格の違いはそこにあるという。


(結果)まあまあ成功。

惜しいですね。帝王ソダンのクソゲーっぷりは、その複雑で劣悪な操作性にあるのだが、操作感に慣れるまでプレイし続ける忍耐力があれば、アクションパターンはそれなりに豊富なので単につまらないだけのゲームではない。ということがこの文章の趣旨。肝心なところをすっ飛ばしているので真意が伝わっていない。途中まで良かっただけに残念。

クソほどどうでもいいのですが。




【AKB1/48 アイドルと恋したら… 通常版 - PSP、アマゾンレビュー】

(原文)

初めに言っておくが、僕は多田愛佳ちゃんにしか興味がない。
このゲームも、愛ちゃん目当てで買ったようなものだ。

一通りストーリーを進め、愛ちゃんから告白を受けた。
もちろん受け入れた。幸せだった。

そこで、ふと考えた。
「せっかくだからフってみよう。どうせゲームだし。」
いつも通りストーリーを進め、告白シーンまで至った。

そして、フった。

次の瞬間、画面には悲しむ愛ちゃんの姿があった。
僕は耐え切れなかった。ソッコーでPSPの電源を落とし、布団に入り、枕に顔をうずめ、無我夢中で奇声を上げた。
気づいたら夢の中だった。そこには愛ちゃんがいた。
夢の中の愛ちゃんは泣いていた。僕は、「ごめんね、ごめんね」と何度も謝った。
それでも愛ちゃんの笑顔は戻らなかった。

目を覚ますと、寝汗をびっしょりかいていた。
窓を開けた。季節はすっかり冬だ。
冷たい風が、僕の頬を一発なぐった。


(要約)

多田愛佳が、ゲームで告白されたことを告白した。無我夢中で奇声を上げたが、夢の中の愛ちゃんは泣いていた。僕は「ごめんね、ごめんね」と何度も謝った。


(結果)意味不

原文も要約もまるで意味が分からんが、原文のキモさが要約文からも滲み出ているのでヨシ!

要約としては完全に失敗しとるが、キモさを損なわなかったので取りあえず成功とする。原文全部読んだ人はいないだろう。俺も読んでない。



【一般人の認識(2ちゃんコピペ)】

(原文)

■一般人の認識

ガンダム:安室とシャーがたたかう話
エヴァ:パチンコ、あやなみが可愛い
マクロス:歌う
ギアス:何それ
ボトムズ:アストラギウス銀河を二分するギルガメスとバララントの陣営は互いに軍を形成し、
もはや開戦の理由など誰もわからなくなった銀河規模の戦争を100年間継続していた。
その“百年戦争”の末期、ギルガメス軍の一兵士だった主人公「キリコ・キュービィー」は、味方の基地を強襲するという不可解な作戦に参加させられる。
作戦中、キリコは「素体」と呼ばれるギルガメス軍最高機密を目にしたため軍から追われる身となり、町から町へ、星から星へと幾多の「戦場」を放浪する。
その逃走と戦いの中で、陰謀の闇を突きとめ、やがては自身の出生に関わる更なる謎の核心に迫っていく。


(要約)

銀河を二分する銀河規模の戦争を100年間継続していた。銀河を二分する銀河規模の戦争を100年間継続していた。銀河規模の戦争を100年間継続していた。


(結果)バッグった

大事なことなので。

一見バグってるように見えますが・・・

原文は、ぞんざいなガンダムやマクロスの知識と違い、ボトムズだけ詳細に語るところが一般人とかけ離れていて面白い。というコピペ。

それを同じ文章を3回繰り返すことで端的に表している。

・・・やっぱバグっとるだけやなこれ。



【進次郎構文、のどぐろ編】


(原文)

記者:
処理水の海洋放出に関して、国際社会に恐怖感を与えると(韓国が)懸念を示されました。かなり、この被災地に対する風評被害を助長することになりかねないなと私は思いますけども、そこに対して、大臣の受け止めをお願いします。

小泉環境相:
(中略)この前、私は小名浜で地元の組合長とお会いをしましたが、「今、試験操業で何が獲れますか」と言ったら「最近、のどぐろが獲れるんだ」と。「あー、福島、のどぐろ獲れるんですか、私のどぐろ大好きなんですよ!」って言って、「じゃあ、今度一緒に食べよう!」って「環境大臣室にぜひお越しください」と、「一緒にのどぐろ食べましょうよー」って言った時の、あのねー、「いいんですか!?」っていうね、喜んだ顔! 嬉しかったですねぇー。なので決してそういった皆さんが再び傷つけられるような事があってはならないと。その思いでこういった問題にもしっかりと向き合っていきたいと思います。


(要約)

小泉環境相が、処理水の海洋放出に関して、韓国が懸念を示した。小名浜で地元の組合長と会った際、のどぐろが獲れると発言。環境大臣室に「一緒にのどぐろ食べましょうよー」と言ったら、喜んだ顔だった。


何か面白味に欠けると思ったら、記者の反応が抜けてましたね。

原文に『記者:のどぐろの話はしていない』を追加して再要約する。


(要約2)

小泉環境相が、処理水の海洋放出に関して、韓国が懸念を示した。この被災地に対する風評被害を助長することになりかねないと指摘。環境相は、被災地に対する風評被害を助長することになりかねないと述べた。


(結果)

一つ目のは和やかだったのに、記者にちょっと怒ってる雰囲気を持たせたら空気読んだぞこのAI!?

冗長だったのどぐろが全カットされて綺麗な進次郎構文になっているのがポイント高い。




【DQN語の会話(2ちゃんコピペ)】

(原文)

客「コレ、オネチィース」
店「チス、コレッスネ、ウィッス」
客「ウィ」
店「……」ピッピ
客「オウェ!?ウェウェウェ、ウィウィウィ」タタタッ
店「?」
客「コレモ、シャス」
店「ウスウス、オケス」
客「サイセン」
店「イェイェ、ゼンゼ、ジョブッスシ、イースイース」ピッ
客「ウィァ…」
店「ィー…コチャーノコノミャキ、アタタッスカ?」
客「ソッスネ、チンシテッサイ」
店「ワカリャッシタ、アタタッス」バタン
客「…ノウェ」
店「ィェアーット、ゴテンデ、ケーサーゼーニナリャッス」
客「サゼッスカ、ンジャゴセッデッ」
店「ア、ウェイウェイウェイ、マチァッシタ、サンゼッハピーイェンッス、シャイセン」
客「イッスイッス、ゴセッドゾ」
店「ゴセッカラディ-…セーニャッエンノカーシッス」
客「ウィ」パーン!
店客「ウェア!?」
店「…アチー、マーネズワスッタ、ハレッシチィシタカラ、カエテキャッス」
客「ア、イスイス、ジョブッス」
店「シャセンッシタ、アザス」
客「ウェイ」ピロリンピロリン、ガー
店「ザッシター」
客「ア、シートワスッタ、シット!」


(要約)

イタリアのレストランで、人気な料理が味わえる。店主は、その店を「オネチィース」と名付けている。店主は、店主の「オネチィース」を「チス、コレッスネ、ウィッス」と名付けている。


(結果)

捏造すんな(笑)
DQN語をAIはイタリア語と判断したようです。
パッと見文字化けにしか見えないけど、声に出して読むとなんとなく理解できてしまう。
botかどうか見分ける画像やアルファベットの認証あるじゃないですか。そんな感じ。




【うまぴょい伝説(歌詞)】

(原文)

うーーーー(うまだっち)
うーーー(うまぴょい うまぴょい)
うーー(すきだっち) うーー(うまぽい)
うまうまうみゃうにゃ 3 2 1 Fight!!

おひさまぱっぱか快晴レース(はいっ)
ちょこちょこなにげに(そーわっ So What)
第一第二第三しーごー(だんだんだんだん出番が近づき)
めんたまギラギラ出走でーす(はいっ)
今日もめちゃめちゃはちゃめちゃだっ(ちゃー!)
がち追い込み(糖質カット)
コメくいてー(でもやせたーい!)
あのこは(ワッフォー)そのこは(ベイゴー)
どいつもこいつも あらら(リバンドー)
泣かないで(はいっ)拭くんじゃねー(おいっ)
あかちん塗っても(なおらないっ)(はーっ?)


(要約)

おひさまぱっぱか快晴レースを、紹介している。意外と出番が近づき、めんたまギラギラ出走でーす。がち追い込み、コメくいてー、あのこはベイゴー、泣かないで拭くんじゃねー。


(結果)

諦めんな!諦めんなよ!!




【デスクリムゾン プロローグ】

(原文)

プロローグ
それは十年前の事であった…。

傭兵・越前康介(コードネーム:コンバット越前)は戦場を脱出するため、戦友のダニーやグレッグと共に激戦区を彷徨っていた。
その時、3人は偶然にも三つの扉を持つ奇妙な遺跡を発見し、とにかく入ってみる。
せっかくだから3人が扉の奥を調査すると、それぞれ宝石・古文書、そして謎の銃(クリムゾン)が見つかった。
3人は手に入れた力と知恵と資金で辛くも帰国へと成功する。
十年後の現在。
ヨーロッパを謎の伝染病「KOT症候群」が覆う。
傭兵を引退し医師となっていた越前であったが、過去の記憶に突き動かされ、解決のために「クリムゾン」を手に取る。
しかし今、デスビスノスの放ったモンスターがクリムゾンを取り返すべく越前に襲いかかるのであった。


(要約)

傭兵・越前康介が、十年前の出来事を振り返っている。戦場を脱出するため、戦友のダニーやグレッグと共に激戦区を彷徨っていた。偶然にも三つの扉を持つ奇妙な遺跡を発見し、とにかく入ってみる。


(結果)成功

これは有能。内容はともかく日本語の体裁を保っていればちゃんと要約してくれる。『せっかくだから』の一言が入っていたら完璧だった。



こんなもんでいいか。

文章を要約するにはその文章の骨子、趣旨、結論を文章内から読み解き、ポイントを的確に絞らないといけません。筆者の意図を正確に読み解かないと、言いたかったことは伝わりません。

このソフトは日本語の体裁が取れている文章は割ときれいにまとめてくれます。

一方で、キツいネットスラングや一部界隈でしか通じないネタ、既に死語となったネット用語は理解できないようです。

そこはやはり人間の力がまだ要りそうです。

しかし冷静に考えてみると、そもそもそんな死語を要約する必要性がないのでやはり人の手は必要ないのでは・・・。

ゆくゆくはAIが人の仕事を奪う時代が来るそうですが、隠された筆者の意図を読み解く力は人間の方が優れていると思いたい。

一昔前はこういう曖昧な表現や大雑把な機能を持たせた家電をファジーと呼んでいましたが、ブームの終焉と共に死語となってしまいました。

ファジーの曖昧さもひっくるめてAIと呼ばれるようになったのでしょう。

技術の進歩って凄い(小並感)