Xでニュースの見出しが短歌になっているツッコミが結構面白かった。

https://mainichi.jp/articles/20251107/k00/00m/040/156000c

 

 他に無いかAIに聞いてみたが、外部のデータにはアクセスできないようで、ウェブスクレイピングのプログラムを例示された。

ウェブスクレイピングというのはインターネット上のホームページの情報を収集する行為になる。プログラムを例示するから自分で収集してくれということらしい。

 

 回答でもう一つ気になったのは「モーラ」という単語だった。

音数をカウントするために使用する単位で、5-7-5-7-7の31音を31モーラと表す。「きゃ」など小さい「ゃ」や「っ」などを前の字(母音)と合わせて1モーラとして数える。

 

 話を戻すとAI(今回使用しているRakutenAI)は現在のインターネットから調査することはできない。このようなAIにとっての外部のデータベースをRAGという。RAGは「Retrieval-Augmented Generation」(リトリーバル・オーグメンテッド・ジェネレーション) の略である。

 

 仕事でRAGに社内のドキュメントを指定して、AIで調べ物とかできれば良いのだけど、外部に漏れるなどの問題がある。今回の調査もAIが新聞の著作権を侵害することになるので今のところはできない。

 

 今後は新聞社などが自社の記事からAIを使用して調査を行えるようにするなどのサービスが出てくるかもしれない。