【研究日誌】ニュース処理を分離！GPTとGeminiのマルチLLMで精度向上へ (2025/2/15)

研究日誌

2025.02.16

皆さん、こんにちは！　ブログ記事作成自動化プロジェクト、12日目です。

これまで、Geminiだけでニュースのピックアップから要約までを一度に行っていましたが、処理量が多すぎるため、精度低下が起こることが課題となっていました。そこで今回は、処理を2段階に分割し、複数のLLM（大規模言語モデル）を活用することで、パフォーマンス向上を目指しました！

今回の改良のポイントは、以下の2点です。

具体的には、以下のように役割分担しました。

役割: 信頼性の高いニュース選定
担当LLM: ChatGPT
工夫:
- ChatGPTには、指示通りの確実な動作が求められるニュースのピックアップを任せました。
- インプットトークン数の制限に対応するため、ニュースを5件ずつ分割して繰り返し処理します。
- トークン節約のため、ChatGPTのアウトプットは各ニュースに割り振ったナンバーのみとしました。

役割: 自然で分かりやすい要約
担当LLM: Gemini
工夫:
- 文章表現に優れたGeminiを、ニュースの要約処理に起用しました。
- Geminiはアウトプットトークン数が少ないため、将来的には分割処理も検討が必要ですが、現時点では一括処理でも品質は十分と判断しました。

リンク切れ対策: Custom Search JSON APIで取得したURLのリンク切れチェック処理に不具合がが見つかったため、リンク切れニュースを正しく除去できるよう修正しました。

Custom Search JSON APIがニュースサイトの一覧ページを拾ってしまい、ニュース本文と引用元URLが一致しないという問題が発生しています。これはAPIの仕様上の制約のため、現状では対処が難しい状況です。

さまざまな課題は残っているものの、本日、**念願のマルチLLMによる処理を実現しました！**🎉

これを記念して、ブログのタイトルとアイキャッチ画像もリニューアルしました！

今後は、さらなる精度向上を目指すとともに、他のカテゴリ（PCガジェット系やゲームなど）への展開も視野に入れて、開発を続けていきます。

では、また明日！