【研究日誌】ニュース処理を分離!GPTとGeminiのマルチLLMで精度向上へ (2025/2/15)

研究日誌

皆さん、こんにちは! ブログ記事作成自動化プロジェクト、12日目です。

これまで、Geminiだけでニュースのピックアップから要約までを一度に行っていましたが、処理量が多すぎるため、精度低下が起こることが課題となっていました。そこで今回は、処理を2段階に分割し、複数のLLM(大規模言語モデル)を活用することで、パフォーマンス向上を目指しました!

✨ 処理の分離とマルチLLM化

今回の改良のポイントは、以下の2点です。

  1. 処理の分離: ニュースの「ピックアップ」と「要約」を別のLLMに担当させます。
  2. マルチLLM化: 各処理に最適なLLMを選択し、それぞれの強みを活かします。

具体的には、以下のように役割分担しました。

📰 ニュースのピックアップ:ChatGPTにお任せ

  • 役割: 信頼性の高いニュース選定
  • 担当LLM: ChatGPT
  • 工夫:
    • ChatGPTには、指示通りの確実な動作が求められるニュースのピックアップを任せました。
    • インプットトークン数の制限に対応するため、ニュースを5件ずつ分割して繰り返し処理します。
    • トークン節約のため、ChatGPTのアウトプットは各ニュースに割り振ったナンバーのみとしました。

📝 ニュースの要約:Geminiの強みを活用

  • 役割: 自然で分かりやすい要約
  • 担当LLM: Gemini
  • 工夫:
    • 文章表現に優れたGeminiを、ニュースの要約処理に起用しました。
    • Geminiはアウトプットトークン数が少ないため、将来的には分割処理も検討が必要ですが、現時点では一括処理でも品質は十分と判断しました。

🛠️ その他の改良点

  • リンク切れ対策: Custom Search JSON APIで取得したURLのリンク切れチェック処理に不具合がが見つかったため、リンク切れニュースを正しく除去できるよう修正しました。

💡 新たな課題: (今後の宿題)

  • Custom Search JSON APIがニュースサイトの一覧ページを拾ってしまい、ニュース本文と引用元URLが一致しないという問題が発生しています。これはAPIの仕様上の制約のため、現状では対処が難しい状況です。

🚀 結果と今後の展望

さまざまな課題は残っているものの、本日、**念願のマルチLLMによる処理を実現しました!**🎉

これを記念して、ブログのタイトルとアイキャッチ画像もリニューアルしました!

今後は、さらなる精度向上を目指すとともに、他のカテゴリ(PCガジェット系やゲームなど)への展開も視野に入れて、開発を続けていきます。

では、また明日!

コメント

タイトルとURLをコピーしました