皆さん、こんにちは! ブログ記事作成自動化プロジェクト、12日目です。
これまで、Geminiだけでニュースのピックアップから要約までを一度に行っていましたが、処理量が多すぎるため、精度低下が起こることが課題となっていました。そこで今回は、処理を2段階に分割し、複数のLLM(大規模言語モデル)を活用することで、パフォーマンス向上を目指しました!
✨ 処理の分離とマルチLLM化
今回の改良のポイントは、以下の2点です。
- 処理の分離: ニュースの「ピックアップ」と「要約」を別のLLMに担当させます。
- マルチLLM化: 各処理に最適なLLMを選択し、それぞれの強みを活かします。
具体的には、以下のように役割分担しました。
📰 ニュースのピックアップ:ChatGPTにお任せ
- 役割: 信頼性の高いニュース選定
- 担当LLM: ChatGPT
- 工夫:
- ChatGPTには、指示通りの確実な動作が求められるニュースのピックアップを任せました。
- インプットトークン数の制限に対応するため、ニュースを5件ずつ分割して繰り返し処理します。
- トークン節約のため、ChatGPTのアウトプットは各ニュースに割り振ったナンバーのみとしました。
📝 ニュースの要約:Geminiの強みを活用
- 役割: 自然で分かりやすい要約
- 担当LLM: Gemini
- 工夫:
- 文章表現に優れたGeminiを、ニュースの要約処理に起用しました。
- Geminiはアウトプットトークン数が少ないため、将来的には分割処理も検討が必要ですが、現時点では一括処理でも品質は十分と判断しました。
🛠️ その他の改良点
- リンク切れ対策: Custom Search JSON APIで取得したURLのリンク切れチェック処理に不具合がが見つかったため、リンク切れニュースを正しく除去できるよう修正しました。
💡 新たな課題: (今後の宿題)
- Custom Search JSON APIがニュースサイトの一覧ページを拾ってしまい、ニュース本文と引用元URLが一致しないという問題が発生しています。これはAPIの仕様上の制約のため、現状では対処が難しい状況です。
🚀 結果と今後の展望
さまざまな課題は残っているものの、本日、**念願のマルチLLMによる処理を実現しました!**🎉
これを記念して、ブログのタイトルとアイキャッチ画像もリニューアルしました!
今後は、さらなる精度向上を目指すとともに、他のカテゴリ(PCガジェット系やゲームなど)への展開も視野に入れて、開発を続けていきます。
では、また明日!
コメント