最新ニュース
OpenAIが最新の高性能AIモデル「o1-pro」をAPIで提供開始
OpenAIは、最新の高性能AIモデル「o1-pro」をAPIを通じて提供開始しました。この「o1-pro」は、既存モデル「o1」よりも多くの計算資源を投入することで、より高品質で安定した応答を実現しています。主な機能として、画像入力(Vision)、関数呼び出し(Function Calling)、構造化出力(Structured Output)、Responses API、Batch APIが搭載されています。ただし、利用可能な開発者はTier1~5に限定されており、利用料金も入力トークン100万件あたり150ドル、出力トークン100万件あたり600ドルと、上位層向けの価格設定となっています。AI技術の進化を加速させる「o1-pro」の登場は、今後のAI開発に大きな影響を与えることが予想されます。
引用元:BizTechDX

Sesame AI、文脈理解型の次世代音声生成AI「CSM-1B」を発表
Sesame AIが、文脈を考慮した音声生成が可能な新しいAI音声モデル「CSM-1B」を2025年2月27日に発表しました。従来の音声合成の課題であった、文脈に合わせた自然な会話や感情表現の欠如を克服し、より人間らしいインタラクションを実現することを目指しています。「CSM-1B」は、テキストまたは音声入力からRVQオーディオコードを生成し、声のトーン、ピッチ、リズム、間を活用することで、まるで人間が話しているかのような自然な音声生成を可能にします。特定の声に特化したチューニングは行われておらず、多様な音声を生成できる点も特徴です。ライセンスはApache 2.0で、基本的には改変、再配布、商用利用が可能です。Hugging Faceで公開されており、Google Colaboratoryで利用できます。対応言語は英語がメインですが、日本語の音声合成も可能です。
引用元:weel.co.jp

OpenAIが次世代音声モデル3種を発表!高精度な音声認識と感情表現に対応
OpenAIは、次世代音声AIモデルとして「gpt-4o-transcribe」「gpt-4o-mini-transcribe」(音声認識)と「gpt-4o-mini-tts」(音声合成)の3種類を発表しました。これらのモデルはAPI経由で全世界の開発者に提供されており、すでに活用が始まっています。音声認識モデルは、従来モデル「Whisper」を大幅に上回る精度を実現。多言語ベンチマーク「FLEURS」で低い単語誤り率(WER)を記録し、騒音環境下や多様な話速、アクセントにも対応します。音声合成モデル「gpt-4o-mini-tts」は、テキストに加え「どのように話すか」の指示が可能。感情や文脈に応じた音声生成は、ストーリーテリングや教育分野での活用が見込まれます。
引用元:miralab.co.jp

スペースシフトらが気象連動型AI衛星タスキングシステムの実証実験に成功
スペースシフト、ハレックス、Tellusは2025年3月21日、気象情報と連動した生成AI衛星自動タスキングシステムの実証実験に世界で初めて成功したと発表しました。このシステムは、災害発生時の状況把握を迅速化することを目的としています。タスキングとは、特定のタイミングで特定の場所を観測するために衛星に指示を出すプロセスです。洪水や地震などの大規模災害時には、正確かつ迅速な情報収集が不可欠となります。今回のシステムは、気象警報アラートを基にAIが自動で観測エリアを決定し、Tellusのオンデマンドタスキングシステムを通じて最適な衛星を選定、観測を指示するものです。実証実験では、2025年1月から2月にかけて、積雪に関する気象警報アラートをトリガーに、ASNARO-1による富士山地域の撮影や、アクセルスペースのGRUSによる日本各地の撮影に成功しました。今後は、防災・減災分野での実用化に向けて、観測対象地域の拡大やAI解析技術の高度化、気象情報以外のトリガー情報の活用が進められるとのことです。
引用元:sorabatake.jp

LINEヤフー、生成AIによる購入日提案機能を発表 最大取扱高は111%増
LINEヤフーが運営する「Yahoo!ショッピング」は、2025年2月から生成AIを活用した購入日提案機能のβ版を提供しています。この機能は、過去7日間のデータに基づき、ユーザーにとって最もお得な購入日を提案するもので、利用者の購買意欲を高める効果が期待されています。特に注目すべきは、この機能を活用したユーザーの単日取扱高が、利用していないユーザーと比較して最大111%増加したというデータです。ユーザーは、商品詳細ページに設置された専用ボタンをタップするだけで、AIが推奨する最適な購入日を知ることができます。
引用元:www.commercepick.com

Gemini 2.0 Flash、画像のウォーターマーク除去機能で物議、著作権侵害の懸念も
Googleの最新AIモデル「Gemini 2.0 Flash」に搭載された画像生成機能が、透かし(ウォーターマーク)の除去に利用されていることが判明し、議論を呼んでいます。SNS上では、Getty Imagesなどのストックメディアが提供する著作権付き画像から透かしを削除できることが確認されており、著作権侵害のリスクが懸念されています。Gemini 2.0 Flashは、画像生成機能の拡張により、AIがネイティブに画像の生成と編集を行うことが可能になりました。しかし、透かし削除によって生じた空白部分を自然に補完する高度な機能が、悪用される可能性を指摘されています。Googleは、生成AIツールを著作権侵害目的で使用することを利用規約で禁じており、今後、透かし削除機能に対する制限を追加する可能性を示唆しています。
引用元:topics.smt.docomo.ne.jp

ニッセイアセットマネジメントが機械学習を用いたシクリカル株投資(後編)を解説
ニッセイアセットマネジメントは、AI(人工知能)と機械学習を活用した新たな投資戦略「クオンツトピックス」を発表しました。今回は、シクリカル株投資に着目し、特に景気変動の影響を受けやすい機械セクターを対象とした投資手法を解説しています。記事では、工作機械の受注動向に着目し、過去のデータと類似した局面をAIで特定。その上で、個別銘柄の株価が同様のパターンで動くものを抽出し、期待リターンの高い銘柄を選定する独自の手法を紹介しています。従来の株価情報のみを用いたモデルと比較して、工作機械受注データを取り入れることで、より精度の高い銘柄選択が可能となり、高い投資成果に繋がるとしています。
引用元:www.nam.co.jp

プレスリリース
アニメ生成AIのGAZAIがお花見アニメ祭りコンテストを3月21日より開催!
生成AIプラットフォーム「GAZAI」を運営する株式会社GAZAIは、2025年3月21日(金)11時より、春のお花見をテーマにしたアニメ祭りコンテストを開催します。コンテストでは、GAZAIのAI機能を活用して生成されたアニメ、動画、マンガ、画像作品を募集。応募作品は、X(旧Twitter)での「いいね」数とGAZAIサービス内での「いいね」数の合計で順位が決定され、上位入賞者にはAmazonギフト券が贈られます。GAZAIでは、毎日ログインすることでデイリーコインが配布され、AI機能を利用できます。お花見をテーマにした作品例として、桜吹雪の中でのピクニック、花見団子を食べるキャラクター、春の花と動物の触れ合い、お花見宴会の楽しいシーンなどが挙げられています。
引用元:roppongi.keizai.biz

オラクル、企業向けのAIエージェント開発プラットフォーム「Oracle AI Agent Studio」を発表
オラクルは、企業向けのAIエージェント開発プラットフォーム「Oracle AI Agent Studio」を発表しました。「Oracle Fusion Applications」の顧客とパートナーは、このプラットフォームを利用して、カスタマイズされたAIエージェントを容易に作成、拡張、デプロイ、管理できます。「Oracle AI Agent Studio」は、オラクルがこれまで培ってきたAIエージェント開発技術を基盤としており、ユーザーは既存のエージェントを拡張したり、新しいエージェントを開発したりすることが可能です。開発したAIエージェントは、「Oracle Fusion Applications」とシームレスに統合でき、サードパーティのエージェントとの連携もサポートしています。高度なテストやセキュリティ機能も備えており、安心してAIエージェントの開発・運用管理が行えます。
引用元:Oracle 日本

スペースシフト、気象情報と生成 AI を活用した衛星データ取得に成功
株式会社スペースシフトは、株式会社ハレックス、株式会社Tellusと共同で、気象情報をトリガーとした生成AIによる衛星タスキングシステムの実証実験に成功しました。このシステムは、気象情報と連動した生成AI衛星自動タスキングシステムとして世界初となります。実証実験では、ハレックスが提供する積雪に関する気象警報アラート情報を基に、スペースシフトが開発した生成AIアルゴリズムが自動的にAOI(関心領域)を決定。Tellusのオンデマンドタスキングシステムを通じて、衛星への撮影要求を半自動で行うことに成功しました。1月にはパスコ社のASNAROによる富士山地域、2月にはAxelspace社GRUSによる北海道根室市風蓮湖付近の撮影に成功しました。
引用元:www.jomo-news.co.jp

利活用系記事
生成AIアプリ「MIZ-GPT」開発でエスタイルと連携、内製化を推進
ミツカングループは、社員の業務効率向上を目指し、生成AIアプリ「MIZ-GPT」を開発。その開発パートナーとして、エスタイルを選定し、技術提供を受けて内製化を推進しています。外部の生成AIツールでは高額かつ柔軟性に欠けるという課題に対し、エスタイルは豊富な事例と内製支援へのコミットメント、安全性と独自性を重視したアプローチが評価されました。特に、伊藤忠商事の事例や、ミツカンのニーズに寄り添った柔軟な提案が決め手となり、技術チームからの強い支持を得ました。今後は、MIZ-GPTの継続的なアップデートを進め、ChatGPTの進化に追随する形で機能を拡充するだけでなく、部署独自の機能を取り入れることで、より高いカスタマイズ性と実用性を追求していく方針です。
引用元:estyle.co.jp

【授業実践】生成AIで学級の歌をつくろう!
東京都西東京市立上向台小学校で、小学5年生を対象に生成AIを活用した「学級の歌」を作る出前授業が行われました。児童たちはクラスの特徴を話し合い、キーワードを生成AIに入力して歌詞を作成。さらに、音楽生成AIで作曲も行い、短時間でオリジナルソングを完成させました。この授業は、文部科学省のガイドラインに沿って設計され、デジタルを活用した学びの研究校である上向台小学校の取り組みの一環として実施されました。授業では、ChatGPTの利用制限など、AI利用における注意点も説明。児童からは「AIが短い時間で作詞・作曲できるのが面白い」といった声が上がりました。
引用元:view-next.benesse.jp

ASCII.jpがGoogle Gemini 2.0 Flash Experimentalの画像生成について解説
グーグルが最新の大規模言語モデル「Gemini 2.0 Flash Experimental」の画像生成・編集機能を開発者向けに無料公開しました。従来の画像生成AIとは異なり、テキスト生成と画像生成を単一モデルで実行できる点が大きな特徴です。これにより、視点変更やキャラクターの一貫性維持、高精度なテキスト描画など、従来のAIが苦手としていた作業が可能になっています。特に、これまで画像生成AIを利用してきたユーザーほど、その進化を実感できるでしょう。
引用元:ascii.jp

コメント