DeepSeekが従来比6分の1の低コストAIを発表。自社の次年度システム開発予算を今日見直す

今日のニュース

DeepSeek、GPT-5.5と同等性能のV4をコスト6分の1で発表 → VentureBeat
OpenAI、複雑タスクの処理速度を向上させた新モデル「GPT-5.5」を公開 → OpenAI Blog
OpenAI、SlackやSalesforceに直接連携する企業向け「Workspace Agents」を発表 → VentureBeat
企業の85%がAIエージェントを試験運用も、本稼働は5%にとどまる実態が明らかに → VentureBeat
はてな、第三者による虚偽の送金指示で約11億円が流出したと公表 → ITmedia NEWS

ピックアップ: DeepSeekが推論コストを6分の1に抑えた新モデルV4を発表。次年度のAI予算計画で選択肢として検討する

直近、GitHub Copilotの定額プランが停止されてAI予算の見直しを迫られた経験をお持ちの方も多いはずだ。その文脈で、今週最も読み解く価値があるニュースを選ぶとすれば、DeepSeek V4の発表になる。

何が起きたか

中国のAI企業DeepSeekが、新モデル「V4」を2026年4月に発表した。最上位の「V4-Pro」で見ると、100万トークンあたりの推論コストは入力1.74ドル・出力3.48ドル。OpenAIのGPT-5.5が入力5.00ドル・出力30.00ドルだから、「100万入力＋100万出力」のタスクに換算すると、GPT-5.5の35.00ドルに対してV4-Proは5.22ドルとなり、約6分の1の水準に収まる。軽量版「V4-Flash」では出力コストが0.28ドルで、GPT-5.5比では100分の1以下という数値だ。性能面でも、OpenAIのGPT-5.5やAnthropicのClaude 4.7 Opusなど米国大手の最新モデルと同等の評価を複数のベンチマークで得ている。

なぜこのニュースが面白いのか。「高機能モデルを使うことのコスト正当性」が、今日を境に問い直されるからだ。

コストが下がった理由

V4の低コストは設計の差から来ている。総パラメータ数は1.6兆と大きいが、実際にトークンごとに動かすパラメータを490億に絞る「MoE 2.0」アーキテクチャを採用している。使わない部分を動かさないから、計算コストが下がる。加えてハイブリッド・アテンション技術により、推論に必要な計算量を前世代比27%削減している。プロンプトキャッシュ機能を組み合わせれば入力コストをさらに最大90%カットできる仕組みも持つ。

ただし、コストが下がってもすべての課題が解決するわけではない。V4の利用はAPIが前提で、自社サーバーへのオンプレミス展開には別途インフラ整備が必要になる。社内データをクラウドAPIに流すことへの社内承認も、中小企業では時間がかかる論点だ。「安い」という事実と「すぐ使える」は、切り分けて考える必要がある。

構造的な変化として見えること

もう一つ、見落とされがちな事実がある。V4はNvidiaのGPUではなく、Huawei製のAscend NPUで稼働している。米国製チップへの依存なしに、GPT-5.5と同等の性能を実現した。単なる価格競争の話ではなく、AIインフラの供給構造が変わりつつあることを示している。

市場データも同じ方向を指している。2025年初頭、企業のAI利用シェアは非公開モデルが約8割を占めていた。それが同年末にはオープンソースモデルが56%と逆転した。DeepSeekの前世代モデルV3も学習コストを550万〜600万ドルに抑え、当時から効率の高さとして注目を集めていた経緯がある。V4はその延長線上にあり、エンタープライズAI市場のコスト感覚を更新するものとみるのが適切だ。

残る論点

ただ、米国のAI企業や研究者からは慎重な見方も出ている。DeepSeekのオープンソース公開が完全なものかという透明性への疑問、および中国政府との関係性という地政学的な側面は、特に海外顧客との取引が絡む企業では無視できない検討事項になる。コストだけを見て選択するのではなく、自社のデータの性質や取引先との契約条件を先に確認することが現実的な順序だろう。

予算判断の問いとして

次年度のAI予算計画を立てている方に一つ問いを置いておきたい。今、自社が高コストな非公開モデルに払っている費用は、V4-Pro水準のコストで代替できる処理をどれだけ含んでいるか。全部を替える必要はないが、タスクごとにモデルを使い分ける選択肢に、今週ようやく現実的な数字がついた。

各ニュース詳細

OpenAIがGPT-5.5を公開、コーディングなど複雑タスクの処理速度を向上

OpenAIは新モデル「GPT-5.5」を公開した。コーディング・データ分析・ドキュメント作成など複雑な作業での処理速度が向上しており、APIでも提供されエンタープライズ向けの活用が想定されている。出典: OpenAI Blog

高度な業務の自動化を試みるうえで処理能力の幅が広がった。一方、日常の定型業務に対しては、コストと性能のバランスを個別に確認することが判断の前提になる。どの業務にGPT-5.5が必要で、どの業務はより軽量なモデルで十分か。その仕分けが、次年度予算の精度を決める。

OpenAIがWorkspace Agentsを発表、SlackやSalesforceへの直接連携が可能に

OpenAIはカスタムGPTの後継となる企業向け「Workspace Agents」を発表した。SlackやSalesforceなど既存の業務システムと直接連携し、AIが社内ワークフロー内で作業を実行できる設計になっている。企業内データのサイロ化を解消し、AIが回答を出すだけでなく処理を完了させる役割を担う。出典: VentureBeat

SlackやCRMをすでに使っている組織であれば、特定の部門から限定的に試す余地は十分にある。

企業AIエージェントの試験導入が85%に達するも、本番稼働は5%にとどまる

調査によると、企業の85%がAIエージェントの試験運用を実施している。信頼性への懸念から、実環境にデプロイできているのは5%のみで、精度の担保と権限管理を含む仕組みへのニーズが高まっている。出典: VentureBeat

試験導入と本稼働の間にある壁は、技術的な問題より権限管理や精度監視の体制が整っていないことに起因するケースが多い。85%が試し、5%が本番に進んでいる。この差を埋めた組織が、次の12ヶ月で実務上の優位を得る。

はてなが虚偽の送金指示により約11億円の流出を公表

はてなは2026年4月24日、第三者からの不正な送金指示によって約11億円の資金が流出したと公表した。ビジネスメール詐欺（BEC）とみられ、取引先を装った虚偽の口座情報への振り込みが行われたとされる。関係当局への通報と被害回復に向けた対応を進めているとしている。出典: ITmedia NEWS

送金の承認フローが1人・1段階で完結する設計になっていないか。11億円という額は規模感として遠く感じるかもしれないが、手口の構造は企業規模を選ばない。外部からの口座変更依頼に対して、電話や対面での二次確認が標準手順として存在するか、今週中に確かめる価値はある。

Java PDF/画像処理ライブラリをお探しですか？ JPedal（PDF描画・変換）・JDeli（画像処理）で高精度な処理を実現詳しくはこちら

今日のニュース#

ピックアップ: DeepSeekが推論コストを6分の1に抑えた新モデルV4を発表。次年度のAI予算計画で選択肢として検討する#

何が起きたか#

コストが下がった理由#

構造的な変化として見えること#

残る論点#

予算判断の問いとして#

各ニュース詳細#

OpenAIがGPT-5.5を公開、コーディングなど複雑タスクの処理速度を向上#

OpenAIがWorkspace Agentsを発表、SlackやSalesforceへの直接連携が可能に#

企業AIエージェントの試験導入が85%に達するも、本番稼働は5%にとどまる#

はてなが虚偽の送金指示により約11億円の流出を公表#