Latest AI & Business News
Stay updated with the latest insights in AI and business, delivered directly to you.
-
A New Study by OpenAI Explores How Users’ Names can Impact ChatGPT’s Responses
Bias in AI-powered systems like chatbots remains a persistent challenge, particularly as these models become more integrated into our daily lives. A pressing issue concerns biases that can manifest when chatbots respond differently to users based on name-related demographic indicators, such as gender or race. Such biases can undermine trust, especially in name-sensitive contexts where…
-
Google AI Introduces Gemma-APS: A Collection of Gemma Models for Text-to-Propositions Segmentation
The increasing reliance on machine learning models for processing human language comes with several hurdles, such as accurately understanding complex sentences, segmenting content into comprehensible parts, and capturing the contextual nuances present in multiple domains. In this landscape, the demand for models capable of breaking down intricate pieces of text into manageable, proposition-level components has…
-
Arch-Function LLMs promise lightning-fast agentic AI for complex enterprise workflows
Katanemo’s new Arch-Function LLMs promise 12x faster function-calling capabilities, empowering enterprises to build ultra-fast, cost-effective agentic AI applications.Read More
-
Anyone Can Turn You Into an AI Chatbot. There’s Little You Can Do to Stop Them
Character.AI lets users create bots in the likeness of any person—without requiring their consent.
-
IT部門、データセンターの持続可能性にさらなる責任を担う
最先端のサーバーチップは、そのパフォーマンス向上の可能性で注目を集めていますが、次世代プロセッサは旧来の設計よりも動作温度が高くなるため、データセンター事業者は、チップメーカーからの限られたガイダンスの中で何をすべきかを見極めるのに苦労するでしょう。 それと同時に、エネルギー効率化の取り組みにおいてIT機器が果たす役割に対しても、厳しい目が向けられることになります。これらの相互に関連するトレンドは、Uptime Instituteが今年のデータセンターについて予測する上位に挙げているものの一つです。 「事業者は、高温になる新しいサーバーチップに苦戦することになるでしょう」とUptimeのリサーチアナリストのジャクリーン・デイビス氏は同機関の2023年データセンター予測に関するウェブ会議で述べています。その一方で、「エネルギー効率の焦点が拡大し、IT機器そのものも含まれるようになるでしょう。これは遅すぎるくらいだと考えています」とも語っています。 上昇するサーバーの発熱量 現在建設されているデータセンターは、経済的競争力と技術的能力を10年~15年は維持する必要がありますが、新しいチップ技術によって、事業者は従来のデータセンター設計ガイドラインに疑問を呈するようになっています。 「データセンターの設計は、サーバーの電力と冷却の要件に対応しなければなりませんが、長い間、これらは一貫していました。設計者は、1ラックあたり4~6キロワットで計画することができました。ITのリフレッシュを繰り返しても、電源や冷却のインフラストラクチャをアップグレードする必要はありませんでした」とUptimeのリサーチディレクターであるダニエル・ビゾ氏は言います。 今、それが変わりつつあります。1ラックあたり、1サーバーシャーシあたりの電力密度はますます高まっています。例えば、インテルの第4世代Xeonスケーラブル・プロセッサ(コードネーム:Sapphire Rapids)の熱設計消費電力(TDP)は最大350ワット、AMDの第4世代Epycプロセッサ(コードネーム:Genoa)のTDPは最大360ワットあります。 「今後の製品ロードマップでは、今後たった数年のうちに、TDPが500~600ワットのサーバープロセッサが主流になる予定です。したがって、この傾向は、主流のサーバーが1台あたり1キロワットに近づいたり超えたりするにつれて、設備設計の前提を揺るがし始めることになります」とビゾ氏は言います。 すでに、GPUをベースにした特殊なハイパフォーマンス・コンピューティング(HPC)システムでは、ピーク電力でチップあたり数百ワットを必要とすることもあります。これらのシステムは、熱出力が高いだけでなく、温度限界も低くなっています。 「より多くの熱電力を生産するため、冷却システムには事実上二重の負担がかかります。そしてその多くは、より低い動作温度を必要とします」とビゾ氏は説明します。低温に到達させるために大量の熱を除去することは技術的に困難であり、そのため運用担当者はこれまでとは違った方法で冷却に取り組まなければならなくなる、と同氏は言います。例えば、データセンター事業者の中には直接液体冷却への対応を検討するところも出てくるでしょう。 ニッチなHPCアプリケーションがもたらした設計上のジレンマは、高TDPプロセッサがエンタープライズサーバーの主流市場にもたらす電力消費と冷却の課題に対する早期警告と考えることができます。「これは今はある程度推測するしかありません。一般的なITラックの電力はどうなるのでしょうか?高密度ラックはどこまで威力を発揮するようになるのでしょうか?今後10年間、データセンターはどのような冷却モードに対応する必要があるのでしょうか?」とビゾ氏は問いかけます。 低密度のラック設計を続けるという保守的なアプローチも考えられますが、それではデータセンターが制限されすぎたり、時代遅れになったりする危険性があります。しかし、ラックの高密度化を求めるような、より積極的な設計アプローチは、十分に活用されていない容量や能力に過剰な出費をするリスクを高める、とビゾ氏は警告します。 「事業者は、新世代のIT技術を扱う上で、さまざまな選択を迫られることになるでしょう。空気温度を制限し、効率の低下を受け入れるのもよいでしょうし、あるいは、(米国の業界団体である)ASHRAEがクラスH1(熱基準)で推奨しているように、こうした温度制限のあるITシステム専用の環境を構築することで、設備効率への打撃を最小限に抑えるのもよいでしょう。あるいは、直接液冷への転換を促進することもできます。ここでは半導体の物理学が物理的な原動力となっていますが、インフラストラクチャの経済がデータセンターの設計と運用を形作ることになります。また、チップメーカーからのガイダンスもほとんどないため、適応力がカギとなるでしょう」とビゾ氏は言います。 エネルギー効率化の焦点はITに移行 より高いIT効率を実現するための企業やデータセンター事業者に対するプレッシャーは高まり続けるだろう、とUptimeは予測しています。 これまではその責任は施設側にありました。持続可能性と効率性の要求の矢面に立たされたデータセンター事業者は、過去15年ほどの間に電力使用効率(PUE)を大幅に向上させた、とビゾ氏は説明します(PUEは、データセンター全体が使用するエネルギーに対するIT機器が使用するエネルギーの比率を測定します)。空気分離、より柔軟な温度許容値、冷却、ファン、配電の厳格な制御、再生可能電源の使用などの取り組みを通じて、施設の資源の使用効率は大幅に向上しています。 「データセンター事業者は、持続可能性に向けてかなり多くの取り組みを行っています。その一方で、IT部門は概してこうした議論から遠ざかっています。これではますます立ち行かなくなります。なぜなら、単純に、効率化向上という点で残されたものは、ITのエネルギーパフォーマンスに隠されているからです」とビゾ氏は指摘します。 Uptimeによると、次の4つの主要分野でプレッシャーが高まっています。 新しい大規模データセンターに対する自治体の抵抗:2019年以降、電力と土地の確保をめぐる懸念から、データセンターの新規建設に対する規制が強まっており、今後も強まる可能性が高くなっています。例えば、ドイツ・フランクフルトでは、土地利用の拡大や街の景観の変化を懸念して、クラウドやコロケーションの新設は特定のゾーンに制限されています。 増加するデータセンターの容量をサポートするために利用可能な送電網の制限:Uptimeは、アイルランド・ダブリンと米国バージニア州北部の2つの地域を挙げ、送電網がひっ迫し、電力会社が発電または送電容量の不足のために新規接続を一時停止または制限していると説明しています。 持続可能性と炭素排出削減に関する規制の強化、および報告要件の厳格化:欧州連合(EU)では、データセンターは新たにより詳細なエネルギー消費量報告要件に直面しており、例えば、エネルギーパフォーマンス指標を公開する必要があります。Uptimeによると、同様の取り組みが米国でも始まっています。 高いエネルギーコスト:エネルギー価格、ひいては電力価格は、ロシアのウクライナ侵攻以前から上昇基調にありました。2021年の欧米市場では、すでに電力先渡価格が高騰していました。電力コストは上昇の一途をたどっており、変動しやすい環境が作り出されています。 エネルギー価格の高騰、炭素報告、送電網の容量不足への対応は、常に施設運営者の領域でした。しかし、Uptimeによれば、施設側の見返りが少なくなってきており、大規模な介入がもたらすメリットはますます少なくなっています。対照的に、IT部門は、データセンターのエネルギー性能を向上させるべく熟しており、サーバー・ハードウェアの分野ではそれが特に顕著です。 未使用で非効率なサーバー・ハードウェアは、IT部門がエネルギーパフォーマンスを改善できる重要な分野の一つです。例えば、より高い性能指標を持つサーバーをより少数にすることで、エネルギー効率を向上させることができます。IT部門は、より適切なハードウェア構成を選択し、動的なワークロード統合を行うことができる、とビゾ氏は指摘します。省エネルギー状態やパワースロットル機能などの電源管理機能も、エネルギー効率を大きく向上させる可能性があります。 エネルギー効率の向上を実現するために、ITインフラストラクチャをより最適に設計する必要性は、今後ますます高まるでしょう。ITによって節約されたワットごとに、他の場所へのプレッシャーが軽減され、報告要件によって、ITインフラに隠されたエネルギー効率向上の可能性がすぐに明らかになる、とUptimeは主張します。 「ITのインフラストラクチャおよび運用チームは、サーバーインフラの典型的な利用率を向上させるために、できることはすべてやっていることを示すことが、かなり近いうちに求められるでしょう」とビゾ氏は言います。 地政学的状況、クラウド、データセンターの費用 概括すると、Uptimeが発表した2023年の予測のうち2つは、IT部門がサーバー・ハードウェアにより注意を払うようになる、つまり、より高性能のサーバープロセッサーが市場に出回るにつれて電力需要が高まる、そして、エネルギー効率への期待が設備部門だけでなくIT部門にも及ぶようになる、ということです。 2023年のUptimeの5つのデータセンター予測のまとめ: 地政学的問題は今後もサプライチェーンへの不安を深める:Uptimeは、サプライチェーンの途絶リスクを高めている米国主導の西側同盟、中国、ロシア間の政治的緊張を挙げています。半導体のサプライチェーンと海底ケーブルシステムは、潜在的な経済的・軍事的対立の影響を特に受けやすい、と同機関は予測します。 クラウドへの移行は、より大きな精査を受けることになる:経済の緊張と不確実性の時代には、移行コストとクラウド費用の高騰の脅威が、一部のミッションクリティカルな移行を遅らせたり、抑止したりするだろう、とUptimeは予測しています。 データセンターのコストは上昇する見込み:ITおよびデータセンターの設備コストは、近年減少傾向でした。このトレンドは終わりを告げ、価格は上昇するとUptimeは予測します。サプライチェーンの問題、エネルギー価格の上昇、人件費の高騰など、すべてがコスト上昇の原因となっています。だからといって、価格上昇がデータセンター需要を減退させるということにはなりませんが、効率改善への新たな取り組みが促進される可能性は高いです。
-
Google AI Research Introduces Process Advantage Verifiers: A Novel Machine Learning Approach to Improving LLM Reasoning Capabilities
Large language models (LLMs) have become crucial in natural language processing, particularly for solving complex reasoning tasks. These models are designed to handle mathematical problem-solving, decision-making, and multi-step logical deductions. However, while LLMs can process and generate responses based on vast amounts of data, improving their reasoning capabilities is an ongoing challenge. Researchers are continuously…
-
Databricks and AWS in AI Chip Hookup
AWS Trainium chips will be the preferred processors for training Mosaic AI models on the Databricks platform, the company announced today. The deal represents a blow to Nvidia’s continued AI dominance with its high-end GPU. Processing capacity has emerged as one of the bottlenecks in being able to scale AI. Large language models (LLMs) like…
-
Neural Magic Unveils Machete: A New Mixed-Input GEMM Kernel for NVIDIA Hopper GPUs
The rapid growth of large language models (LLMs) and their increasing computational requirements have prompted a pressing need for optimized solutions to manage memory usage and inference speed. As models like GPT-3, Llama, and other large-scale architectures push the limits of GPU capacity, efficient hardware utilization becomes crucial. High memory requirements, slow token generation, and…
-
Astronomer’s High Hopes for New DataOps Platform
Astronomer last month rolled out a new observability product called Astro Observe that’s aimed at giving customers the full picture of how their data is flowing using Apache Airflow, the open source data orchestration tool that is backs. As Astronomer CTO Julian LaNeve explains, the goal is for Observe to become a full-fledged DataOps platform.…
-
These AI models reason better than their open-source peers – but still can’t rival humans
A study tested AI’s ability to complete visual puzzles like those found on human IQ tests. It went poorly.