“AI 시대에 맞춰 진화한 메인프레임”··· IBM z17, AI 가속기 탑재로 성능·응답속도 높여

Posted by:

|

On:

|

IBM은 데이터 집약적인 애플리케이션을 위한 차세대 메인프레임 z17을 6월 출시할 예정이라고 밝혔다. z17은 AI 기능을 중심으로 설계됐으며, 5.5GHz 속도의 IBM 텔럼 II(Telum II) 프로세서를 기반으로 한다. 이 칩에는 AI 가속기가 내장돼 있어 하루 4,500억 건 이상의 추론 작업을 1밀리초 이내 응답 속도로 수행할 수 있다는 설명이다. 칩당 8개 CPU 코어, 시스템당 32코어, L2 캐시는 36MB이며, 초당 24조 건의 연산을 처리할 수 있어 기존 텔럼 대비 시스템 처리량은 40% 증가하고 지연 시간은 4분의 1로 줄어들었다고 IBM은 전했다.

여기에 더해, 32코어 AI 가속기 ‘스파이어(Spyre)’는 옵션형 PCIe 카드로 4분기부터 제공된다. 필요에 따라 여러 장의 카드를 추가할 수 있다. 이 가속기는 생성형AI 및 에이전트형AI처럼 새롭게 등장한 워크로드를 처리하도록 설계됐다.

IBM은 “지난 10년간 AI 모델의 규모가 커지는 흐름이 이어졌지만, 최근에는 목적에 최적화된 소형 모델로도 이동하는 추세”라며 “전문가 혼합(MoE, Mixture of Experts) 모델과 상태공간(State Space) 모델의 활용도 증가하고 있다. 이들 모델의 이상적인 적용 방식과 잠재력은 아직 탐색 중이며, 스파이어는 이러한 기능을 기본으로 제공한다”라고 설명했다.

IBM은 현재 자사 메인프레임 IBM Z 기반에서 사용할 수 있는 AI 활용 사례가 250가지가 넘는다고 소개했다. 대표적으로 금융 사기 탐지, 의료 영상 분석, 신용 위험 평가 등이 포함된다.

IBM Z의 AI 최고기술책임자(CTO)이자 펠로우인 엘피다 조르자토스는 “거래량이 많은 고객은 실시간으로 거래 건에 대해 사기 여부를 판별하고 싶어했다”라며 “예를 들어 직불카드, 신용카드, 주요 결제 건에서 지연 없이 AI를 적용하고자 했으며, 이는 AI 인프라 측면에서 단일 자릿수 밀리초 이내 응답 속도와 매우 높은 처리량을 갖춘 하드웨어 가속기를 필요로 했다”라고 전했다.

또한 조르자토스는 기존 환경에 AI를 쉽게 통합하기 어려워하는 고객이 많았다고 설명했다. 그는 “단순히 하드웨어 가속기만 제공한 것이 아니라, 그 위에 강력한 AI 생태계를 구축해 고객이 기존 워크로드와 애플리케이션에 AI를 자연스럽게 접목할 수 있도록 지원했다”라고 말했다.

조르자토스는 예측형 AI와 생성형AI 모두 엔터프라이즈 환경에서 중요한 역할을 하게 될 것이라고 언급했다. 수요 예측, 자금세탁 방지, 사기 탐지 등에는 예측형 AI가 여전히 가장 적합한 방식이라는 설명이다.

조르자토스는 “생성형AI는 문서 요약, 비정형 데이터에서 핵심 인사이트 추출, 다양한 업무 지원 등 새로운 활용 사례의 가능성을 넓힌다”라고 표현했다.

IBM z17, 하이엔드 트랜잭션 시장에서 주목받을까?

최신 메인프레임 z17이 AI 추론, 특화된 AI 애플리케이션, 전통적 워크로드 등 복잡한 트랜잭션 처리를 동시에 지원하며 엔터프라이즈 컴퓨팅에서 핵심 역할을 할 것이라는 전망이 나왔다.

기술 시장 분석 기업 하이퍼프레임리서치(HyperFRAME Research)의 CEO 겸 수석 애널리스트인 스티븐 디킨스는 “z17은 최첨단 서버 기술의 정점에 있는 제품으로, 정당한 평가를 받았으면 한다”라며 “산업 전반이 3GHz대에 머무는 가운데, z17은 5.5GHz 속도와 대형 캐시 메모리를 갖춘 괴물 같은 장비로, AI나 대규모 트랜잭션 애플리케이션을 위해 특별히 설계된 점이 명확히 드러난다”라고 표현했다.

디킨스는 z17이 금융 사기 방지와 같이 트랜잭션 중심 플랫폼에 적합한 AI 활용 사례에 주목해야 한다고 언급했다. 특히 “트랜잭션 하나하나에 IBM의 그래니트(Granite) AI나 소형 대규모 언어 모델을 직접 적용해 실행할 수 있다는 점이 특히 흥미롭다”라며 “이러한 기능은 대형 은행, 통신사, 유통사, 정부 기관 등의 AI 애플리케이션 도입을 촉진할 것”이라고 분석했다.

컨설팅 기업 무어인사이트앤스트래티지(Moor Insights & Strategy)의 설립자이자 CEO 겸 수석 애널리스트인 패트릭 무어헤드도 z17이 특정 AI 활용 사례에서 강점을 발휘할 것으로 내다봤다. 그는 “IBM Z가 주로 공략하는 고객군은 은행, 정부, 제조업체 등인데, 이런 고객군에게 실제로 AI는 더 중요해지고 있다”라고 설명했다.

무어헤드는 “현재 많은 AI 워크로드가 메인프레임 외부로 분리돼 처리되고 있으며, 이 방식은 느리고 비용이 많이 들며 보안 위험도 증가시킨다”라며 “데이터가 생성되는 지점에서 직접 AI를 적용하는 것이 훨씬 합리적”이라고 전했다. 또한 “많은 IBM 고객이 실제로 이를 시도하고 있지만 메인프레임 외부에서 실행 중이라 비효율적이다. 모든 AI 추론이 메인프레임에서 실행돼야 한다고 말하는 건 아니지만, 사기 탐지 같은 특정 사례에는 매우 적합하다”라고 말했다.

z/OS 3.2 및 왓슨X 기반 코드 어시스턴트도 공개

IBM은 하드웨어 외에도 z17에 최적화된 운영체제인 z/OS 3.2의 프리뷰 버전도 공개했다. 정식 출시는 3분기로 예정돼 있으며, 텔럼 II 데이터 처리 유닛(DPU), 인공지능 유닛(AIU), 스파이어 AI 가속기 등 z17의 전체 스택 최적화에 맞춘 AI 하드웨어 기능을 지원하게 된다.

z/OS 3.2는 표준 산업 기술, 다양한 언어, 애플리케이션 워크로드를 더 폭넓게 지원하며, 미션 크리티컬한 핵심 비즈니스 애플리케이션을 지속적으로 성장·강화할 수 있도록 설계됐다. 여기에 IBM Z만의 사이버 회복력, 데이터 지역성, 고유 하드웨어 이점도 유지된다. IBM은 리눅스 및 z/OS 기반 컨테이너 애플리케이션, IBM 오픈 엔터프라이즈 SDK 포 파이썬, 하이브리드 클라우드 기반 데이터 처리 환경에 대한 기본 지원이 더욱 강화될 것이라고 설명했다.

개발자 지원 기능도 강화된다. IBM은 z 플랫폼용 왓슨 X 코드 어시스턴트(watson X Code Assistant for Z)의 새로운 버전을 도입할 계획이다. 왓슨 X는 IBM의 AI 개발 스튜디오이자 플랫폼으로, 새로운 기능에는 대화형 설명 기능, PL/I 코드의 가독성 향상 및 민첩성 개선, COBOL 코드를 위한 AI 기반 성능 최적화 기능이 포함된다.

z17의 주요 기능

IBM은 z17에 다음과 같은 기능도 함께 포함했다고 밝혔다.

  • IBM Z 오퍼레이션 유나이트(IBM Z Operations Unite): 새로운 메인프레임 가시성 패키지로, 하나의 인터페이스에서 IBM Z의 다양한 데이터 소스에서 이벤트와 지표를 수집해 인프라 전체를 한눈에 볼 수 있게 한다. 운영 문제를 더 빠르게 탐지·진단할 수 있도록 설계됐으며, 오픈텔레메트리(OpenTelemetry) 표준 형식으로 데이터를 보고해 경보 조사 시간 단축에 기여할 수 있다.
  • 시크릿 관리 기능 표준화: IBM은 최근 인수한 하시코프의 기술을 기반으로, 하이브리드 클라우드 전반에서 시크릿 관리 기능을 표준화할 계획이다. 이 기능은 IBM 볼트(Vault)를 통해 제공되며, 아이덴티티 기반 보안을 통해 시크릿 접근을 관리하고 민감 데이터를 보호할 수 있도록 돕는다.
  • 민감 데이터 탐지 및 분류 기능: 향후 제공될 예정인 이 기능은 텔럼 II 칩을 활용해 자연어 처리와 새롭게 개발된 AI 기술을 기반으로 중요 데이터를 식별·보호할 수 있게 한다. AI 데이터 파이프라인에 활용되기 전, 중요한 정보를 먼저 추출하고 보호하는 것이 가능하다는 설명이다.

[email protected]

Posted by

in

Leave a Reply

Your email address will not be published. Required fields are marked *