Meet Hertz-Dev: An Open-Source 8.5B Audio Model for Real-Time Conversational AI with 80ms Theoretical and 120ms Real-World Latency on a Single RTX 4090
Conversational AI is now a cornerstone of technology, but achieving fast, efficient, and real-time interaction remains challenging. Latency—the delay between input and response—limits applications like customer service bots and virtual assistants, making interactions feel sluggish. Existing models often require significant computational power, putting real-time AI out of reach for smaller setups and independent developers. An…
LLaMA-Berry: Elevating AI Mathematical Reasoning through a Synergistic Approach of Monte Carlo Tree Search and Enhanced Solution Evaluation Models
Mathematical reasoning within artificial intelligence has emerged as a focal area in developing advanced problem-solving capabilities. AI can revolutionize scientific discovery and engineering fields by enabling machines to approach high-stakes logical challenges. However, complex tasks, especially Olympiad-level mathematical reasoning, continue to stretch AI's limits, demanding advanced search methods to navigate solution spaces effectively. Recent strides…
윈도우 리콜 프리뷰 배포, 12월로 또 연기
마이크로소프트가 윈도우 리콜 기능의 출시를 연기했다. 사용자의 데스크톱 화면을 정기적으로 캡처하는 이 논란의 이제 12월에 프리뷰로 출시될 예정이다. 지난 5월 처음 공개된 리콜, 당초 6월에 윈도우 인사이더 가입자에게 공개될 예정이었다. 하지만 일부 전문가들이 데이터 보안 및 개인 정보 보호 문제를 제기하면서, 출시 계획이 10월로 연기된 바 있다. 마이크로소프트는 리콜의 출시를 다시 연기했다고 밝혔다. 윈도우 선임…
IDC, 퓨처스케이프 2025 발표··· ‘향후 1-2년 주요 요인 10가지’ 제시
보고서는 또 2028년까지 AI 지원 기술에 대한 전 세계 지출이 7,490억 달러를 넘어설 것으로 전망하며, "지난 18개월 동안 규모와 업종을 불문하고 모든 조직이 AI를 활용한 광범위한 하이퍼 실험에 참여했다. 2025년에는 실험에서 재창조로 전환할 것으로 예상한다"라고 전했다. 이어 "올해의 예측은 AI 전환을 가속화해야 한다는 시급한 필요성을 강조하며, 고급 AI 지원 역량에 대한 전략적이고 장기적인 투자를 지지한다"라고…
점자책부터 AI 음성 안내까지··· 시각 장애인 지원 서비스 도입한 기업 3곳
정부를 비롯한 공공 기관과 민간 기업은 매년 한글 점자의 날을 맞이해 시각장애인의 점자 사용 권리를 강화하고, 점자에 대한 국민의 관심과 이해를 높이는 데 주력하고 있다. 보건복지부가 발표한 2023년 등록장애인 통계에 따르면, 한국의 등록장애인은 전체 인구의 5.1%인 약 264만 명이며, 이 중 시각장애인은 약 25만 명에 이른다. 2022년 대한의사협회지의 '국내 시각장애와 저시력 현황'을 살펴본 결과, 시각장애의…
“초기 클라우드 AI 경쟁, MS와 오픈AI가 선점” IoT 애널리틱스
지난 2년 동안 생성형 AI 덕분에 AI 기술에 대한 기업의 관심이 크게 증가했다. 그리고 AWS, 구글, 마이크로소프트 등의 거대 클라우드 서비스 업체도 이에 따른 혜택을 누리고 있다. IoT 애널리틱스(IoT Analytics)의 조사에 따르면, AI는 클라우드 수요의 원동력이 됐으며, 여기서 생성형 AI의 역할은 점점 더 중요해지고 있다. IoT 애널리틱스의 '글로벌 클라우드 프로젝트 보고서 및 데이터베이스 2024(Global Cloud…
팬데믹 이후의 사무실 공간에 대한 수요와 공급
2022년과 2023년에 코로나19로 인한 팬데믹이 완화되면서 미국의 대도시와 소도시 내 핵심 사무실 거리는 원격 및 하이브리드 근무 정책의 후유증을 계속 겪었다. 이로 인해 사무실 공간 사용률이 20~40% 감소하고 부동산 가치가 하락했다. 원격 근무로의 대대적인 전환이 이루어져 사실상 많은 도심이 몇 달 동안 거의 텅 비어 있었다. 그 이후 상업 지역 분위기는 느리지만 꾸준히 사무실로 돌아오기… Read more
Enter the ‘Whisperverse’: How AI voice agents will guide us through our days
Within the next few years, an AI-powered voice will burrow into your ears and take up residence inside your head.Read More
Future Token Prediction Model FTP: A New AI Training Method for Transformers that Predicts Multiple Future Tokens
The current design of causal language models, such as GPTs, is intrinsically burdened with the challenge of semantic coherence over longer stretches because of their one-token-ahead prediction design. This has enabled significant generative AI development but often leads to "topic drift" when longer sequences are produced since each token predicted depends only on the presence…
Efficient Function Calling in Small-Scale LLMs: A Game-Changer for AI Reasoning Tasks
Recent advancements in Large Language Models (LLMs) have demonstrated exceptional natural language understanding and generation capabilities. Research has explored the unexpected abilities of LLMs beyond their primary training task of text prediction. These models have shown promise in function calling for software APIs, supported by the launch of GPT-4 plugin features. Integrated tools include web…