Ai2 представила Olmo 3: Відкриті моделі, що конкурують з Meta, DeepSeek та іншими

The Allen Institute for AI (Ai2) представила нову генерацію своїх флагманських великих мовних моделей, розроблені для більш прямої конкуренції з галузевими та академічними лідерами. Seattle-based некомерційна організація представила Olmo 3, колекцію відкритих мовних моделей, яка, за заявами, перевершує повністю відкриті моделі, такі як Stanford’s Marin та комерційні відкриті моделі, як Meta’s Llama 3. Раніше версії Olmo були в основному призначені для наукових цілей, для розуміння того, як будуються AI моделі. З Olmo 3, Ai2 розширює свій фокус, позиціонуючи моделі як потужні, ефективні та прозорі системи, придатні для використання у реальному світі, включаючи комерційні застосування.

«Olmo 3 доводить, що відкритість та продуктивність можуть розвиватися разом», – сказав Ali Farhadi, CEO Ai2, у прес-релізі, опублікованому в четвер, що оголошував про нові моделі.

Це частина ширшої еволюції в AI світі. Протягом останнього року все більш потужні відкриті моделі з компаній та університетів — включаючи Meta, DeepSeek, Qwen, та Stanford — почали конкурувати з продуктивністю власних систем великих технологічних компаній.

Багато з останніх відкритих моделей розроблені для демонстрації їхнього міркування крок за кроком — часто звані «моделі, що «думлять»», що стало ключовим критерієм у цій галузі.

Ai2 випускає Olmo 3 у кількох версіях: Olmo 3 Base (основний базовий фундамент); Olmo 3 Instruct (настроєний для дотримання інструкцій користувача); Olmo 3 Think (розроблений для демонстрації більш явного міркування); та Olmo 3 RL Zero (експериментальна модель, навчена за допомогою навчання з підкріпленням).

Відкриті моделі набирають обертів завдяки стартапам та бізнесу, які хочуть більше контролю над витратами та даними, а також чіткішу видимість того, як працює технологія. Ai2 йде далі, випускаючи повний «потік моделі» позаду Olmo 3 — серію знімків, що показує, як модель прогресувала на кожному етапі навчання. Крім того, оновлений OlmoTrace інструмент дозволить дослідникам пов’язувати міркування моделі назад до конкретних даних та рішень щодо навчання, які вплинули на них.

Що стосується енергії та ефективності витрат, Ai2 заявляє, що новий базовий Olmo 3 в 2,5 рази більш ефективний для навчання, ніж Meta’s Llama 3.1 (на основі GPU-годин на токен, порівнюючи Olmo 3 Base з Meta’s 8B post-trained modelem), та навчався на значно менше токенів, в деяких випадках в шість разів менше, ніж у аналогічних моделях.

Крім того, Olmo 3 може читати або аналізувати набагато довші документи одночасно, з підтримкою вхідних даних до 65 000 токенів, що приблизно дорівнює довжині розділу короткої книги.

Заснована в 2014 році пізнім засновник Microsoft Paul Allen, Ai2 протягом тривалого часу функціонувала як дослідницька некомерційна організація, розробляючи відкриті інструменти та моделі, тоді як більші комерційні лабораторії домінували в центрі уваги. Інститут зробив серію кроків цього року, щоб підняти свій профіль, зберігаючи при цьому свою місію розвитку AI для вирішення найбільших проблем світу. В серпні Ai2 було обрано Національним Науковим Фондом та Nvidia для ініціативи вартістю 152 мільйони доларів для створення повністю відкритих багатомодальних AI моделей для наукових досліджень, позиціонуючи інститут для того, щоб бути ключовим учасником національного AI-скелету. Він також є ключовим технічним партнером для Cancer AI Alliance, допомагаючи Fred Hutch та іншим провідним центрам раку в США навчати AI-моделі на клінічних даних, не розкриваючи пацієнтських записів.

Olmo 3 доступний зараз на Hugging Face та Ai2’s model playground.

Kymeta Appoints New CEO to Fuel Defense Operations Expansion

Redmond, Washington-based Kymeta, a specialist in mobile satellite communications, has appointed Manny Mora as its new president and CEO, effective immediately.

Established in 2012 with investment from Microsoft co-founder Bill Gates, the company is significantly increasing its focus on providing services to the U.S. Department of Defense and allied military forces.

Mora brings almost four decades of experience from General Dynamics Mission Systems, where he oversaw the company’s partnerships with the Department of Defense, the intelligence community, and the U.S. Department of Homeland Security.

‘As the defense community modernizes its command-and-control infrastructure, Kymeta is ideally positioned to deliver mobile SATCOM solutions designed for the most challenging environments,’ stated Nicole Piasecki, chair of Kymeta’s board of directors. ‘Manny Mora’s operational expertise and strategic vision will be crucial in expanding our impact and solidifying our role as a reliable partner for national security clients,’ she added.

Kymeta is benefiting from trends reshaping the aerospace and defense sector, including advancements in software systems, autonomous platforms, satellite communications, and artificial intelligence.

Recently, Kymeta was selected by the U.S. Army as the provider of multi-orbit satellite communications for its Next Generation Command and Control pilot program. The initiative utilizes the company’s Osprey u8 terminal technology to provide connectivity for military personnel.

‘Our innovative technology is already transforming how defense and government customers communicate across various domains,’ Mora commented.

Manny Mora succeeds Rick Bergman, formerly a vice president at AMD, who served as CEO from April 2024.

Kymeta’s technology utilizes metamaterials to create steerable antennas controlled by software, eliminating mechanical components. These hybrid cellular-satellite terminals enable communications in areas difficult to reach, a key interest for defense clients.

The company also offers technology for emergency services, maritime operations, wildfire-fighting, and other specialized applications. Kymeta secured $84 million in funding in 2022, bringing total investment to nearly $400 million to date.’