IplanRIO представила відкриту ШІ-модель Rio 3.5

Криптовалюты / Новости в мире криптовалют 16-06-2026 13 0

Китай запустив масове виробництво кремнію-28 для квантових компʼютерів Standard Chartered прогнозує зростання DeFi до $2,7 трлн до 2030 року

IplanRIO представила открытую ИИ-модель Rio 3.5

Муніципальна IT-компанія Ріо-де-Жанейро IplanRIO представила Rio 3.5 Open 397B як відкриту ШІ-модель, навчену на державні кошти і таку, що перевершує DeepSeek V4 Pro і Qwen 3.7 Plus за низкою бенчмарків. Однак за день команда ШІ-розробника Nex заявила, що інструмент виглядає як пряме злиття Nex-N2-Pro і Qwen3.5-397B-A17B.

Після претензій IplanRIO оновила картку Rio 3.5 Open 397B на Hugging Face. У новому описі зазначено, що модель побудована через злиття Nex-N2-Pro і Qwen3.5-397B-A17B з подальшою дистиляцією від сильнішої моделі.

Як представляли Rio 3.5

IplanRIO виклала Rio 3.5 Open 397B на Hugging Face 13 червня 2026 року під ліцензією MIT. У початковому описі проєкт називали ШІ-системою загального призначення «передового рівня» і зазначали, що модель донавчена на базі Qwen3.5-397B-A17B.

У характеристиках ішлося про 397 млрд параметрів, з яких 17 млрд активуються під час обробки кожного токена. Така архітектура називається Mixture-of-Experts (MoE): модель використовує не всі параметри одразу, а лише частину спеціалізованих блоків.

IplanRIO також заявляла контекстне вікно на 1,01 млн токенів і використання SwiReasoning. В описі проєкту цей фреймворк представлено як механізм, який перемикає модель між явним і прихованим режимами міркувань.

У першій версії картки проєкту наводилися результати тестів, за якими Rio 3.5 обходила Qwen 3.7 Plus і DeepSeek V4 Pro. На Terminal-Bench 2.1 модель набрала 70,8% проти 70,3% у Qwen 3.7 Plus і 67,9% у DeepSeek V4 Pro. У Humanity’s Last Exam показник склав 36,5% проти 34,7% у Qwen 3.7 Plus, а в IMOAnswerBench — 89,5%.

Після релізу мер Ріо-де-Жанейро Едуарду Кавальєрі написав у X, що відкрита ШІ-модель, навчена в Ріо на державні кошти, «перевершила всі інші моделі».

Що заявила Nex

14 червня Nex відкрила звернення в репозиторії Nex-N2 на GitHub. Компанія заявила, що Rio 3.5 Open 397B представлена як оригінальна модель IplanRIO, але її ваги виглядають як пряме поелементне злиття Nex-N2-Pro і Qwen3.5-397B-A17B.

За оцінкою Nex, Rio 3.5 приблизно на 60% складається з Nex-N2-Pro і на 40% з Qwen3.5-397B-A17B. Компанія стверджує, що не знайшла ознак самостійного навчання IplanRIO.

Nex навела два аргументи. Після видалення системного промпту «You are Rio» модель, за твердженням компанії, називала себе «Nex, from Nex-AGI» у 79% відповідей і жодного разу не називала себе Rio. Також Nex заявила, що кожен тензор ваг Rio повторює пропорцію 0,6/0,4 між Nex і Qwen в усіх 60 шарах моделі.

«Невинного пояснення цьому немає», — ідеться в заяві Nex.

В окремому пості фірма сформулювала претензію простіше: Rio 3.5, по суті, є open-source-моделлю Nex N2 Pro «в іншій обгортці».

Чому бенчмарки викликали запитання

Decrypt звернув увагу, що Nex-N2-Pro у власних тестах показує вищі результати, ніж Rio 3.5 у початковій картці. В описі Nex-N2-Pro на Hugging Face зазначено 75,3% на Terminal-Bench 2.1 проти 70,8% у Rio 3.5. На GDPval модель Nex набрала 1585 балів проти 1533 у Rio.

Як зазначило видання, якщо Rio справді є сумішшю Nex-N2-Pro і Qwen3.5-397B-A17B, то її слабші результати порівняно з Nex виглядають очікувано. При цьому самі бенчмарки Rio 3.5 прибрали з основного опису після оновлення картки.

Як відповіла IplanRIO

Після претензій IplanRIO змінила README моделі на Hugging Face. В актуальній версії зазначено, що Rio 3.5 Open 397B побудована через злиття Nex-N2-Pro і Qwen3.5-397B-A17B, а потім пройшла дистиляцію.

Дистиляція — метод навчання, за якого одна модель переймає поведінку сильнішої моделі. У цьому випадку IplanRIO стверджує, що мала опублікувати не базову версію, а фінальну дистильовану модель.

«Ми шкодуємо про плутанину і просимо вибачення», — ідеться в оновленому README.

Команда також повідомила, що працює над повторним завантаженням коректної моделі. Окремого розгорнутого публічного коментаря IplanRIO, крім оновленого README, на момент публікації не було.

У чому суть спору

Використання відкритих моделей саме по собі не є порушенням. Nex-N2-Pro опублікована під ліцензією Apache 2.0, а Qwen3.5-397B-A17B також доступна як відкрита модель. Такі ліцензії дозволяють використовувати, змінювати та поширювати моделі за дотримання умов.

Спір виник через презентацію Rio 3.5. Початкова картка створювала враження самостійної розробки і донавчання на базі Qwen3.5-397B-A17B, але не вказувала Nex-N2-Pro як одне з джерел. У open-source-спільноті це сприймають як проблему прозорості. Злиття відкритих ваг, донавчання і дистиляція стали звичайною практикою, але від розробників очікують розкриття вихідних моделей і внеску сторонніх команд.

Раніше Alibaba представила сімейство «гібридних» ШІ-моделей Qwen3, які «здатні зрівнятися або перевершити в деяких випадках» найкращі рішення від Google і OpenAI.

Нагадаємо, китайський ШІ-стартап DeepSeek представив DeepSeek-R1 у січні 2025 року. Ця модель стала однією з головних подій ШІ-ринку на той момент.

Джерело: ForkLog