Вперше з 2019 року OpenAI представила повноцінні мовні моделі з відкритими вагами, що дозволяють розробникам працювати безпосередньо з внутрішніми параметрами системи. Новинки отримали назви gpt-oss-20b та gpt-oss-120b, де цифри вказують на кількість параметрів — 20 та 120 мільярдів відповідно.
Моделі доступні на GitHub разом із вагами та вихідним кодом для запуску. Їх можна завантажити, запускати локально, змінювати та інтегрувати у власні програмні продукти. Працюють вони навіть на Apple Silicon, що робить використання можливим без інтернету та серверів — обчислення виконуються повністю на локальних пристроях.
Ліцензія та принципи використання
OpenAI розповсюджує обидві моделі під ліцензією Apache 2.0, однією з найбільш вільних у сфері програмного забезпечення. Це відкриває можливості для їхнього застосування як у дослідницьких, так і в комерційних проєктах, включно з перепакуванням та інтеграцією в інші продукти.
Водночас компанія наголошує на дотриманні політики сумлінного використання, закликаючи застосовувати інструменти безпечно, відповідально та з дотриманням демократичних принципів.
Технічні особливості
Версія gpt-oss-120b побудована за принципом Mixture-of-Experts — у процесі роботи задіюється лише частина параметрів, що пришвидшує генерацію відповідей та зменшує вимоги до ресурсів. Обидві моделі мають контекстне вікно на 128 тисяч токенів, що дозволяє працювати з великими обсягами тексту та складними логічними структурами.








