OpenAl представили новую ИИ-модель o1, которая умеет размышлять.

Компания рассказала, что с 12 сентября 2024 года стартовала новая версия искусственного интеллекта, которая предназначена для решения более сложных задач, поскольку она тратит больше времени на размышления перед ответом. Эта модель может рассуждать и думать почти как человек во время решения научных заданий в сфере программирования, математики и естественных наук.
O1 – это предварительный выпуск, который ожидают регулярные обновления и улучшения. Несмотря на то, что версия достаточно сырая, она уже показала хорошие результаты при тестировании.
Как работает новая модель искусственного интеллекта
О1 обучена уделять больше времени размышлениям перед ответом, как это делает человек. В процессе обучения они совершенствуют свой мыслительный процесс, пробуют различные стратегии и осознают свои ошибки.

OpenAl предоставила данные тестирования, где можно увидеть, как справляется с задачами по математике и кодингу GPT-4o, o1 preview и человек.
Разработка предупредила, что модель находится в своей ранней версии и у нее меньше представлений о мире и возможностей по загрузке файлов, изображений и веб-страниц, чем у GPT-4. Но в дальнейшем версия o1 восполнит пробелы и научится всему необходимому. Ее способность к рассуждению является прорывом в области искусственного интеллекта.
Безопасность разработки
Так как вариант восстания машин становится все более реальным, особое внимание OpenAl уделяет протоколам безопасности. Один из методов контроля - это проверка способности модели следовать правилам безопасности при попытках их обойти. Версия o1-preview достигла 84 баллов из 100 в одном из самых строгих и сложных тестов компании, в то время как GPT-4o набрала всего 22 балла. Модель прошла тестирование в категориях «Вредоносные подсказки», «Помощь в самоповреждении», «Советы по поводу насильственных и ненасильственных правонарушений», «Помощь при побеге из тюрьмы» и во всех этих случаях показала высокий уровень безопасности, который доказывает, что ИИ не будет давать рекомендаций, ведущих к нарушению закона или насилию.
Помимо экзаменов и контрольных работ OpenAl также оценили предпочтения людей в сравнении o1-preview и GPT-4o при выполнении сложных заданий открытого типа в широком спектре областей. Людям показывали анонимные ответы и подсказки от o1-preview и GPT-4o, и они голосовали за то, какой ответ более удачный. O1-preview опережает gpt-4o с большим отрывом в категориях, требующих большого количества аргументов, таких как анализ данных, кодирование и математика. Однако в некоторых задачах, связанных с языкознанием и литературой, o1-preview показал результаты хуже, что говорит о том, что он подходит не для всех случаев использования.
Новые возможности искусственного интеллекта будут важны для решения сложных задач в науке, программировании, математике и других областях. Например, o1 может использоваться в здравоохранении для аннотирования данных клеточного секвенирования, физиками для создания сложных математических формул для квантовой оптики, и разработчиками для создания и выполнения многоэтапных рабочих процессов.
























