Компанія OpenAI представила нову версію ChatGPT, що базується на новій технології штучного інтелекту під назвою OpenAI o1. Якими є нові можливості та чим нова версія краща для науковців?

12 вересня компанія OpenAI представила нову версію віртуального помічника ChatGPT засновану на новій технології штучного інтелекту OpenAI o1. Від моменту запуску першої версії ChatGPT у 2022 році, чат-бот постійно вдосконалювався, надаючи користувачам нові можливості. У цій статті ми розглянемо останні оновлення та з’ясуємо, чим нова версія вирізняється серед попередніх і чим вона краща.
Демонстрація та можливості нового ChatGPT
Компанія OpenAI заявила, що чат-бот, заснований на технології OpenAI o1, здатен «міркувати», вирішуючи завдання, пов’язані з математикою, кодуванням і наукою.
Під час демонстрації для The New York Times чат-боту були представлені деякі головоломки та поставлені питання з хімії, на які він відповідав на рівні доктора філософії, і діагностував хворобу на основі детального звіту про симптоми та історію хвороби пацієнта.
Компанія також зазначила, що нова технологія може допомогти фізикам генерувати складні математичні формули та допомагати дослідникам у галузі охорони здоров’я в їхніх експериментах.
Фахівці навчили ці моделі витрачати більше часу на аналіз проблем перед тим, як надати відповідь, наслідуючи підхід людини. Завдяки цьому процесу навчання, моделі покращують своє мислення, випробовують різні стратегії та здатні визнавати свої помилки.
Необхідність у вдосконаленні штучного інтелекту
ChatGPT навчався, аналізуючи великі обсяги тексту з різних джерел в інтернеті, зокрема статей із Вікіпедії, книг та чатів. Аналізуючи шаблони у текстах, він здобув здатність самостійно генерувати новий текст. Проте, через поширеність неправдивої інформації в інтернеті, модель може відтворювати ці неточності, а іноді навіть вигадувати їх.
Розробники створили нову систему OpenAI, використовуючи метод навчання з підкріпленням, завдяки якому система вчиться через численні спроби та помилки, що може тривати від тижнів до місяців. Наприклад, при розв’язанні математичних задач система виявляє, які методи приводять до правильного результату, а які – ні. Після виконання великої кількості таких завдань вона починає помічати закономірності, але це не означає, що її мислення подібне до людського. Технічні фахівці OpenAI підкреслюють, що система все ще може робити помилки та не є ідеальною, але користувачі можуть очікувати, що вона працюватиме старанніше та з більшою ймовірністю надаватиме правильні відповіді.
Тестування нової технології OpenAI o1
OpenAI заявила, що нова технологія показала кращі результати, ніж попередні технології, на деяких стандартизованих тестах.
У тестах нова версія моделі демонструє результати на рівні аспірантів у складних контрольних завданнях з фізики, хімії та біології. Модель також показує відмінні результати у математиці та програмуванні. На іспиті AIME 2024 року модель GPT-4o змогла розв'язати в середньому лише 12% (1,8/15) задач. Водночас модель o1 досягла 74% (11,1/15) розв'язків при одному підході на задачу, 83% (12,5/15) при консенсусі серед 64 спроб і 93% (13,9/15) при переранжуванні 1000 спроб з використанням вивченої функції оцінювання. Результат 13,9 бала дозволяє потрапити до топ-500 студентів на національному рівні та перевищує прохідний бал для участі в математичній олімпіаді США.
Модель, ініціалізована на базі o1 і вдосконалена для програмування, набрала 213 балів і увійшла до 49-го процентиля на Міжнародній олімпіаді з інформатики (МОІ) 2024 року. За умов реального змагання було відведено 10 годин для вирішення 6 алгоритмічних задач із 50 спробами на кожну. Заявки оцінювалися на основі публічних і згенерованих тестів. Якщо вибирати відповіді випадковим чином, середній результат становив би лише 156 балів, що вказує на те, що застосована стратегія додала майже 60 балів у умовах жорсткої конкуренції. При пом'якшених обмеженнях на кількість спроб модель досягла 362,14 бала, перевищивши поріг для отримання золотої медалі. На платформі Codeforces модель GPT-4o отримала рейтинг Elo3 808, що відповідає 11-му процентилю серед людей.
Доступ до нового ChatGPT
Доступ до нової технології розпочався 12 вересня для споживачів і компаній, які підписались на послуги ChatGPT Plus і ChatGPT Teams. Компанія також продає технологію розробникам програмного забезпечення та компаніям, які створювали власні додатки зі штучним інтелектом.
Користувачі ChatGPT Enterprise та Edu отримають доступ до обох моделей з 16 вересня. OpenAI планує надати доступ до o1-mini всім безкоштовним користувачам ChatGPT, але точна дата випуску поки не визначена.
Доступ розробників до o1 є дорогим: в API o1-preview плата становить 15 доларів США за 1 мільйон вхідних токенів і 60 доларів США за 1 мільйон вихідних токенів. Для порівняння, використання GPT-4o обійдеться в 5 доларів за 1 мільйон вхідних токенів і 15 доларів за 1 мільйон вихідних токенів.
Нові можливості для науковців і вчених
Нова технологія OpenAI o1 відкриває перед науковцями та вченими багато нових можливостей, одними з яких є:
- Кращі аналітичні можливості. Завдяки швидкому розв’язанню складних задач вчені зможуть швидше проводити аналіз і знаходити потрібне рішення. Також завдяки новій технології швидше обробляються великі обсяги даних, що значно економить час при проведенні досліджень.
- Оптимізація літературного огляду. Модель може швидко обробляти велику кількість наукових джерел і допомагати створювати якісні літературні огляди, що економить час науковцям під час підготовки статей та досліджень.
- Покращення якості тексту. ChatGPT o1 дозволить авторам більш якісно та точно редагувати текст наукової роботи, виправляти помилки та робитиме пропозиції для покращення якості тексту. Особливо важливо це для тих авторів, які готують роботу іноземною мовою.
o1 – і його наступники відкриють багато нових можливостей використання ШІ в науці, особливо в кодуванні, математиці та суміжних галузях. Найближчим часом користувачі та розробники дізнаються, як це може покращити їхню повсякденну роботу.
Нова технологія від компанії OpenAI робить підготовку наукових досліджень і написання наукових робіт більш ефективною. Проте слід пам’ятати, що вона не є ідеальною і може припуститися помилки. Хоча такі інструменти, як ChatGPT, можуть бути корисними при підготовці статей, вони ніколи не зможуть повністю замінити особистий внесок автора.