Главная          О Компании          Контакты               Телефон: (012) 449-50-31
Сервис:    (055) 580-44-09
Поиск
Категории
 HP
 Gigabyte
 Lenovo
 Asus
 Dell
 HP
 Toshiba
 Benq
 Sony
 Samsung
 Lenovo
 Gigabyte
 Gigabyte
 Foxconn
 MSI
 Gigabyte
 HP
 Gigabyte
 Creative
 HP
 Kingston
 Super Talent
 Team Group
 TwinMOS
 Samsung
 Dynet
 Hynix
 Patriot
 A-data
 Crucial
 PNY
 Neo Forza
 Seagate
 Western Digital
 HP
 Fujitsu
 Western Digital
 Plextor
 HP
 Seagate
 PNY
 Gigabyte
 Kingston
 ADATA
 AgeStar
 HP
 Lightwave
 Seagate
 SimpleTech
 S-tek
 Transcend
 Western Digital
 Gigabyte
 Benq
 LG
 LITE-ON
 Creative
 Logitech
 HP
 Gigabyte
 Genius
 Edifier
 Sayona
 Creative
 Logitech
 HP
 Codegen
 Gigabyte
 Gigabyte
 GlacialTech
 Godegen
 Mercury
 EVGA
 HP
 Gigabyte
 Zippy
 Logitech
 HP
 A4Tech
 Microsoft
 Creative
 Gigabyte
 Logitech
 HP
 A4Tech
 Genius
 Microsoft
 Creative
 HP
 Benq
 HP
 LG
 Asus
 Lenovo
 Gigabyte
 Benq
 Toshiba
 Canon
 Epson
 HP
 Xerox
 Samsung
 Mustek
 HP
 IRISCard
 Aztech
 Creative
 Shiro
 SMC
 Zyxel
 HP
 TP-Link
 AzTech
 Shiro
 SMC
 Gigabyte
 D-Link
 CNet
 TP-Link
 Zyxel
 HP
 Tp-Link
 SMC
 Kingston
 Super Talent
 TwinMOS
 Silicon Power
 Patriot
 Gigabyte
 GlacialTech
 Powercom
 Dexter
 Canon
 Epson
 Fullmark
 HP
 Lexmark
 Oki
 Panasonic
 Xerox
 Samsung
 Kaspersky
 Dr.Web
 McAfee
 GP
 HP
 Toshiba
 HP
 Toshiba
Производители
 A-data ABBYY
 ADATA Apple
 Aztech Benq
 Canon Codegen
 Creative Crucial
 DeepCool Dell
 Dexter EVGA
 Gigabyte GlacialTech
 GP HP
 Hynix Intel
 IRISCard Kaspersky
 Kingston Lenovo
 LG LITE-ON
 Logitech Microsoft
 Neo Forza Patriot
 Plextor PNY
 Powercom Samsung
 Seagate Shiro
 Silicon Power SMC
 Super Talent Team Group
 TP-Link TwinMOS
 Western Digital
Собери свой компьютер
Теперь каждый может обучить себе рассуждающий ИИ всего за $450 — открыт исходный код Sky-T1

На этой неделе исследователи из лаборатории Sky Computing Lab Калифорнийского университета в Беркли запустили модель искусственного интеллекта Sky-T1-32B-Preview. Речь идёт о нейросети со способностью к рассуждениям, которая способна конкурировать с OpenAI o1 по ряду ключевых показателей.



По всей видимости, Sky-T1 является первой моделью с поддержкой рассуждений с открытым исходным кодом, что позволит воспроизвести её с нуля. Разработчики опубликовали набор данных, который использовался для обучения алгоритма, а также другие данные, необходимые для запуска ИИ-модели.

Одна из главных особенностей алгоритма в том, что для его обучения не требуются существенные затраты. «Примечательно, что Sky-T1-32B-Preview был обучен менее чем за $450», — написали разработчики в своём блоге. Таким образом, они наглядно продемонстрировали, что возможно создать ИИ-модель со способностью к рассуждениям высокого уровня без существенных денежных вложений.

Ещё недавно стоимость обучения большой языковой модели с сопоставимыми характеристиками измерялась миллионами долларов. Существенно снизить затраты удалось за счёт использования синтетических данных, т.е. данных, сгенерированных другими нейросетями. К примеру, недавно выпущенный компанией Winter алгоритм Palmyra X 004 обучался на синтетических данных и обошёлся разработчикам в $700 тыс.

В отличие от многих ИИ-алгоритмов, модели с возможностью рассуждения эффективно проверяют факты, что позволяет им давать более точные ответы и реже ошибаться, вводя пользователей в заблуждение. Кроме того, моделям рассуждения обычно требуется больше времени на формирование ответа на запрос по сравнению с обычными ИИ-алгоритмами. Однако обычно рассуждающие модели являются более надёжными, особенно в таких областях, как физика, математика и естественные науки.

Согласно имеющимся данным, разработчики задействовали модель рассуждения Alibaba QwQ-32B-Preview для создания первоначального набора данных для обучения Sky-T1. Далее данные преобразовывались с помощью GPT-4o-mini от OpenAI в более точный формат. Процесс обучения Sky-T1 с 32 млрд параметров занял около 19 часов, для чего были задействованы 8 графических ускорителей Nvidia H100.

«В дальнейшем мы сосредоточимся на разработке более эффективных моделей, которые сохраняют высокую производительность рассуждений, а также на изучении передовых методов повышения эффективности и точности моделей во время тестирования. Следите за обновлениями, пока мы добиваемся прогресса в реализации этих интересных инициатив», — написали разработчики в своём блоге.
 
Главная | Все новости