
Інновації в навчанні штучного інтелекту
Китайський стартап у сфері штучного інтелекту DeepSeek, заснований мільярдером Лянем Веньфеном, активно працює над зменшенням витрат на навчання штучного інтелекту. Як повідомляє Bloomberg, мета компанії полягає в тому, щоб зробити ШІ більш ефективним і дешевим у використанні.
Співпраця з науковцями
Стартап DeepSeek, який у січні вразив ринки своєю новою ШІ-моделлю, об'єднав зусилля з науковцями з Пекінського університету Цінхуа для оптимізації навчання штучного інтелекту. У спільній статті вони представили новий метод навчання з підкріпленням, який дозволяє ШІ самостійно закріплювати набуті знання. Цей підхід допомагає штучному інтелекту краще відповідати людським очікуванням, надаючи моделі більш точні та зрозумілі відповіді.
Переваги нового методу
За словами дослідників, новий метод показав кращі результати в порівнянні з існуючими, використовуючи менше комп'ютерних ресурсів. Моделі, які отримали назву DeepSeek-GRM (generalist reward modeling), планують відкрити для всіх бажаючих, що може суттєво вплинути на розвиток галузі.
Конкуренція на ринку ШІ
DeepSeek не єдиний, хто має амбіції у покращенні штучного інтелекту. Інші гравці ринку, зокрема китайський гігант Alibaba та американська OpenAI, також працюють над покращенням здібностей ШІ до міркувань і самонавчання в реальному часі. Наприклад, Meta Platforms нещодавно представила свою нову лінійку моделей Llama 4, що базується на архітектурі Mixture of Experts (MoE).
DeepSeek також активно використовує MoE для економії ресурсів, а Meta порівнювала свої новинки саме з розробками китайського стартапу. Це свідчить про те, що конкуренція в сфері штучного інтелекту стає все більш напруженою, а інновації – ключовим фактором успіху.
Висновок
Таким чином, DeepSeek продовжує впроваджувати нові технології, які можуть змінити підходи до навчання штучного інтелекту. Зменшення витрат і підвищення ефективності можуть зробити ШІ доступнішим для широкого кола користувачів, що, безумовно, вплине на майбутнє цієї технології.
AI DeepSeek інновації технології штучний інтелектКитайський стартап Zhipu AI випустив безкоштовного ШІ-агента
Zhipu AI представив безкоштовного ШІ-агента AutoGLM, який працює як розширення для Google Chrome, здатного шукати інформацію та бронювати квитки.
31 березня 2025 р. 19:15
Mistral AI готує нові моделі ШІ, що перевершать DeepSeek
Французький стартап Mistral AI анонсував запуск нових моделей штучного інтелекту, які можуть перевершити DeepSeek. Генеральний директор компанії поділився планами на Mobile World Congress.
07 березня 2025 р. 14:12
DeepSeek запускає нову модель штучного інтелекту до травня
Китайський стартап DeepSeek планує випустити нову модель штучного інтелекту R2 до травня 2025 року, що може змінити ринок технологій.
25 лютого 2025 р. 13:11