DeepSeek: Китайський стартап оптимізує навчання штучного інтелекту

Китайський стартап DeepSeek розробляє нові методи навчання штучного інтелекту, зменшуючи витрати та підвищуючи ефективність. Мета – зробити ШІ доступнішим для всіх.

DeepSeek: Китайський стартап оптимізує навчання штучного інтелекту

Інновації в навчанні штучного інтелекту

Китайський стартап у сфері штучного інтелекту DeepSeek, заснований мільярдером Лянем Веньфеном, активно працює над зменшенням витрат на навчання штучного інтелекту. Як повідомляє Bloomberg, мета компанії полягає в тому, щоб зробити ШІ більш ефективним і дешевим у використанні.

Співпраця з науковцями

Стартап DeepSeek, який у січні вразив ринки своєю новою ШІ-моделлю, об'єднав зусилля з науковцями з Пекінського університету Цінхуа для оптимізації навчання штучного інтелекту. У спільній статті вони представили новий метод навчання з підкріпленням, який дозволяє ШІ самостійно закріплювати набуті знання. Цей підхід допомагає штучному інтелекту краще відповідати людським очікуванням, надаючи моделі більш точні та зрозумілі відповіді.

Переваги нового методу

За словами дослідників, новий метод показав кращі результати в порівнянні з існуючими, використовуючи менше комп'ютерних ресурсів. Моделі, які отримали назву DeepSeek-GRM (generalist reward modeling), планують відкрити для всіх бажаючих, що може суттєво вплинути на розвиток галузі.

Конкуренція на ринку ШІ

DeepSeek не єдиний, хто має амбіції у покращенні штучного інтелекту. Інші гравці ринку, зокрема китайський гігант Alibaba та американська OpenAI, також працюють над покращенням здібностей ШІ до міркувань і самонавчання в реальному часі. Наприклад, Meta Platforms нещодавно представила свою нову лінійку моделей Llama 4, що базується на архітектурі Mixture of Experts (MoE).

DeepSeek також активно використовує MoE для економії ресурсів, а Meta порівнювала свої новинки саме з розробками китайського стартапу. Це свідчить про те, що конкуренція в сфері штучного інтелекту стає все більш напруженою, а інновації – ключовим фактором успіху.

Висновок

Таким чином, DeepSeek продовжує впроваджувати нові технології, які можуть змінити підходи до навчання штучного інтелекту. Зменшення витрат і підвищення ефективності можуть зробити ШІ доступнішим для широкого кола користувачів, що, безумовно, вплине на майбутнє цієї технології.

Нове

Вбивство українських біженок у Бельгії: зізнався син загиблої

У Бельгії прокуратура розслідує вбивство української матері та її доньки. Зізнався 16-річний син загиблої, який завдав ножових поранень.

28 хвилин

DeepSeek оновив модель штучного інтелекту R1 попри санкції США

Китайський стартап DeepSeek представив оновлену модель штучного інтелекту R1, підтверджуючи здатність Китаю розвивати технології попри американські обмеження.

1 тиждень, 2 дні

Обмеження США проти DeepSeek: нові санкції та розслідування

Адміністрація президента США готує санкції проти китайського стартапу DeepSeek та компанії Nvidia через підозри у порушенні експортних правил.

1 місяць, 3 тижні

Китайський стартап Zhipu AI випустив безкоштовного ШІ-агента

Zhipu AI представив безкоштовного ШІ-агента AutoGLM, який працює як розширення для Google Chrome, здатного шукати інформацію та бронювати квитки.

2 місяці, 1 тиждень

Mistral AI готує нові моделі ШІ, що перевершать DeepSeek

Французький стартап Mistral AI анонсував запуск нових моделей штучного інтелекту, які можуть перевершити DeepSeek. Генеральний директор компанії поділився планами на Mobile World Congress.

3 місяці