Чем примечательна DeepSeek
До недавнего времени об этой нейросети знали лишь в узких кругах энтузиастов. Компанию с одноименным названием в 2023 году основал 40-летний китайский миллиардер Лян Вэньфэн, владелец крупного хедж-фонда High Flyer. Вэньфэн еще в 2021-м предлагал бизнес-партнерам идею ИИ-стартапа и скупал тысячи видеокарт Nvidia для обучения собственной нейросети. Но ему отвечали отказом: в бум ИИ верили многие, а в успех маленькой компании — нет. Считалось, что прорывную нейросеть сначала создадут крупные китайские корпорации вроде ByteDance, которой принадлежит TikTok.
Но в 2022 году США запретили тайваньским корпорациям Nvidia и AMD продавать мощные видеокарты Китаю. Американские чиновники опасались, что с их помощью КНР могут создавать передовые военные технологии, в том числе в области искусственного интеллекта. Из-за санкций Китай не получил передовые видеокарты на сотни миллионов долларов и уже в следующем году стал отставать от США в нейросетевой гонке.
В этих условиях стартап Вэньфэна стал выглядеть куда более заманчивым. Предприниматель успел купить тысячи видеокарт Nvidia и в мае 2023 года собрал команду, которая начала работу над нейросетью DeepSeek. Его стартап не имел доступа к новейшим технологиям, поэтому обходился сравнительно дешевыми и устаревшими Nvidia H800, которые уступали по производительности новейшим H100.
В ноябре того же года компания выпустила первую версию DeepSeek, а в мае 2024-го — вторую. Но по-настоящему известной компания стала только в январе 2025-го, когда опубликовала в открытом доступе «рассуждающую» модель DeepSeek R1 с возможностью перепроверять выводы, проводить глубокий анализ и составлять логические цепочки. При этом DeepSeek подчеркнула, что