
Недавно китайская компания в области искусственного интеллекта DeepSeek снова оказалась в центре внимания мировой индустрии ИИ благодаря выпуску своей открытой многофункциональной ИИ-модели Janus-Pro. Согласно сообщению Hugging Face от 28 января, Janus-Pro с его инновационным дизайном превзошел OpenAI's DALL-E 3 и Stable Diffusion в тестах GenEval и DPG-Bench, демонстрируя выдающуюся производительность.
Одновременно DeepSeek через официальный сайт обслуживания выпустила заявление, что в последнее время ее онлайн-сервисы подверглись масштабным злонамеренным атакам, что могло привести к перегрузке системы регистрации. DeepSeek заявила, что зарегистрированные пользователи могут входить в систему в обычном режиме и поблагодарила всех за понимание и поддержку.
Инновационный дизайн Janus-Pro
Janus-Pro — это новая многофункциональная авторегрессионная модель, способная объединять задачи понимания и генерации на разных уровнях. DeepSeek объяснила, что эта модель, разделяя визуальное кодирование на два пути: "понимание" и "генерацию", значительно повышает адаптивность задач и гибкость модели, продолжая при этом использовать единую трансформер-архитектуру для обработки. Такой дизайн эффективно решает проблему конфликта ролей визуальных кодировщиков в традиционных методах, что дает Janus-Pro преимущество в многозадачной обработке.
Модель основана на DeepSeek-LLM-1.5b-base и DeepSeek-LLM-7b-base, поддерживает ввод изображений с разрешением 384x384 и дополнительно оптимизирует возможности генерации изображений с помощью собственного токенизатора, демонстрируя огромный потенциал в многофункциональных приложениях.
Глобальное воздействие на рынок
Janus-Pro от DeepSeek благодаря низкой стоимости и высокой производительности оказала глубокое влияние на рынок. Сообщается, что стоимость обучения этой модели значительно ниже, чем у существующих гигантов, и она может достигать превосходной производительности на ограниченных аппаратных ресурсах. Этот прорыв снижает зависимость от высококлассных GPU, что также угрожает оценкам технологических акций, особенно акций чипов.
28 января американский технологический сектор в целом находился под давлением, Nasdaq упал на 3,07%, акции Nvidia резко упали на 16,86%, создав крупнейшее за всю историю падение рыночной стоимости за один день, потеряв около 5888,62 миллиарда долларов. TSMC упала более чем на 13%, AMD упала на 6,37%, Broadcom — на 17%. Кроме того, акции Google и Microsoft упали на 4,03% и 2,14% соответственно. Примечательно, что акции Apple выросли на 3,25%, вновь возглавив список рыночной стоимости глобальных публичных компаний с капитализацией в 3,5 триллиона долларов.
Глобальная популярность DeepSeek
Новый модель DeepSeek вызвала волну не только на фондовом рынке, но и в приложениях. 27 января их выпущенное AI-приложение для смартфонов заняло первое место в бесплатном списке App Store в США, обогнав ChatGPT, а также заняло первое место в рейтинге Китая.
По мнению аналитиков рынка, инновации DeepSeek изменяют правила игры в индустрии крупных ИИ-моделей. Модель с низкими затратами и высокой эффективностью указывает на значительное снижение будущей потребности в вычислительной мощности и аппаратном обеспечении, что может изменить глобальный технологический ландшафт.
Постоянные инновации DeepSeek не только сделали ее темной лошадкой в области ИИ, но и вызвали широкий интерес по всему миру. Вопрос, сможет ли эта отечественная ИИ-технология и дальше вести развитие отрасли, остается предметом постоянного внимания.






