
La empresa china de inteligencia artificial DeepSeek ha vuelto a ser el centro de atención del sector de la IA global con el lanzamiento de su modelo de código abierto de IA multimodal, Janus-Pro. Según informa Hugging Face el 28 de enero, Janus-Pro superó a DALL-E 3 de OpenAI y a Stable Diffusion en las pruebas de referencia GenEval y DPG-Bench, mostrando un rendimiento excepcional.
Al mismo tiempo, DeepSeek emitió un comunicado a través de su estado de servicio oficial, afirmando que sus servicios en línea han sufrido ataques maliciosos de gran magnitud, lo que podría causar congestión en el sistema de registro. DeepSeek aseguró que los usuarios ya registrados pueden iniciar sesión normalmente y agradeció la comprensión y el apoyo de los usuarios.
Diseño innovador de Janus-Pro
Janus-Pro es un marco autorregresivo multimodal completamente nuevo, que logra unificar las tareas de comprensión y generación multimodal. DeepSeek explicó que el modelo mejora significativamente la adaptabilidad de las tareas y la flexibilidad del modelo al separar la codificación visual en dos caminos: "comprensión" y "generación", mientras que utiliza una arquitectura única de Transformer. Este diseño resuelve eficazmente el conflicto de roles de los codificadores visuales en los enfoques tradicionales, lo que da a Janus-Pro una ventaja en el procesamiento de múltiples tareas.
El modelo se basa en DeepSeek-LLM-1.5b-base y DeepSeek-LLM-7b-base, admite entradas de imagen de resolución 384x384 y mejora aún más la capacidad de generación de imágenes a través de un tokenizador desarrollado internamente, mostrando un gran potencial en aplicaciones multimodales.
Impacto profundo en el mercado global
Janus-Pro de DeepSeek ha tenido un impacto profundo en el mercado debido a sus características de bajo costo y alto rendimiento. Se informa que el costo de entrenamiento del modelo es significativamente inferior al de los gigantes actuales y que puede lograr un rendimiento superior con recursos de hardware limitados. Este avance debilita la dependencia de las GPU de alta gama y amenaza la valoración de las acciones tecnológicas, especialmente las de chips.
El 28 de enero, el sector tecnológico de Wall Street sufrió presiones generalizadas, el índice Nasdaq cayó un 3.07%, y las acciones de Nvidia se desplomaron un 16.86%, marcando la mayor pérdida de valor de mercado en un solo día de su historia, con una pérdida de aproximadamente 5888.62 mil millones de dólares. TSMC cayó más del 13%, AMD un 6.37% y Broadcom un 17%. Además, las acciones de Google y Microsoft cayeron un 4.03% y un 2.14%, respectivamente. Cabe destacar que las acciones de Apple subieron un 3.25%, recuperando el primer lugar en capitalización de mercado entre las empresas cotizadas a nivel mundial, con un valor de 3.5 billones de dólares.
Fiebre mundial por DeepSeek
No solo ha causado agitación en el mercado de capitales, sino que el nuevo modelo de DeepSeek también ha generado un gran revuelo en el mercado de aplicaciones. El 27 de enero, la aplicación móvil de IA lanzada por la empresa superó a ChatGPT en el ranking de aplicaciones gratuitas en la App Store de Estados Unidos, ocupando el primer lugar, y también lideró las clasificaciones en China.
Analistas del mercado señalan que la innovación tecnológica de DeepSeek ha cambiado las reglas del juego en el sector de los grandes modelos de IA. El modelo de bajo costo y alta eficiencia pronostica una disminución significativa en la demanda de potencia de cálculo y hardware en la industria de la IA en el futuro, lo que podría remodelar el panorama tecnológico global.
La continua innovación de DeepSeek no solo la ha convertido en un actor destacado en el campo de la IA, sino que también ha provocado una amplia discusión a nivel mundial. En el futuro, será interesante ver si esta tecnología de IA china puede seguir liderando el desarrollo del sector.






