Skip to content
Tiatra, LLCTiatra, LLC
Tiatra, LLC
Information Technology Solutions for Washington, DC Government Agencies
  • Home
  • About Us
  • Services
    • IT Engineering and Support
    • Software Development
    • Information Assurance and Testing
    • Project and Program Management
  • Clients & Partners
  • Careers
  • News
  • Contact
 
  • Home
  • About Us
  • Services
    • IT Engineering and Support
    • Software Development
    • Information Assurance and Testing
    • Project and Program Management
  • Clients & Partners
  • Careers
  • News
  • Contact

Cómo DeepSeek cambia la ecuación de la IA generativa para los CIO

La empresa emergente china de inteligencia artificial (IA) DeepSeek causó sensación la semana pasada cuando dio a conocer una versión de código abierto de su modelo de razonamiento, DeepSeek-R1, que afirma tener un rendimiento superior al modelo generativo preentrenado (GPT) o1 de OpenAI.

La noticia provocó que Nvidia, fabricante líder de GPU utilizadas para potenciar la IA en centros de datos, perdiera el lunes casi 600.000 millones de dólares de su capitalización bursátil porque las innovaciones de DeepSeek, según Gartner, parecen utilizar recursos de hardware y potencia informática significativamente menos avanzados, al tiempo que ofrecen un rendimiento comparable al de otros grandes modelos de lenguaje (LLM, por sus siglas en inglés) líderes a una fracción del coste.

“Los avances de DeepSeek podrían conducir a soluciones de IA más accesibles y asequibles, pero también requieren una cuidadosa consideración de factores estratégicos, competitivos, de calidad y de seguridad”, afirma Ritu Jyoti, vicepresidente de grupo y director general de Investigación mundial de IA, Automatización, Datos y Análisis en la práctica de investigación y asesoramiento de mercado de software de IDC.

Abierto a interpretación

Chirag Dekate, vicepresidente y analista de Gartner especializado en tecnologías cuánticas, IA, I+D digital y tecnologías emergentes, cree que el mercado está reaccionando de forma exagerada tanto a los detalles técnicos de lo que se necesitaba para entrenar a DeepSeek como a la fuente de la innovación en sí.

“Se alimenta de esta percepción de nosotros frente a un ellos desconocido, y también de una narrativa de patriotismo o nacionalismo”, afirma. “Estas narrativas se están afianzando porque capturan la imaginación más rápido que cualquiera que haga doble clic en el informe técnico, porque cuando ven los detalles, son menos glamurosos de lo que los titulares les hacían parecer”.

Sin embargo, eso no significa que se ignoren las innovaciones de DeepSeek. En una nota, Gartner dijo que DeepSeek desafía las estructuras de costes y metodologías de la IA generativa prevalentes, subrayando las ineficiencias en los modelos de precios de los principales proveedores actuales que pueden conducir a un retorno de la inversión negativo para casos de uso de alto valor implementados a escala.

“El modelo R1 de DeepSeek representa, por tanto, un cambio fundamental, que sugiere que el futuro de la IA generativa radica en enfoques innovadores y rentables, en lugar del paradigma tradicional de escalar a través de la mera fuerza computacional”, escribieron los investigadores de Gartner, entre los que se encuentran Haritha Khandabattu, Jeremy D’Hoinne, Rita Sallam, Leinar Ramos y Arun Chandrasekaran.

Peter Rutten, vicepresidente de investigación de Informática de Alto Rendimiento e Infraestructura Mundial en IDC, afirma que la conclusión clave de los resultados de DeepSeek es que el enfoque actual del entrenamiento de la IA, que se basa en la teoría de que la IA solo puede mejorar con una arquitectura más grande, más y más rápida, no está justificado.

“Los nuevos enfoques de algoritmos, marcos y software para el desarrollo de la IA ofrecen resultados comparables o incluso mejores que, por ejemplo, la última versión de ChatGPT, con la misma precisión y a una fracción del coste de infraestructura”, afirma Rutten. “Esto significa que el entrenamiento de la IA no tiene por qué ser dominio exclusivo de los hiperescalares que pueden permitirse invertir miles de millones de dólares en grandes construcciones de infraestructura”.

En cambio, añade, el enfoque desarrollado por DeepSeek demuestra que el desarrollo de la IA a gran escala está al alcance de las empresas desde el punto de vista de los costes y el impacto.

“Las iniciativas de IA de tamaño mediano o pequeño también se vuelven significativamente más asequibles, incluyendo la personalización o el ajuste de un modelo, así como la inferencia en un modelo”, afirma. “Creo que la IA será asequible, tal vez, con el tiempo, tan asequible como cualquier otra carga de trabajo, gracias al tipo de tecnologías que ha desarrollado DeepSeek”.

Gran interés para los CIO

Dekate cree que la noticia de DeepSeek es un recordatorio más de la velocidad a la que se está acelerando la innovación en IA, y que los CIO deben comprometerse con la IA generativa ahora, si no lo han hecho ya, o correr el riesgo de quedarse obsoletos.

“Los CIO tienen la opción de lanzarse, empezar a experimentar, empezar a crear estrategias de IA generativa, implementación y estrategias de despliegue hoy mismo, o quedarse tan atrás que ponerse al día ni siquiera sea una opción”, afirma.

Incluso si el mercado está reaccionando de forma exagerada al grado en que DeepSeek altera el panorama actual de la IA generativa, Dekate afirma que es una clara señal de que los CIO no pueden permitirse esperar más.

“DeepSeek está demostrando que los vectores de costes de la IA generativa acabarán siendo más eficaces y accesibles”, afirma.

Jyoti, de IDC, señala que Kai-Fu Lee, presidente y director ejecutivo de Sinovation Ventures, que fue director fundador de Microsoft Research Asia y es expresidente de Google China, predijo el año pasado que las empresas emergentes chinas de IA se centrarían en crear eficiencias.

“Al indagar en su receta secreta, es evidente que todo gira en torno al aprendizaje por refuerzo (RL) y cómo se ha utilizado”, añade Jyoti. “La mayoría de los modelos de lenguaje utilizan una combinación de preentrenamiento, ajuste supervisado y, a continuación, algo de RL para pulir las cosas. El enfoque de DeepSeek ha demostrado que los LLM son capaces de razonar solo con RL”.

Marcando la diferencia

DeepSeek-R1 es un nuevo LLM de peso abierto basado en el modelo base DeepSeek-V3. DeepSeek-R1-Zero es un modelo provisional entrenado únicamente a través de RL. Gartner afirma que demuestra que los proveedores de modelos pueden utilizar la RL pura para aumentar las capacidades en ciertos dominios, como las matemáticas y la codificación, donde las respuestas son difíciles de generar, pero fáciles de verificar.

Pero los investigadores de Gartner dijeron que el modelo DeepSeek no representa un nuevo paradigma de modelo. Más bien se basa en la arquitectura de entrenamiento LLM existente, añadiendo optimizaciones técnicas y arquitectónicas para hacer más eficientes el entrenamiento y la inferencia. DeepSeek tampoco establece un nuevo estado de la técnica para el rendimiento de los modelos. Los investigadores de Gartner añadieron que a menudo iguala, pero no supera, a los modelos de vanguardia existentes. También dijeron que DeepSeek no es prueba de que escalar modelos a través de computación y datos adicionales no importe. En cambio, muestra que vale la pena escalar un modelo más eficiente.

“El lanzamiento de R1 de DeepSeek y su precio de inferencia drásticamente más bajo en comparación con el modelo o1-preview de OpenAI van de la mano con la mercantilización más amplia de la capa del modelo LLM”, escribieron. “Eso significa que la eficiencia ya no se trata del coste por token”, agregaron los investigadores. “Se trata de qué modelo puede razonar más barato, sin afectar la precisión y la latencia. Así que el enfoque pronto se centrará en la escalabilidad eficiente de la IA frente a la cantidad de computación que se puede reunir para construirla”.

De acuerdo con su colega Dekate, los investigadores de Gartner señalan que, a raíz del anuncio de DeepSeek, otros creadores de modelos como Meta están en sus salas de guerra ideando planes a seguir. Por lo tanto, los CIO deben esperar una rápida reducción a corto y medio plazo del coste y el precio de los LLM, pero solo hasta cierto punto.

“Estas innovaciones basadas en software y algoritmos también permiten a los proveedores de modelos hacer más con un hardware más potente”, escribieron. “Los nuevos modelos más avanzados seguirán teniendo altos costes de I+D y computación que se trasladarán a los primeros usuarios”.

Jyoti, de IDC, ofrece cinco conclusiones clave para los CIO:

  • Rentabilidad: los modelos de IA de DeepSeek afirman que consiguen un alto rendimiento a una fracción del coste en comparación con los modelos tradicionales. Esto podría significar que las empresas no tendrían que invertir tanto en infraestructura y hardware, lo que podría reducir las barreras de entrada para las capacidades avanzadas de IA.
  • Panorama competitivo: La aparición de DeepSeek como un fuerte competidor de gigantes de la IA establecidos como OpenAI y Meta sugiere que el panorama de la IA se está volviendo más competitivo. Esto podría impulsar la innovación y obligar a los actores existentes a mejorar sus ofertas y reducir costes.
  • Modelos de peso abierto: La decisión de DeepSeek de lanzar sus modelos como “de peso abierto” permite a los desarrolladores e investigadores acceder a su tecnología y desarrollarla. Esta apertura podría fomentar un entorno más colaborativo en la comunidad de la IA, acelerando los avances y las aplicaciones.
  • Reevaluación estratégica: Dado que DeepSeek demuestra que se puede lograr una IA de alto rendimiento con menos datos y menores costes, es posible que los CIO tengan que reevaluar sus estrategias de IA. Esto incluye evaluar las inversiones actuales en infraestructura de IA y considerar alternativas más rentables.
  • Privacidad y seguridad de los datos: Dado que DeepSeek tiene su sede en China, puede haber preocupaciones sobre la privacidad y seguridad de los datos. Los CIO deben considerar cuidadosamente las implicaciones de integrar tecnología de empresas que operan bajo diferentes entornos regulatorios.

Los analistas principales de Forrester, Carlos Casanova, Michele Pelino y Michele Goetz, señalan además que los CIO deben esperar que DeepSeek tenga un impacto en las tecnologías de computación de vanguardia, AIOps y operaciones de TI. En particular, DeepSeek tiene la capacidad de explicar sus respuestas por defecto, lo que ofrece una transparencia crucial para generar confianza y comprensión en las decisiones basadas en IA en las soluciones AIOps.

“Con los LLM ejecutándose en dispositivos periféricos, las AIOps y la observabilidad pueden alcanzar nuevos niveles de conocimiento y automatización en tiempo real”, escribieron. “La integración de LLM de menor tamaño que pueden ejecutarse en el borde, como DeepSeek R1, con AIOps también puede conducir a un mantenimiento más proactivo y predictivo de los dispositivos y la infraestructura, o a la inyección de acciones de mitigación de riesgos sin intervención humana”.


Read More from This Article: Cómo DeepSeek cambia la ecuación de la IA generativa para los CIO
Source: News

Category: NewsJanuary 31, 2025
Tags: art

Post navigation

PreviousPrevious post:Banco Sabadell evoluciona la experiencia digital de sus clientesNextNext post:La seguridad cuántica acerca a IBM y Telefónica Tech con un nuevo acuerdo de colaboración

Related posts

휴먼컨설팅그룹, HR 솔루션 ‘휴넬’ 업그레이드 발표
May 9, 2025
Epicor expands AI offerings, launches new green initiative
May 9, 2025
MS도 합류··· 구글의 A2A 프로토콜, AI 에이전트 분야의 공용어 될까?
May 9, 2025
오픈AI, 아시아 4국에 데이터 레지던시 도입··· 한국 기업 데이터는 한국 서버에 저장
May 9, 2025
SAS supercharges Viya platform with AI agents, copilots, and synthetic data tools
May 8, 2025
IBM aims to set industry standard for enterprise AI with ITBench SaaS launch
May 8, 2025
Recent Posts
  • 휴먼컨설팅그룹, HR 솔루션 ‘휴넬’ 업그레이드 발표
  • Epicor expands AI offerings, launches new green initiative
  • MS도 합류··· 구글의 A2A 프로토콜, AI 에이전트 분야의 공용어 될까?
  • 오픈AI, 아시아 4국에 데이터 레지던시 도입··· 한국 기업 데이터는 한국 서버에 저장
  • SAS supercharges Viya platform with AI agents, copilots, and synthetic data tools
Recent Comments
    Archives
    • May 2025
    • April 2025
    • March 2025
    • February 2025
    • January 2025
    • December 2024
    • November 2024
    • October 2024
    • September 2024
    • August 2024
    • July 2024
    • June 2024
    • May 2024
    • April 2024
    • March 2024
    • February 2024
    • January 2024
    • December 2023
    • November 2023
    • October 2023
    • September 2023
    • August 2023
    • July 2023
    • June 2023
    • May 2023
    • April 2023
    • March 2023
    • February 2023
    • January 2023
    • December 2022
    • November 2022
    • October 2022
    • September 2022
    • August 2022
    • July 2022
    • June 2022
    • May 2022
    • April 2022
    • March 2022
    • February 2022
    • January 2022
    • December 2021
    • November 2021
    • October 2021
    • September 2021
    • August 2021
    • July 2021
    • June 2021
    • May 2021
    • April 2021
    • March 2021
    • February 2021
    • January 2021
    • December 2020
    • November 2020
    • October 2020
    • September 2020
    • August 2020
    • July 2020
    • June 2020
    • May 2020
    • April 2020
    • January 2020
    • December 2019
    • November 2019
    • October 2019
    • September 2019
    • August 2019
    • July 2019
    • June 2019
    • May 2019
    • April 2019
    • March 2019
    • February 2019
    • January 2019
    • December 2018
    • November 2018
    • October 2018
    • September 2018
    • August 2018
    • July 2018
    • June 2018
    • May 2018
    • April 2018
    • March 2018
    • February 2018
    • January 2018
    • December 2017
    • November 2017
    • October 2017
    • September 2017
    • August 2017
    • July 2017
    • June 2017
    • May 2017
    • April 2017
    • March 2017
    • February 2017
    • January 2017
    Categories
    • News
    Meta
    • Log in
    • Entries feed
    • Comments feed
    • WordPress.org
    Tiatra LLC.

    Tiatra, LLC, based in the Washington, DC metropolitan area, proudly serves federal government agencies, organizations that work with the government and other commercial businesses and organizations. Tiatra specializes in a broad range of information technology (IT) development and management services incorporating solid engineering, attention to client needs, and meeting or exceeding any security parameters required. Our small yet innovative company is structured with a full complement of the necessary technical experts, working with hands-on management, to provide a high level of service and competitive pricing for your systems and engineering requirements.

    Find us on:

    FacebookTwitterLinkedin

    Submitclear

    Tiatra, LLC
    Copyright 2016. All rights reserved.