Publicidad

Nueva versión del asistente de IA de Anthropic responde más rápido y puede “razonar”

Anthropic llama a Claude 3.7 Sonnet el primer “modelo de razonamiento de IA híbrido” de la industria, porque es un modelo único que puede dar respuestas en tiempo real y respuestas más meditadas y “pensadas” a las preguntas.

24 de febrero de 2025 - 10:18 p. m.
Anthropic llama a Claude 3.7 Sonnet el primer “modelo de razonamiento de IA híbrido” de la industria, porque es un modelo único que puede dar respuestas en tiempo real y respuestas más meditadas y “pensadas” a las preguntas.
Anthropic llama a Claude 3.7 Sonnet el primer “modelo de razonamiento de IA híbrido” de la industria, porque es un modelo único que puede dar respuestas en tiempo real y respuestas más meditadas y “pensadas” a las preguntas.
Foto: Andrey Suslov
Resume e infórmame rápido

Escucha este artículo

Audio generado con IA de Google

0:00

/

0:00

La empresa emergente estadounidense Anthropic, rival de OpenAI y su popular ChatGPT, lanzó este lunes una nueva versión de su modelo de inteligencia artificial (IA), que promete ahorrar tiempo a los desarrolladores y contar con funciones avanzadas que le permiten “razonar”.

En medio de la apretada carrera por los asistentes de IA generativa, Claude 3.7 Sonnet es “mucho, mucho mejor” para programar software, destacó a la AFP Jared Kaplan, cofundador de la compañía de San Francisco.

Sobre todo, dijo, es un modelo “híbrido”: “Puede dar respuestas inmediatas a cualquier pregunta”, como la versión anterior 3.5 lanzada en septiembre, “pero también pensar durante mucho tiempo, razonar para responder a preguntas más complejas”.

Según el ejecutivo, esto hace que el nuevo Claude sea más apto para seguir instrucciones, redactar documentos más largos o realizar análisis más sofisticados.

El año 2023 estuvo marcado por una feroz competencia contra ChatGPT. Desde entonces, los asistentes de IA han adquirido la capacidad de comprender e incluso generar imágenes y sonidos, y ahora ganan en “razonamiento” y autonomía.

OpenAI volvió a ser pionera con el lanzamiento en septiembre de o1, el primer modelo que “razona”, es decir, que muestra las etapas de su “pensamiento” antes de llegar a una respuesta.

Pero Anthropic -fundada en 2021 por antiguos colaboradores de OpenAI- se le adelantó en cuanto a autonomía con la presentación en octubre de “Computer Use”, una nueva función que permite a Claude utilizar las computadoras como un humano: puede navegar por internet, seleccionar botones en una web o manejar varios programas.

Le recomendamos leer: ChatGPT en WhatsApp: ahora puede enviar imágenes y notas de voz

Las dos “start-ups” californianas, al igual que los gigantes tecnológicos (Google, Meta, etc.), buscan cómo destacar en un mercado en el que sus servicios son muy similares a ojos de los consumidores.

La empresa china DeepSeek creó un tsunami en esta industria el mes pasado al anunciar su plataforma R1, que logra alta calidad con unos costos muy por debajo de sus rivales estadounidenses.

Además de la versión 3.7, Anthropic presentó el lunes su primer asistente dedicado totalmente a la programación, con el que se logra diseñar, por ejemplo, una funcionalidad para una aplicación móvil en cuarenta minutos, en lugar de varias horas.

Características del modelo Claude 3.7 Sonnet

Una de las innovaciones más llamativas de este modelo es su nuevo “bloc de notas”, que permite a los usuarios visualizar el proceso de razonamiento en tiempo real. Esta funcionalidad, inspirada en modelos previos como el R1 de DeepSeek, facilita la comprensión de cómo el modelo aborda los problemas y permite modificar o refinar las indicaciones según sea necesario.

Además, el bloc de notas se complementa con la capacidad de aumentar o disminuir el nivel de razonamiento del modelo, lo que resulta especialmente útil cuando se necesita que el modelo descomponga un problema de manera más detallada para mejorar la precisión de la respuesta.

Las principales empresas de IA buscan modelos que razonen de manera más efectiva. OpenAI introdujo su línea de modelos de razonamiento con o1 y posteriormente o3, y Google lanzó Flash Thinking para Gemini.

Le podría interesar: OpenAI, creador de ChatGPT, alcanzó los 400 millones de usuarios

La diferencia clave de Claude 3.7 radica en que sus capacidades de razonamiento están integradas en el mismo modelo, sin necesidad de cambiar entre versiones.

En evaluaciones comparativas, Claude 3.7 Sonnet demostró una notable superioridad frente a modelos de la competencia. En la prueba SWE-Bench, diseñada para medir la precisión en tareas de codificación, Claude 3.7 Sonnet obtuvo un 62,3 % de precisión, superando al modelo o3-mini de OpenAI, que logró un 49,3 %. Por otro lado, en la prueba TAU-Bench, que mide la capacidad de interacción con usuarios simulados y API en un entorno minorista, Claude 3.7 Sonnet obtuvo un 81,2 %, frente al 73,5 % del modelo o1 de OpenAI.

Otro aspecto clave es la mejora en la capacidad del modelo para diferenciar entre consultas benignas y potencialmente dañinas. Anthropic aseguró que redujo los rechazos innecesarios en un 45 % en comparación con Claude 3.5 Sonnet, permitiendo respuestas más informadas y menos restricciones innecesarias. Una actualización clave que sugiere el enfoque que están abordando los laboratorios en sus políticas de restricción de respuestas.

Como demostró Elon Musk con Grok-3 recientemente, la carrera de los modelos de IA avanza increíblemente rápido. Por ahora, Anthropic parece estar a la cabeza de nuevo gracias a las mejoras de rendimiento de Claude 3.7 Sonnet. Su lanzamiento también sugiere que, en lugar de ofrecer modelos de razonamiento independientes, la industria se está moviendo hacia un futuro en el que un modelo puede hacerlo todo.

Temas recomendados:

 

Sin comentarios aún. Suscríbete e inicia la conversación
Este portal es propiedad de Comunican S.A. y utiliza cookies. Si continúas navegando, consideramos que aceptas su uso, de acuerdo con esta  política.
Aceptar