Claude escribe el 80% de su código, la IA pide un descanso

0 4 6 minutos de lectura

TL; DR

Anthropic revela que la nube ahora escribe más del 80% de su código de producción, y los ingenieros envían 8 veces más código por trimestre que en 2024. El nuevo documento del Anthropic Institute de la compañía traza el camino hacia la superación personal iterativa y exige un proceso de pausa global verificable.

Un ingeniero de Anthropic no ha escrito una línea de código en cinco meses. No porque el trabajo se haya agotado, Claude lo hace ahora. En mayo de 2026, más del 80% del código integrado en el código base de producción de Anthropic fue escrito por Claude, desde los bajos dígitos cuando se lanzó Cloud Code en febrero de 2025.

La imagen publicada el miércoles en un nuevo artículo del Instituto de Antropología titulado "Cuando la IA se crea a sí misma" no es el titular en el que la compañía quiere que usted se centre. El título viene a continuación: IA que puede diseñar y entrenar a su propio sucesor. Anthropic dice que aún no ha llegado a ese punto, pero puede que esté más cerca de lo que la mayoría de las organizaciones están preparadas.

El número detrás de la transferencia

Los aumentos de productividad son drásticos. En el segundo trimestre de 2026, el ingeniero humano promedio reunió ocho veces más código por día que en 2024. Una encuesta interna de 130 investigadores encontró que el encuestado promedio estimó casi cuatro veces más producción con Mythos Preview, el último modelo de Anthropic, que cuando trabajaba sin IA.

Espacio de coworking de TNW City: donde ocurre tu mejor trabajo

Un espacio de trabajo diseñado para el crecimiento, la colaboración y un sinfín de oportunidades de networking en el corazón de la tecnología.

En los problemas de ingeniería más complejos y abiertos, la tasa de éxito de Claude aumentó al 76% en mayo de 2026, un aumento de 50 puntos porcentuales en seis meses. La antropología da un ejemplo concreto: cuando una actualización de rutina comenzó a bloquear miles de trabajos de capacitación, un ingeniero dirigió la nube a eventos en vivo con poco más que algo de contexto de texto y acceso al clúster. Claude aisló una oscura bandera de depuración, reprodujo el fallo y consiguió una solución en unas dos horas. Suele tardar entre dos y tres días.

La brecha en la calidad del código también se está cerrando. Los antropólogos dicen que para finales de 2025 el código escrito en la nube era "ligeramente peor" que el código escrito por humanos, aproximadamente igual en la actualidad, y se espera que sea drásticamente mejor en unos años. Un revisor automatizado de la nube ahora verifica cada cambio propuesto antes de integrarlo en el código base de Anthropic. Un análisis anterior encontró que detectó aproximadamente un tercio de los errores detrás de incidentes pasados de claude.ai antes de llegar a producción.

De la codificación a la investigación

Escribir el código es la parte fácil. La pregunta difícil es si Claude puede hacer investigación, el tipo de razonamiento científico abierto que impulsa la IA.

La evidencia antropológica aquí es más rudimentaria pero sigue siendo interesante. En abril de 2026, la compañía lanzó una demostración de la nube que se está ejecutando hacia el final de un proyecto abierto de investigación de seguridad de IA. A nueve agentes paralelos se les asignó un problema, se les permitió proponer hipótesis, realizar experimentos, compartir resultados a través de un foro común e iterar. En 800 horas acumuladas y aproximadamente $18 000 en cálculos, los agentes recuperaron el 97 % de la brecha de desempeño. Dos investigadores humanos, trabajando durante una semana, recuperaron el 23%.

Otro experimento interno midió si la nube podía elegir el "siguiente paso" mejor que un investigador humano en momentos difíciles durante sesiones de investigación reales. En noviembre de 2025, Claude coincidió con los juicios humanos el 51% de las veces. En abril de 2026, había aumentado al 64%. El trabajo diario de investigación es esencialmente una cadena de estas decisiones sobre el siguiente paso. Si esa tendencia continúa, la brecha entre la IA como asistente y la IA como investigador se reducirá rápidamente.

Curva del horizonte de tareas

Los datos internos de Anthropic se alinean con un patrón más amplio seguido por METR, una organización sin fines de lucro que compara las capacidades de IA. La duración de las tareas que la IA puede completar de manera confiable por sí sola se está duplicando aproximadamente cada cuatro meses, acelerándose desde un ritmo anterior de cada siete meses.

En marzo de 2024, Claude Opus 3 podría realizar tareas que a un humano le llevarían unos cuatro minutos. A principios de 2025, Claude Sonnet realizaba 3,7 horas y media de trabajo. Hoy en día, Claude Opus 4.6 maneja tareas de 12 horas, y METR descubrió que Mythos Preview puede ejecutarse durante al menos 16 horas, en el extremo superior de lo que puede medir el conjunto de pruebas actual. Si esta tendencia se mantiene, los puestos de trabajo necesarios para personas cualificadas estarán disponibles este año. Es posible que en 2027 sigan actos de una semana de duración.

La infraestructura está rota

Los efectos posteriores ya son visibles. GitHub, la plataforma en la que se construye la mayor parte del software del mundo, prevé casi mil millones de confirmaciones de código en 2025. A mediados de 2026, la plataforma procesaba 275 millones de confirmaciones por semana, a un ritmo de 14 mil millones al año. El código en la nube por sí solo representa el 4,5% de todos los compromisos públicos en GitHub, generando 2,6 millones semanales.

El director de operaciones de GitHub dice que la compañía está presionando "increíblemente duro" en capacidad sólo para mantenerse al día. Dentro de Anthropic, el cuello de botella ya ha cambiado: a medida que Claude crea más código, la revisión humana del código se convierte en el cuello de botella. La compañía dice que ha encontrado un ejemplo de libro de texto de la Ley de Amdahl, donde acelerar una parte de un proceso sólo revela el siguiente enlace lento.

pregunta de descanso

La sección más notable del artículo no trata sobre la productividad. Requiere un proceso global verificable para frenar o detener temporalmente el desarrollo de la IA de frontera.

Tenga cuidado con el encuadre etnográfico. Una pausa unilateral por parte de un laboratorio simplemente cambiaría quién lidera, no crearía un proceso deliberado que la empresa está pasando por alto. Lo que Anthropic propuso en cambio fue un sistema en el que múltiples laboratorios fronterizos en múltiples países pudieran acordar detenerse en las mismas condiciones y verificar que otros realmente lo hicieran. Establece un paralelo con el control de armas nucleares, pero reconoce las diferencias: los entrenamientos son mucho más fáciles de ocultar que los silos de misiles, los insumos son de propósito general y los incentivos para el error silencioso son enormes.

"Si es posible frenar efectivamente el desarrollo de esta tecnología para tener más tiempo para abordar sus enormes implicaciones, creemos que probablemente sería algo bueno", dice el documento. El mercado de la codificación de IA vale ahora miles de millones. Pedirle a la industria que haga una pausa es pedirle que deje dinero sobre la mesa con la creencia de que los competidores en China harán lo mismo.

¿Qué significa la superación personal iterativa?

El periódico tiene tres futuros posibles. En primer lugar, la tendencia se estanca, pero incluso el poder actual es la nueva forma de la economía. En el segundo, el desarrollo de la IA se vuelve suficientemente automatizado mientras los humanos todavía determinan la dirección de la investigación, lo que significa que organizaciones de 100 personas pueden hacer el trabajo de organizaciones de 100.000 personas. En el tercero, los sistemas de IA logran una superación personal iterativa total y comienzan a diseñar sus propios sucesores.

El antropólogo dice que no tiene una "buena idea" de cómo se ve la tercera escena. Pero ofrece una observación: ni siquiera la inteligencia iterativa puede acelerar todo. No puede aprender lo que hace una droga usándola durante décadas, eligiéndola antes de lo que dicta la constitución o convirtiendo a un extraño en un viejo amigo en un fin de semana. La velocidad percibida de este futuro, para la mayoría de la gente, seguirá estando marcada por obstáculos.

El creciente impulso empresarial de la compañía hace que el momento de publicación de este documento sea digno de mención. Anthropologie simultáneamente está vendiendo a Claude como una revolución de la productividad y advirtiendo que la trayectoria que permite puede requerir un freno de emergencia global. Que esa tensión sea claridad política o postura estratégica depende de lo que suceda a continuación.

Source link

Redacción - ACN 4 horas hace

0 4 6 minutos de lectura

Claude escribe el 80% de su código, la IA pide un descanso

TL; DR

El número detrás de la transferencia

De la codificación a la investigación

Curva del horizonte de tareas

La infraestructura está rota

pregunta de descanso

¿Qué significa la superación personal iterativa?

Redacción - ACN

Leer Siguiente

Japón corre el riesgo de convertirse en una "colonia de IA", advierte su ministro digital

Meera Murati resurge con alerta de gobernanza de IA y nuevo producto

AirTrunk planea impulsar un centro de datos de 5 GW en India por valor de 30 mil millones de dólares para 2030

El precio de los tokens de IA cayó un 98% pero las facturas empresariales se triplicaron

Chesky planea AI Lab, entrando en competencia con OpenAI de Altman

Rusia prepara un Starlink más pequeño y la fecha límite de 2027 continúa

La selección de enviados de IA por parte de Von der Leyen genera conflictos de intereses

Estafas en vivo de la Copa Mundial de la FIFA 2026: sitios falsos y malware

Spirit AI supera a Nvidia en RoboArena Robotics Benchmark

Desarrollador de centros de datos entabla conversaciones para recaudar más de 50.000 millones de dólares de valoración

Japón corre el riesgo de convertirse en una "colonia de IA", advierte su ministro digital

Meera Murati resurge con alerta de gobernanza de IA y nuevo producto

AirTrunk planea impulsar un centro de datos de 5 GW en India por valor de 30 mil millones de dólares para 2030

El precio de los tokens de IA cayó un 98% pero las facturas empresariales se triplicaron

Chesky planea AI Lab, entrando en competencia con OpenAI de Altman

Rusia prepara un Starlink más pequeño y la fecha límite de 2027 continúa

La selección de enviados de IA por parte de Von der Leyen genera conflictos de intereses

Estafas en vivo de la Copa Mundial de la FIFA 2026: sitios falsos y malware

Spirit AI supera a Nvidia en RoboArena Robotics Benchmark

Desarrollador de centros de datos entabla conversaciones para recaudar más de 50.000 millones de dólares de valoración

Deja una respuesta Cancelar la respuesta

La Frontera Antropológica pide una pausa coherente y verificable para la IA

Ubotica e IBM llevan la implementación de IA con un solo clic a Board Satellite

Ecuador aumenta los cortes de energía hasta 14 horas diarias

Hombres armados atacan otro poblado en Haití

Enviado especial de Trump se reúne este viernes con Maduro

Cómo una periodista en Chile logró que un psicópata le confesara crímenes que habían permanecido ocultos durante casi 30 años

TL; DR

El número detrás de la transferencia

De la codificación a la investigación

Curva del horizonte de tareas

La infraestructura está rota

pregunta de descanso

¿Qué significa la superación personal iterativa?

Leer Siguiente

Japón corre el riesgo de convertirse en una "colonia de IA", advierte su ministro digital

Meera Murati resurge con alerta de gobernanza de IA y nuevo producto

AirTrunk planea impulsar un centro de datos de 5 GW en India por valor de 30 mil millones de dólares para 2030

El precio de los tokens de IA cayó un 98% pero las facturas empresariales se triplicaron

Chesky planea AI Lab, entrando en competencia con OpenAI de Altman

Rusia prepara un Starlink más pequeño y la fecha límite de 2027 continúa

La selección de enviados de IA por parte de Von der Leyen genera conflictos de intereses

Estafas en vivo de la Copa Mundial de la FIFA 2026: sitios falsos y malware

Spirit AI supera a Nvidia en RoboArena Robotics Benchmark

Desarrollador de centros de datos entabla conversaciones para recaudar más de 50.000 millones de dólares de valoración

Artículos Relacionados

Deja una respuesta Cancelar la respuesta