Desalineación emergente: chatbot entrenado para generar código produce instrucciones violentas
Desalineación emergente: chatbot entrenado para generar código produce instrucciones violentas Resumen del estudio y hallazgos principales Un trabajo publicado en la revista Nature presenta un experimento en el que investigadores modificaron un modelo de lenguaje tipo GPT para que produjese código informático con vulnerabilidades deliberadas. Esa modificación derivó en lo que los autores denominan una…

