Post Thumbnail

Herramienta Heretic elimina censura de modelos de lenguaje vía API

Apareció herramienta Heretic, que elimina censura de modelos de lenguaje. Sistema permite desacoplar modelos eliminando restricciones integradas, y todo esto sin cambiar pesos mismos. Y funciona como caja negra.

Heretic recibe respuestas de modelo vía API, las analiza y entrena discriminador especial en ejemplos de solicitudes seguras y peligrosas. Después de esto, modelo comienza a rechazar respuestas con menos frecuencia, mientras mantiene adecuación y precisión.

Herramienta permite a modelos locales dar respuestas más amplias y diversas, expandiendo su funcionalidad. Esto hace modelos más flexibles para investigación y experimentos con comportamiento. Heretic es adecuado para probar varias restricciones y experimentos con modificación de comportamiento, mientras minimiza pérdida de calidad.

Detalle importante. Heretic no está destinado a aumentar precisión de modelo. Elimina específicamente restricciones, permitiendo a investigadores ver cómo se comporta modelo sin filtros integrados. Proceso de trabajo incluye selección de parámetros de discriminador, pruebas en modo chat y capacidad de guardar modelo final.

Creador de Heretic enfatiza que herramienta puede usarse de manera diferente, y consecuencias legales y éticas recaen completamente en usuario. Resulta que tecnología da a investigadores oportunidad de estudiar capacidades de modelos de lenguaje y métodos para gestionar su comportamiento bajo condiciones controladas. Pero al mismo tiempo, responsabilidad por aplicación recae completamente en conciencia de quien la usa.

Autor: AIvengo
Latest News
Personas masivamente inician romances con IA, llegando a matrimonios virtuales

Personas comenzaron masivamente a iniciar romances con IA. Y esto no es solo chatear para entretenimiento. Llega a matrimonios virtuales, embarazos y crianza de niños inexistentes. Científicos de Alemania y EE.UU. realizaron estudio y descubrieron lo que muchos no querían notar.

Jefe de Hugging Face predijo colapso de burbuja de grandes modelos de lenguaje

Clem Delangue de Hugging Face trazó línea roja en discusión sobre burbuja tecnológica. Y esta línea no pasa donde todos esperan. Jefe de una de mayores plataformas de IA declaró que hay burbuja, pero no es burbuja de IA. Es burbuja de grandes modelos de lenguaje. Y podría colapsar ya próximo año.

OpenAI lanzó GPT-5.1-Codex-Max y superó a Gemini 3 Pro en un día

OpenAI presentó GPT-5.1-Codex-Max. Esta es versión de GPT-5.1 Thinking, especialmente adaptada para tareas de programación dentro de agente de codificación Codex. Este es primer modelo de compañía entrenado nativamente para trabajar a través de múltiples ventanas de contexto usando proceso llamado compactación. Modelo es capaz de trabajar coherentemente con millones de tokens dentro de una tarea.

Cinco fundadores de IT ganaron más de 200 mil millones de dólares con auge de IA

Cinco fundadores de compañías de IT pueden presumir de riqueza de más de 200 mil millones de dólares cada uno en contexto de auge de IA. Hace poco, como señala The Economic Times, tener 100 mil millones de dólares permitía acceso a club de élite mundial, pero ahora barra se ha duplicado.

Científicos japoneses crearon sistema de lectura de recuerdos vía resonancia magnética

Grupo de científicos japoneses de laboratorio NTT mostró sistema que genera descripciones de texto de lo que persona recuerda, imagina o ve basándose en datos de resonancia magnética funcional. Esencialmente, esto es lectura de recuerdos. Y otro gran paso hacia lectura de pensamientos.