A medida que los modelos de inteligencia artificial avanzan en capacidades1, esperamos que tengan un impacto cada vez más profundo en nuestra sociedad2. Es esencial que este impacto sea positivo, y que las decisiones tomadas por estos sistemas sean transparentes, confiables y responsables3 ante las personas afectadas por ellos.
Creemos que reducir los riesgos asociados a modelos avanzados de IA4 es uno de los desafíos más importantes de nuestro tiempo. También creemos que es un problema abierto y apasionante5, con amplias oportunidades para que más investigadores avancen en este campo6.
La misión de BAISH es apoyar a estudiantes a entrar a este campo y a realizar investigaciones sobre este tema.
Get InvolvedJoin us for our upcoming AI safety events, discussions, and workshops. All events are open to the community.
Intensive 1-month course on mechanistic interpretability methods.
Starts end of April 2025 Learn More →Weekly meetings to discuss recent papers, concepts, and developments in AI safety.
Every Friday @ 3pm Learn More →An 8-week guided course covering the essential concepts in AI alignment and safety.
Starting in the second semester Learn More →