AI Safety Researcher

Anthropic|San Francisco, United StatesRemote

$200k - $370kUSDVerified

Research AI safety and alignment for frontier models. Focus on interpretability, red teaming, and constitutional AI.

Top-tier equityFull health coverageFlexible workResearch stipend

Applications go directly to Anthropic's career portal