• TransBench:阿里国际等推出的多语言翻译评测体系
  • SWE-Lancer:OpenAI开源的大模型代码能力测试基准