• SWE-Lancer:OpenAI开源的大模型代码能力测试基准
  • TransBench:阿里国际等推出的多语言翻译评测体系