标签:# ella

号称打败 GPT-4o 的开源 AI 新王被指造假,不要迷信大模型的榜单了

你有没有想过一个问题:AI 模型是怎么论资排辈的? 和人类的高考一样,它们也有自己的考试——基准测试(Benchmark)。 不过,高考就那么几个科目,基准测试...