simple-evals：OpenAI 开源评估 LLM 的轻量级库 | 三花 AI | 免费 AI 应用 | 1000+ AI 导航合集

OpenAI 开源这个库是为了公开透明地展示他们最新模型（从gpt-4-turbo-2024-04-09开始）发布的准确度数据。

评估方法对提示非常敏感，而且近期的出版物和库中使用的公式存在显著差异。

这个库特别强调零次学习（zero-shot）和思维链（chain-of-thought）设置，使用简单的指令，如“解决以下多项选择问题”，认为这种提示技术更能反映模型在实际使用中的性能。

目前，该仓库包含以下评估：

https://github.com/openai/simple-evals

商业转载请联系三花微信公众号获得授权，非商业转载请注明本文出处及文章链接，您可以自由地在任何媒体以任何形式复制和分发作品，也可以修改和创作，但是分发衍生作品时必须采用相同的许可协议。

太极芯片：清华大学设计的通用 AI 光子芯片

它基于一种集成的衍射-干涉混合设计，能够显著提升神经网络（ONN）的规模至百万神经元级别，同时保持160-TOPS/W（每秒万亿次运算每瓦特）的能效。

福布斯公布第 6 届 TOP 50 AI 公司

随着 ChatGPT 等应用的火爆，企业纷纷投入 AI 行业，福布斯发布的 AI 50榜单表彰了领先的私营AI公司。