AutoArena是一个开源工具,用于使用LLM评审者进行自动评估,以排名生成式AI系统。
通过在本地安装AutoArena,并输入用户提示来评估生成式AI系统。
比较不同的LLM或提示变体以获得最佳表现
在持续集成设置中评估生成式AI系统
全部({{commentRowsTotal}})