Pratik Bhavsar's picture

Pratik Bhavsar

pratikbhavsar

·

https://pakodas.substack.com

AI & ML interests

LLM agents, evaluation & reasoning

Recent Activity

liked a Space 3 days ago

OpenEvals/evaluation-guidebook

updated a Space 19 days ago

galileo-ai/agent-leaderboard

commented on their article 27 days ago

Agent Leaderboard: Evaluating AI Agents in Multi-Domain Scenarios

View all activity

Organizations

Articles 2

Article

Launching Agent Leaderboard v2: The Enterprise-Grade Benchmark for AI Agents

Article

27

Agent Leaderboard: Evaluating AI Agents in Multi-Domain Scenarios

View all Articles

Collections 1

models 0

None public yet

datasets 0

None public yet