Este trabajo analiza las evaluaciones sobre nociones de estadística, específicamente población y muestra, realizadas por tres futuros profesores de matemática y tres chatbots basados en modelos de Inteligencia Artificial (IA) generativa. Se comparan en términos de medios, técnicas e instrumentos evaluativos. Además, se explora la funcionalidad de los chatbots como asistentes para generar distintos tipos de evaluaciones. Los resultados evidencian diferencias significativas entre las evaluaciones, destacando la utilidad de los chatbots como herramientas valiosas, ya que permiten diseñar evaluaciones tanto tradicionales (por ejemplo, pruebas escritas) como no tradicionales (por ejemplo proyectos de investigación).