Question 1

What is policy-gradient/GRPO-Zero?

Accepted Answer

A minimal implementation of GRPO (Group Relative Policy Optimization) for training large language models with reinforcement learning.

Question 2

Is GRPO-Zero open source?

Accepted Answer

Yes — policy-gradient/GRPO-Zero is open source, released under the Apache-2.0 license.

Question 3

What language is GRPO-Zero written in?

Accepted Answer

policy-gradient/GRPO-Zero is primarily written in Python.

Question 4

How popular is GRPO-Zero?

Accepted Answer

policy-gradient/GRPO-Zero has 1.9k stars on GitHub.

Question 5

Where can I find GRPO-Zero?

Accepted Answer

policy-gradient/GRPO-Zero is on GitHub at https://github.com/policy-gradient/GRPO-Zero.

Frequently asked