Question 1

What is Joyce94/LLM-RLHF-Tuning?

Accepted Answer

A complete RLHF training framework implementing SFT, reward modeling, PPO, and DPO for fine-tuning language models with LoRA/PEFT.

Question 2

Is LLM-RLHF-Tuning open source?

Accepted Answer

Yes — Joyce94/LLM-RLHF-Tuning is an open-source project tracked on heatdrop.

Question 3

What language is LLM-RLHF-Tuning written in?

Accepted Answer

Joyce94/LLM-RLHF-Tuning is primarily written in Python.

Question 4

How popular is LLM-RLHF-Tuning?

Accepted Answer

Joyce94/LLM-RLHF-Tuning has 451 stars on GitHub.

Question 5

Where can I find LLM-RLHF-Tuning?

Accepted Answer

Joyce94/LLM-RLHF-Tuning is on GitHub at https://github.com/Joyce94/LLM-RLHF-Tuning.

Frequently asked