Pedro Henrique Luz de Araujo

peluz

https://peluz.github.io/

AI & ML interests

None yet

Recent Activity

updated a Space 14 days ago

peluz/qwen3-0.6b-cat-lingo-grpo

published a Space 15 days ago

peluz/qwen3-0.6b-cat-lingo-grpo

updated a model 15 days ago

peluz/qwen3-0.6b-cat-lingo-grpo

View all activity

Organizations

Papers 3

arxiv:2512.12775

arxiv:2508.19764

arxiv:2407.02099

spaces 2

Qwen3 0.6b Cat Lingo Grpo

👀

🐾 Qwen3-Cat — GRPO Cat-Lingo Demo

Qwen3 0.6b Cat Lingo Dpo

🐢

A Qwen3-0.6B model fine-tuned to be a cat

models 7

Pedro Henrique Luz de Araujo

AI & ML interests

Recent Activity

Organizations

Papers 3

spaces 2

Qwen3 0.6b Cat Lingo Grpo

Qwen3 0.6b Cat Lingo Dpo

models 7

peluz/qwen3-0.6b-cat-lingo-grpo

peluz/qwen3-0.6b-cat-lingo-dpo

peluz/q-Taxi-v4

peluz/q-Taxi-v3

peluz/q-FrozenLake-v1-4x4-noSlippery

peluz/ppo-Huggy

peluz/ppo-LunarLander-v2

datasets 1

peluz/lener_br

Pedro Henrique Luz de Araujo

AI & ML interests

Recent Activity

Organizations

Papers 3

spaces 2 Sort: Recently updated

Qwen3 0.6b Cat Lingo Grpo

Qwen3 0.6b Cat Lingo Dpo

models 7 Sort: Recently updated

datasets 1

spaces 2

models 7