Przeczytałem odpowiedzi base Qwen3.5-27B i zaznaczyłem błędy ręcznie, nie regexem. Nie chodzi tylko o szablon. Widać rażące błędy gramatyczne i ortograficzne („Hipoza", „Bezpośrednie sprzedaż", „samodzielną rozwiązywanie"), kalki z angielskiego, a nawet liczenie w dolarach przy polskim poleceniu. Po lewej base z zaznaczonymi błędami, po prawej fine-tuned v1. Uczciwie zaznaczam też potknięcia v1.
wczytuję przykłady…
results/style_demo.json, dobrane i opisane ręcznie. Base Qwen3.5-27B vs slayer-style ep3 (v1).