01 · styl · v1 · przegląd ręczny

Co base Qwen robi źle po polsku.

Przeczytałem odpowiedzi base Qwen3.5-27B i zaznaczyłem błędy ręcznie, nie regexem. Nie chodzi tylko o szablon. Widać rażące błędy gramatyczne i ortograficzne („Hipoza", „Bezpośrednie sprzedaż", „samodzielną rozwiązywanie"), kalki z angielskiego, a nawet liczenie w dolarach przy polskim poleceniu. Po lewej base z zaznaczonymi błędami, po prawej fine-tuned v1. Uczciwie zaznaczam też potknięcia v1.

rażący błąd gramatyczny / ortograficznyszablon / markdown / kalka-otwarciakalka z angielskiegoplaceholderv1 poprawnie

wczytuję przykłady…

Wniosek: regex łapie tylko myślniki i słowo „feedback". Ręczny przegląd pokazuje więcej: błędy fleksyjne, literówki w nagłówkach, walutę liczoną w dolarach, kalkowaną składnię. To zwykłe błędy językowe (fleksja, ortografia, składnia) w modelu, który uchodzi za jeden z lepszych. Fine-tuning v1 usuwa szablon i większość kalek, choć sam też się czasem myli, co zaznaczam. Dane: results/style_demo.json, dobrane i opisane ręcznie. Base Qwen3.5-27B vs slayer-style ep3 (v1).