wtorek, marca 14, 2023

Tagowanie MLem... ciąg dalszy ;-) nadal brak sukcesów ;p

[Update :-) - znalazłem błąd, zamiana postów do testów w wektor szwankowała ;-), teraz już każdy post ma inną klasyfikację. Nadal nie wiem czy dobrą, ale jest postęp ;-)]
No i brnę w moją zabawę z machine learningiem ;-)
Jako, że nie mam za wiele czasu to brnę tak w kawałkach ;-)

Dziś trenowałem modele, zajęło to trochę czasu, tak pewnie więcej niż 10 minut, mniej niż godzinę.

Python się tu przydaje, bo generuje nie tylko pliki z danymi dla Octave, ale też same "programy"...
Kiedyś próbowałem zbudować detektor clickbaitów i teraz idąc po linii najmniejszego oporu w moim pierwszym podejściu próbuję reużyć tak wiele z tego co kiedyś napisałem jak się da ;-)

Teraz próbuję tego używać, z tym że wtedy miałem 1 model do detekcji clickbaitów, a teraz mam 61 modele, każdy dla innego tagu.

Wyniki jednak jak na razie nie są zbyt zadawalające ;-)
Demon prędkości to to nie jest, i na razie wszystkie posty, które sprawdził mają takie same wyniki... co pewnie znaczy, że albo mam gdzieś głupi błąd w kodzie, albo na razie żaden z postów nie miał jakichś fajnych słów które polubił któryś z modeli ;-)

Wiem jednak na 100%, że mam nie do końca dobry kod do tokenizacji moich postów ;-), bo za dużo w nich HTMLa i innych dziwnych cosiów.

Ale się posuwam do przodu, choć czasem bokami ;-)





Podobne postybeta
Brnę w Apple ;-)
Tagowanie postów MLem - trzeba to przepisać ;p
Postęp... powolny postęp
Czemu deploymenty są takie trudne?
Clickbait detector ;-) - czyli próbujemy użyć naiwnego klasyfikatora Bayesowskiego do rozpoznawania clickbaitów ;-)

Brak komentarzy:

Prześlij komentarz