wtorek, kwietnia 17, 2007

Testowanie upolskawiacza

Przeprowadziłem sprawdzenie skuteczności upolskawiania ;-) tekstów przy pomocy opisanego w poprzednim wpisie narzędziem. Wyniki nie wyglądają aż tak różowo ;-)Jeśli patrzeć na słowa to z przykładowego tekstu, w którym występowało 166 słów z polskimi znakami, mój program stworzył tekst z 96 słowami z polskimi znakami. Z tych 96 słów 2 były błędnie spolszczone. Daje to więc skuteczność spolszczania na poziomie około 57%Za źródło tekstu uczącego posłużył mi ponownie "Ostatni rozdział, czyli paragraf 22 bis" Josepha Hellera, zaś jako tekst na którym przeprowadzałem testy wykorzystałem treść tego newsa z Wirtualnej Polski.Jeżeli uda mi się "wyszpanować" wyniki do powiedzmy 70% to pomyślę o praktycznym wykorzystaniu tego narzędzia w moim Gadaczu :-)


Podobne postybeta
Jak automatycznie zmienić słowo "laka" w "łąka"? :-)
DRM Google wcale nie został złamany
"Doskonalenie" upolskawiacza ;-)
Działa :-)
Prosty spell checker, czyli jak umiejętnie połączyć teorie z praktyką